elevenlabs-ai

Name: elevenlabs-ai
Author: openclaw

autor: openclaw

Integruj syntezę mowy i rozpoznawanie głosu bezpośrednio przez API ElevenLabs

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: openclaw
Kategoria: Bezpieczeństwo
Wyświetlenia: 26

Repozytorium GitHub

O skillu

Umiejętność OpenClaw do pracy z API ElevenLabs bez konieczności SDK. Obsługuje konwersję tekstu na mowę, mowę na mowę, rozpoznawanie mowy w czasie rzeczywistym oraz dialogi wielogłosowe. Skierowana do deweloperów, którzy preferują bezpośrednie wywołania HTTP i chcą kontrolować każdy aspekt przepływu audio — od wyboru głosu, przez kodek, aż po bezpieczeństwo danych. Zawiera wytyczne dotyczące uwierzytelniania, przechowywania tokenów i ochrony prywatności.

Jak używać

Przygotuj klucz API ElevenLabs (xi-api-key) lub wygeneruj token jednorazowy dla dostępu po stronie klienta. Nigdy nie loguj kluczy ani tokenów w logach aplikacji.
Zapoznaj się z dokumentacją referencyjną umiejętności: przeczytaj pliki dotyczące uwierzytelniania, wyboru głosów i modeli, a także zasad bezpieczeństwa i prywatności. Zidentyfikuj, które API potrzebujesz — czy będzie to synteza tekstu na mowę, konwersja głosu, czy rozpoznawanie mowy w czasie rzeczywistym.
Zbierz wymagane parametry: identyfikatory głosów (voice IDs), identyfikatory modeli (model IDs) oraz preferowany format wyjścia audio (kodek, częstotliwość próbkowania, przepustowość). Przechowuj te dane po stronie serwera, aby uniknąć powtarzalnych zapytań.
Przygotuj ładunek HTTP dla wybranego endpointu — na przykład dla tekstu na mowę przekaż tekst, ID głosu i parametry audio. Wysyłaj żądania bezpośrednio przez HTTPS bez pośrednika SDK.
Obsługuj odpowiedzi i błędy: przechowuj wyjście audio zgodnie z wybranym formatem, implementuj ponowne próby z wycofywaniem się w przypadku ograniczenia przepustowości, i utrzymuj białą listę dozwolonych miejsc docelowych dla wyjścia audio.
Dla zaawansowanych scenariuszy (dialogi wielogłosowe lub rozpoznawanie w czasie rzeczywistym) użyj odpowiednich endpointów — WebSocket dla STT w czasie rzeczywistym lub endpoint dialogu dla sekwencji wielogłosowych. Zawsze przestrzegaj zasad zerowego przechowywania danych i bezpieczeństwa określonych w dokumentacji.

Podobne skille

openapi-spec-generation

autor: wshobson

Generuj specyfikacje OpenAPI 3.1 z kodu i projektów API — dokumentacja zawsze zsynchronizowana

Bezpieczeństwo

18109

security-compliance

autor: davila7

Bezpieczeństwo i zgodność od podstaw — architektura obrony warstwowej, compliance i zarządzanie incydentami

Bezpieczeństwo

1172

manim

autor: davila7

Twórz animacje matematyczne w Pythonie – framework do edukacyjnych filmów z równaniami i wykresami

Bezpieczeństwo

1588

typescript-review

autor: metabase

Automatyczna kontrola kodu TypeScript i JavaScript zgodnie ze standardami projektu

Bezpieczeństwo

17133

feishu-docs

autor: openclaw

Zarządzaj dokumentami Feishu przez API — twórz, edytuj, usuwaj i udostępniaj zawartość programowo.

Bezpieczeństwo

1574

payload

autor: payloadcms

Asystent Claude do projektów Payload CMS — debugowanie, konfiguracja i optymalizacja API

Bezpieczeństwo

50171