E
elevenlabs-voices
Synteza mowy w 18 głosach i 32 językach z efektami dźwiękowymi i przetwarzaniem wsadowym
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umożliwia generowanie wysokiej jakości mowy z 18 dostępnymi personami głosowymi i obsługą 32 języków. Skrypt integruje się z API ElevenLabs i oferuje tryb strumieniowania, efekty dźwiękowe generowane ze słów, przetwarzanie wsadowe wielu tekstów jednocześnie oraz śledzenie kosztów użycia. Możesz projektować niestandardowe głosy na podstawie opisów, definiować reguły wymowy dla poszczególnych słów i ustawiać limity budżetowe. Konfiguracja odbywa się poprzez interaktywnego asystenta, a klucz API przechowywany jest lokalnie na Twojej maszynie.
Jak używać
- Zainstaluj wymagane zależności: upewnij się, że masz zainstalowany Python 3 na swoim systemie. 2. Ustaw zmienną środowiskową ELEVEN_API_KEY ze swoim kluczem API ElevenLabs — możesz także użyć aliasu ELEVENLABS_API_KEY. 3. Uruchom asystenta konfiguracji za pierwszym razem, wykonując polecenie python3 scripts/setup.py — przeprowadzi Cię przez wybór domyślnego głosu, języka, jakości audio oraz opcjonalnie włączenie śledzenia kosztów i ustawienie limitu wydatków. 4. Twoja konfiguracja zostanie zapisana w pliku config.json, który pozostaje na Twojej maszynie i jest automatycznie wykluczony z kontroli wersji. 5. Po konfiguracji możesz generować mowę, wybierając spośród 18 dostępnych głosów, korzystać z trybu strumieniowania do wyjścia w czasie rzeczywistym, przetwarzać wiele tekstów jednocześnie za pomocą przetwarzania wsadowego lub generować efekty dźwiękowe z opisów tekstowych. 6. W dowolnym momencie uruchom asystenta ponownie, aby zmienić ustawienia lub dostosować parametry syntezy.