Toolverse
Wszystkie skille

openai-tts

autor: benchflow-ai

Zamień tekst na naturalnie brzmiącą mowę za pomocą API OpenAI

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Data Science
Wyświetlenia
2

O skillu

Skill do generowania wysokiej jakości audio z tekstu przy użyciu technologii OpenAI Text-to-Speech. Wybieraj spośród 12 predefiniowanych głosów anglojęzycznych, dostosowuj ton wypowiedzi (w modelu gpt-4o-mini-tts) i przetwarzaj zarówno krótkie fragmenty, jak i długie dokumenty. Idealne do tworzenia audiobooków, narracji wideo czy materiałów dostępnościowych. Obsługuje trzy modele o różnym balansie jakości i szybkości przetwarzania.

Jak używać

  1. Upewnij się, że masz dostęp do zmiennej środowiskowej OPENAI_API_KEY zawierającej Twój klucz API OpenAI. 2. Wybierz model: gpt-4o-mini-tts (najnowszy, obsługuje instrukcje tonalne), tts-1 (szybki, niższa jakość) lub tts-1-hd (wysoka jakość, wolniejszy). 3. Zdecyduj się na głos — dla najlepszej jakości wybierz marin lub cedar, lub inny spośród dostępnych opcji (alloy, ash, ballad, coral, echo, fable, nova, onyx, sage, shimmer, verse). 4. Dla krótkich tekstów użyj bezpośrednio API, podając model, głos i tekst do przetworzenia — wynik zostanie zapisany jako plik MP3. 5. Jeśli chcesz dodać instrukcje tonalne (np. "Mów wesoło i pozytywnie"), użyj modelu gpt-4o-mini-tts z parametrem instructions. 6. Dla długich dokumentów podziel tekst na fragmenty o maksymalnie 4000 znakach, przetwórz każdy oddzielnie, a następnie połącz wygenerowane pliki audio w jeden plik.

Podobne skille