parakeet-mlx
Transkrypcja mowy na tekst bezpośrednio na Macu – bez kluczy API, bez chmury.
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Parakeet MLX to narzędzie do zamiany plików audio na tekst, działające lokalnie na procesorach Apple Silicon. Nie potrzebujesz żadnych kluczy API ani połączenia z chmurą – wszystko dzieje się na Twoim komputerze. Obsługuje popularne formaty audio (MP3, M4A) i generuje transkrypcje w różnych formatach: zwykły tekst, napisy (SRT, VTT), JSON lub wszystkie naraz. Idealny dla tych, którzy cenią prywatność i chcą szybko przetwarzać audio bez opóźnień sieciowych.
Jak używać
Zainstaluj narzędzie Parakeet MLX za pomocą polecenia
uv tool install parakeet-mlx -U. Upewnij się, że masz zainstalowany ffmpeg, który jest wymagany do przetwarzania plików audio.Przygotuj plik audio (MP3, M4A lub inny obsługiwany format) na swoim komputerze. Przy pierwszym uruchomieniu narzędzie automatycznie pobierze model z Hugging Face i zapisze go w katalogu
~/.cache/huggingface.Uruchom transkrypcję za pomocą polecenia
parakeet-mlx /ścieżka/do/pliku.mp3 --output-format txt, zastępując ścieżkę rzeczywistą lokalizacją Twojego pliku audio. Wybierz format wyjściowy: txt (zwykły tekst), srt lub vtt (napisy), json (dane strukturalne) albo all (wszystkie formaty naraz).Jeśli chcesz przetwarzać wiele plików jednocześnie, użyj symboli wieloznacznych, na przykład
parakeet-mlx *.mp3 --output-format txt. Narzędzie przetworzy wszystkie pasujące pliki w jednym poleceniu.Aby uzyskać więcej informacji o dostępnych opcjach, wpisz
parakeet-mlx --help. Możesz na przykład dodać flagę--highlight-wordsdo wyróżnienia poszczególnych słów w napisach lub--verbosedo wyświetlenia szczegółowych informacji o postępie i pewności transkrypcji.