parakeet-stt

Name: parakeet-stt
Author: openclaw

autor: openclaw

Transkrypcja mowy na tekst lokalnie — 30x szybciej niż Whisper, bez chmury

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: openclaw
Kategoria: DevOps
Wyświetlenia: 8

Repozytorium GitHub

O skillu

Zamień nagrania audio na tekst bezpośrednio na swoim komputerze. Parakeet to lekki model NVIDIA (0.6B v3) działający na CPU bez GPU — nie potrzebujesz internetu ani subskrypcji. Obsługuje 25 języków z automatycznym rozpoznawaniem, zwraca tekst, znaczniki czasowe lub napisy SRT. API kompatybilne z OpenAI, więc łatwo zintegrujesz z istniejącym kodem.

Jak używać

Zainstaluj narzędzie: sklonuj repozytorium git clone https://github.com/groxaxo/parakeet-tdt-0.6b-v3-fastapi-openai.git, przejdź do katalogu i uruchom docker compose up -d parakeet-cpu. Alternatywnie zainstaluj zależności (pip install -r requirements.txt) i uruchom serwer: uvicorn app.main:app --host 0.0.0.0 --port 5000.
Sprawdź, że serwer słucha na porcie 5000 (lub ustaw zmienną PARAKEET_URL na inny adres, np. http://localhost:5092).
Przygotuj plik audio (MP3, WAV lub inny obsługiwany format) i wyślij go do API. Użyj curl: curl -X POST http://localhost:5000/v1/audio/transcriptions -F "file=@/path/to/audio.mp3" -F "response_format=text" — otrzymasz czysty tekst transkrypcji.
Jeśli potrzebujesz znaczników czasowych, zmień response_format na verbose_json. Dla napisów SRT użyj response_format=srt.
W Pythonie użyj biblioteki OpenAI: zaimportuj OpenAI, utwórz klienta z base_url wskazującym na Twój serwer Parakeet i wywołaj client.audio.transcriptions.create() z plikiem audio — model automatycznie rozpozna język i zwróci transkrypcję.

Podobne skille

proxmox-full

autor: openclaw

Zarządzaj maszynami wirtualnymi i kontenerami Proxmox VE bezpośrednio z poziomu agenta AI

DevOps

1449

game-art

autor: davila7

Przewodnik po stylach graficznych, pipelinach assetów i animacjach do gier

DevOps

1268

lambda

autor: itsmostafa

Zarządzaj funkcjami AWS Lambda bez serwera – twórz, debuguj i optymalizuj kod event-driven.

DevOps

127

resolve-conflicts

autor: antinomyhq

Rozwiąż konflikty merge'a w Git za pomocą strukturalnego planu zamiast ręcznego wyboru.

DevOps

48163

macos-cleaner

autor: daymade

Analizuj i odbierz miejsce na dysku macOS dzięki inteligentnym rekomendacjom czyszczenia

DevOps

1331

miniprogram-development

autor: TencentCloudBase

Rozwijaj aplikacje WeChat Mini Program z integracją CloudBase i wdrażaniem bez logowania

DevOps

1955