add-voice-transcription
Automatyczna transkrypcja wiadomości głosowych z WhatsApp za pomocą Whisper API
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Rozszerzenie do NanoClaw, które włącza automatyczną transkrypcję wiadomości głosowych na kanale WhatsApp. Kiedy użytkownik wyśle notatkę głosową, system pobiera plik audio, transkrybuje go za pomocą OpenAI Whisper i dostarcza tekst agentowi w formacie [Voice: transkrypcja]. Wymaga klucza API OpenAI i wcześniej zainstalowanego modułu WhatsApp.
Jak używać
Sprawdź, czy plik
src/transcription.tsjuż istnieje w projekcie. Jeśli tak, przejdź do kroku 5. Jeśli nie, kontynuuj instalację.Upewnij się, że masz klucz API OpenAI dla usługi Whisper. Jeśli go nie masz, przejdź na https://platform.openai.com/api-keys i utwórz nowy klucz. Przechowaj go bezpiecznie — będzie potrzebny w dalszych krokach.
Dodaj zdalne repozytorium WhatsApp do projektu, jeśli jeszcze go nie masz:
git remote add whatsapp https://github.com/qwibitai/nanoclaw-whatsapp.git. Następnie pobierz gałąź z umiejętnością transkrypcji:git fetch whatsapp skill/voice-transcriptioni scal ją:git merge whatsapp/skill/voice-transcription. Jeśli pojawią się konflikty w plikupackage-lock.json, zaakceptuj wersję ze scalenia:git checkout --theirs package-lock.json && git add package-lock.json && git merge --continue.Zainstaluj zależności i zbuduj projekt:
npm install --legacy-peer-depsoraznpm run build. Uruchom testy, aby upewnić się, że wszystko działa:npx vitest.Dodaj swój klucz API OpenAI do pliku
.env:OPENAI_API_KEY=twoj_klucz_tutaj. Od tego momentu wiadomości głosowe przesyłane przez WhatsApp będą automatycznie transkrybowane i dostarczone agentowi jako tekst.