Toolverse
Wszystkie skille

add-voice-transcription

autor: gavrielc

Automatyczna transkrypcja wiadomości głosowych z WhatsApp za pomocą Whisper API

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Data Science
Wyświetlenia
1

O skillu

Rozszerzenie do NanoClaw, które włącza automatyczną transkrypcję wiadomości głosowych na kanale WhatsApp. Kiedy użytkownik wyśle notatkę głosową, system pobiera plik audio, transkrybuje go za pomocą OpenAI Whisper i dostarcza tekst agentowi w formacie [Voice: transkrypcja]. Wymaga klucza API OpenAI i wcześniej zainstalowanego modułu WhatsApp.

Jak używać

  1. Sprawdź, czy plik src/transcription.ts już istnieje w projekcie. Jeśli tak, przejdź do kroku 5. Jeśli nie, kontynuuj instalację.

  2. Upewnij się, że masz klucz API OpenAI dla usługi Whisper. Jeśli go nie masz, przejdź na https://platform.openai.com/api-keys i utwórz nowy klucz. Przechowaj go bezpiecznie — będzie potrzebny w dalszych krokach.

  3. Dodaj zdalne repozytorium WhatsApp do projektu, jeśli jeszcze go nie masz: git remote add whatsapp https://github.com/qwibitai/nanoclaw-whatsapp.git. Następnie pobierz gałąź z umiejętnością transkrypcji: git fetch whatsapp skill/voice-transcription i scal ją: git merge whatsapp/skill/voice-transcription. Jeśli pojawią się konflikty w pliku package-lock.json, zaakceptuj wersję ze scalenia: git checkout --theirs package-lock.json && git add package-lock.json && git merge --continue.

  4. Zainstaluj zależności i zbuduj projekt: npm install --legacy-peer-deps oraz npm run build. Uruchom testy, aby upewnić się, że wszystko działa: npx vitest.

  5. Dodaj swój klucz API OpenAI do pliku .env: OPENAI_API_KEY=twoj_klucz_tutaj. Od tego momentu wiadomości głosowe przesyłane przez WhatsApp będą automatycznie transkrybowane i dostarczone agentowi jako tekst.

Podobne skille