whatsapp-voice-talk
Przetwarzaj wiadomości głosowe WhatsApp w czasie rzeczywistym — transkrypcja, rozpoznawanie intencji i odpowiedzi.
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Skill do obsługi wiadomości głosowych na WhatsAppie. Automatycznie transkrybuje notatki głosowe za pomocą Whisper, rozpoznaje intencję użytkownika, wykonuje odpowiednie akcje i wysyła odpowiedź. Obsługuje angielski i hindi, automatyczne wykrywanie języka, oraz konwersję odpowiedzi na mowę (TTS). Idealny do budowania asystentów głosowych, interfejsów bez użycia rąk, chatbotów wielojęzycznych i sterowania IoT.
Jak używać
Zainstaluj wymagane zależności: pip install openai-whisper soundfile numpy — to przygotuje środowisko do transkrypcji i przetwarzania plików audio.
Przygotuj plik wiadomości głosowej w formacie OGG, WAV lub MP3 i zapisz go w projekcie.
Załaduj moduł processVoiceNote z pliku scripts/voice-processor.js i wczytaj plik audio jako bufor danych.
Uruchom funkcję processVoiceNote(buffer) — zwróci ona wynik zawierający transkrypcję, rozpoznaną intencję (np. weather, status, commands), wykryty język i wygenerowaną odpowiedź.
Aby automatycznie przetwarzać przychodzące wiadomości WhatsApp, uruchom demon nasłuchujący: node scripts/voice-listener-daemon.js — będzie on monitorować folder ~/.clawdbot/media/inbound/ co 5 sekund i automatycznie przetwarzać nowe pliki głosowe.
Skill automatycznie transkrybuje głos, rozpozna intencję, wykonuje odpowiedni handler i wysyła odpowiedź z powrotem na WhatsApp.
Podobne skille
liquid-glass-developer
autor: anyproto
analyzing-financial-statements
autor: anthropics
vercel-react-native-skills
autor: vercel-labs
automating-mobile-app-testing
autor: jeremylongshore
sequential-thinking
autor: mrgoonie
mobile-ios-design
autor: wshobson