walkie-talkie
Rozmawiaj głosem na WhatsAppie — automatyczna transkrypcja i odpowiedzi audio
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umożliwia rozmowy głosowe na WhatsAppie bez pisania. Skill automatycznie transkrybuje przychodzące wiadomości audio, przetwarza je jako zwykłe polecenia, a następnie wysyła odpowiedź w postaci notatki głosowej. Używa lokalnych narzędzi (whisper-cpp, sherpa-onnx-tts) do szybkiego przetwarzania bez opóźnień. Idealny, gdy chcesz komunikować się wyłącznie głosem zamiast pisać.
Jak używać
Zainstaluj skill walkie-talkie w swoim środowisku agenta. Upewnij się, że masz dostęp do lokalnych narzędzi: ffmpeg, whisper-cpp oraz sherpa-onnx-tts.
Aktywuj tryb walkie-talkie, wysyłając na WhatsAppie wiadomość tekstową "activa modo walkie-talkie" lub "hablemos por voz". Skill będzie teraz nasłuchiwać przychodzących wiadomości audio.
Wyślij wiadomość audio (plik audio/ogg/opus) na WhatsAppie. Skill automatycznie transkrybuje Twoją wiadomość za pomocą narzędzia tools/transcribe_voice.sh.
Skill przetwarza transkrybowaną wiadomość jako zwykłe polecenie użytkownika i generuje odpowiedź tekstową.
Zamiast wysłać odpowiedź jako tekst, skill konwertuje ją na mowę za pomocą bin/sherpa-onnx-tts i wysyła wynikowy plik .ogg jako notatkę głosową na WhatsAppie.
Otrzymasz zarówno wersję tekstową (dla jasności) jak i audio odpowiedzi. Możesz kontynuować rozmowę, wysyłając kolejne wiadomości audio.