add-voice-transcription

Name: add-voice-transcription
Author: gavrielc

autor: gavrielc

Automatyczna transkrypcja wiadomości głosowych z WhatsApp za pomocą Whisper API

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: gavrielc
Kategoria: Data Science
Wyświetlenia: 1

Repozytorium GitHub

O skillu

Rozszerzenie do NanoClaw, które włącza automatyczną transkrypcję wiadomości głosowych na kanale WhatsApp. Kiedy użytkownik wyśle notatkę głosową, system pobiera plik audio, transkrybuje go za pomocą OpenAI Whisper i dostarcza tekst agentowi w formacie [Voice: transkrypcja]. Wymaga klucza API OpenAI i wcześniej zainstalowanego modułu WhatsApp.

Jak używać

Sprawdź, czy plik src/transcription.ts już istnieje w projekcie. Jeśli tak, przejdź do kroku 5. Jeśli nie, kontynuuj instalację.
Upewnij się, że masz klucz API OpenAI dla usługi Whisper. Jeśli go nie masz, przejdź na https://platform.openai.com/api-keys i utwórz nowy klucz. Przechowaj go bezpiecznie — będzie potrzebny w dalszych krokach.
Dodaj zdalne repozytorium WhatsApp do projektu, jeśli jeszcze go nie masz: git remote add whatsapp https://github.com/qwibitai/nanoclaw-whatsapp.git. Następnie pobierz gałąź z umiejętnością transkrypcji: git fetch whatsapp skill/voice-transcription i scal ją: git merge whatsapp/skill/voice-transcription. Jeśli pojawią się konflikty w pliku package-lock.json, zaakceptuj wersję ze scalenia: git checkout --theirs package-lock.json && git add package-lock.json && git merge --continue.
Zainstaluj zależności i zbuduj projekt: npm install --legacy-peer-deps oraz npm run build. Uruchom testy, aby upewnić się, że wszystko działa: npx vitest.
Dodaj swój klucz API OpenAI do pliku .env: OPENAI_API_KEY=twoj_klucz_tutaj. Od tego momentu wiadomości głosowe przesyłane przez WhatsApp będą automatycznie transkrybowane i dostarczone agentowi jako tekst.

Podobne skille

quant-analyst

autor: zenobi-us

Zaawansowana analiza ilościowa dla modeli finansowych, handlu algorytmicznego i zarządzania ryzykiem

Data Science

67217

xlsx

autor: anthropics

Twórz, edytuj i analizuj arkusze kalkulacyjne z formułami i wykresami

Data Science

40128

arxiv-search

autor: langchain-ai

Przeszukuj arXiv i znajdź najnowsze prace badawcze z fizyki, matematyki i informatyki

Data Science

76172

pdf-processing

autor: Ming-Kai-LC

Przetwarzaj duże pliki PDF bez limitów Claude'a – dzielenie, ekstrakcja tekstu i OCR

Data Science

23134

skill-creator

autor: anthropics

Twórz umiejętności dla Claude'a – rozszerz jego możliwości o specjalistyczną wiedzę i przepływy pracy

Data Science

59147

pdf

autor: anthropics

Przetwarzaj, wyodrębniaj i generuj pliki PDF programowo – od formularzy po scalanie dokumentów

Data Science

31144