transcribee
Automatycznie transkrybujesz filmy YouTube i pliki audio z identyfikacją mówców
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Transcribee to narzędzie do transkrypcji filmów z YouTube oraz lokalnych plików audio i wideo. Automatycznie identyfikuje różnych mówców i generuje czytelne transkrypty z etykietami mówiących osób. Wynik zapisywany jest w kilku formatach — tekst z mówcami, surowy tekst, JSON z czasowaniem wyrazów oraz metadane wideo. Idealne do analizy zawartości przez modele AI, przetwarzania podcastów i archiwizacji materiałów wideo.
Jak używać
Zainstaluj wymagane zależności: yt-dlp i ffmpeg. Na macOS uruchom w terminalu: brew install yt-dlp ffmpeg. Te narzędzia umożliwiają pobieranie filmów z YouTube i konwersję formatów mediów.
Przygotuj źródło do transkrypcji. Możesz użyć linku do filmu YouTube (np. https://www.youtube.com/watch?v=...), ścieżki do lokalnego pliku wideo (mp4, mkv, webm, mov, avi) lub pliku audio (mp3, m4a, wav, ogg, flac).
Uruchom transkrypcję poleceniem transcribee. Dla linku YouTube: transcribee "https://www.youtube.com/watch?v=...". Dla pliku lokalnego: transcribee ~/ścieżka/do/pliku.mp4 lub transcribee ~/ścieżka/do/pliku.mp3. Pamiętaj, aby ująć adresy URL w cudzysłów, jeśli zawierają znaki specjalne.
Czekaj na zakończenie przetwarzania. Narzędzie pobierze plik (jeśli to YouTube), przekonwertuje go w razie potrzeby i przepuści przez system transkrypcji z identyfikacją mówców.
Znajdź wyniki w folderze ~/Documents/transcripts/. Transkrypty zapisywane są w strukturze {kategoria}/{tytuł}-{data}/. Otrzymasz cztery pliki: transcription.txt (transkrypt z etykietami mówców), transcription-raw.txt (czysty tekst bez mówców), transcription-raw.json (wyrazy z czasowaniem) i metadata.json (informacje o wideo, języku i kategorii).
Jeśli napotkasz błędy, sprawdź czy yt-dlp i ffmpeg są zainstalowane (polecenia: which yt-dlp, which ffmpeg). Jeśli pojawią się błędy API, zweryfikuj plik .env w katalogu transcribee.