audio-transcriber
Zamień nagrania audio na profesjonalną dokumentację z automatycznymi streszczeniami
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Skill automatyzuje transkrypcję audio do tekstu i generuje profesjonalne notatki ze spotkań w formacie Markdown. Wykorzystuje Faster-Whisper lub OpenAI Whisper bez konfiguracji — działa uniwersalnie na wszystkich projektach. Ekstrahuje metadane (mówcy, znaczniki czasu, język, czas trwania), tworzy strukturyzowane notatki spotkań i streszczenia wykonawcze. Obsługuje popularne formaty: MP3, WAV, M4A, OGG, FLAC, WEBM. Idealny do transkrypcji spotkań, wywiadów, wykładów i analizy treści audio.
Jak używać
Upewnij się, że masz zainstalowany Python 3 oraz jeden z silników transkrypcji: Faster-Whisper (szybszy, rekomendowany) lub OpenAI Whisper. Skill automatycznie wykryje dostępne narzędzie bez konieczności ręcznej konfiguracji.
Przygotuj plik audio w jednym z obsługiwanych formatów: MP3, WAV, M4A, OGG, FLAC lub WEBM. Upewnij się, że plik jest dostępny w systemie.
Wyzwól skill, gdy potrzebujesz transkrypcji audio — na przykład gdy chcesz "transkrybować ten plik audio", "zamienić nagranie na tekst" lub "wygenerować notatki ze spotkania z tego nagrania".
Skill automatycznie przetworzy plik i wyodrębni bogatą metadane: identyfikację mówców (diaryzacja), znaczniki czasu, język, rozmiar pliku i czas trwania.
Otrzymasz profesjonalną dokumentację w formacie Markdown zawierającą transkrypcję, strukturyzowane notatki ze spotkania oraz streszczenie wykonawcze całej zawartości audio.
Opcjonalnie możesz poprosić o wygenerowanie napisów w formatach SRT lub VTT do użytku w materiałach wideo.