Toolverse
Wszystkie skille

audio-transcriber

autor: sickn33

Zamień nagrania audio na profesjonalną dokumentację z automatycznymi streszczeniami

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor
sickn33
Kategoria
Data Science

O skillu

Skill automatyzuje transkrypcję audio do tekstu i generuje profesjonalne notatki ze spotkań w formacie Markdown. Wykorzystuje Faster-Whisper lub OpenAI Whisper bez konfiguracji — działa uniwersalnie na wszystkich projektach. Ekstrahuje metadane (mówcy, znaczniki czasu, język, czas trwania), tworzy strukturyzowane notatki spotkań i streszczenia wykonawcze. Obsługuje popularne formaty: MP3, WAV, M4A, OGG, FLAC, WEBM. Idealny do transkrypcji spotkań, wywiadów, wykładów i analizy treści audio.

Jak używać

  1. Upewnij się, że masz zainstalowany Python 3 oraz jeden z silników transkrypcji: Faster-Whisper (szybszy, rekomendowany) lub OpenAI Whisper. Skill automatycznie wykryje dostępne narzędzie bez konieczności ręcznej konfiguracji.

  2. Przygotuj plik audio w jednym z obsługiwanych formatów: MP3, WAV, M4A, OGG, FLAC lub WEBM. Upewnij się, że plik jest dostępny w systemie.

  3. Wyzwól skill, gdy potrzebujesz transkrypcji audio — na przykład gdy chcesz "transkrybować ten plik audio", "zamienić nagranie na tekst" lub "wygenerować notatki ze spotkania z tego nagrania".

  4. Skill automatycznie przetworzy plik i wyodrębni bogatą metadane: identyfikację mówców (diaryzacja), znaczniki czasu, język, rozmiar pliku i czas trwania.

  5. Otrzymasz profesjonalną dokumentację w formacie Markdown zawierającą transkrypcję, strukturyzowane notatki ze spotkania oraz streszczenie wykonawcze całej zawartości audio.

  6. Opcjonalnie możesz poprosić o wygenerowanie napisów w formatach SRT lub VTT do użytku w materiałach wideo.

Podobne skille