whisper-transcription

Name: whisper-transcription
Author: benchflow-ai

autor: benchflow-ai

Transkrypcja audio i wideo na tekst z dokładnym czasem każdego słowa

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: benchflow-ai
Kategoria: Data Science
Wyświetlenia: 5

Repozytorium GitHub

O skillu

Whisper to narzędzie do zamiany mowy na tekst z precyzyjnymi znacznikami czasowymi dla każdego słowa. Wykorzystuje model OpenAI Whisper, który obsługuje różne języki i oferuje wybór między szybkością a dokładnością. Możesz wybrać model tiny (39 MB, najszybszy), base (74 MB) lub small (244 MB, najdokładniejszy). Narzędzie idealnie sprawdza się do transkrypcji nagrań z podcastów, wywiadów czy spotkań, gdzie potrzebujesz nie tylko tekstu, ale także informacji o tym, kiedy każde słowo zostało wypowiedziane.

Jak używać

Zainstaluj bibliotekę Whisper za pomocą polecenia pip install openai-whisper w swoim środowisku Python.
Przygotuj plik audio lub wideo, który chcesz transkrybować — Whisper obsługuje popularne formaty takie jak MP3, WAV, MP4 i inne.
Załaduj wybrany model Whisper (zalecane jest rozpoczęcie od modelu tiny ze względu na szybkość — doskonale radzi sobie z czystym dźwiękiem).
Uruchom transkrypcję z włączoną opcją word_timestamps=True, aby uzyskać dokładne czasy dla każdego słowa — możesz również określić język nagrania dla lepszej dokładności.
Wyodrębnij słowa z ich znacznikami czasowymi z wyniku transkrypcji — każde słowo będzie zawierać tekst oraz czasy rozpoczęcia i zakończenia.
Zapisz wynik w formacie JSON lub innym wybranym formacie — możesz teraz używać tych danych do dalszej analizy, edycji lub integracji z innymi narzędziami.

Podobne skille

deep-research

autor: davidorex

Automatyczne badanie złożonych problemów w VCV Rack — od szybkiej analizy do głębokich poszukiwań

Data Science

16151

prompt-optimizer

autor: solatis

Doskonał prompty dla agentów Claude – wzorce oparte na badaniach naukowych

Data Science

15109

excalidraw

autor: ryanquinn3

Deleguj przetwarzanie diagramów Excalidraw agentom, aby zaoszczędzić kontekst

Data Science

124204

stock-analyzer

autor: FrancyJGLisboa

Analiza techniczna akcji i ETF-ów w naturalnym języku – sygnały kupna i sprzedaży na podstawie RSI, MACD i Bollinger Bands.

Data Science

23128

data-storytelling

autor: wshobson

Zamień dane w przekonujące opowieści dla decydentów i inwestorów

Data Science

26105

market-research-reports

autor: davila7

Raporty badań rynku na poziomie firm konsultingowych w kilka minut

Data Science

16115