V
video-processor
Konwertuj wideo, wyodrębniaj audio i transkrybuj zawartość za pomocą sztucznej inteligencji
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Skill do przetwarzania plików wideo z możliwością wyodrębniania ścieżki audio, konwersji formatów (MP4, WebM) i automatycznej transkrypcji za pomocą modelu Whisper. Narzędzie wykorzystuje FFmpeg do manipulacji multimediami i OpenAI Whisper do zamiany mowy na tekst. Idealne, gdy potrzebujesz szybko zmienić format wideo, wyciągnąć dźwięk lub uzyskać transkrypt rozmowy z nagrania.
Jak używać
- Zainstaluj wymagane narzędzia systemowe. Na macOS uruchom
brew install ffmpeg. Na Ubuntu lub Debian użyjapt-get install ffmpeg. Sprawdź poprawność instalacji poleceniemffmpeg -version. - Zainstaluj model Whisper do transkrypcji. Uruchom
pip install -U openai-whisperi zweryfikuj instalację poleceniemwhisper --help. - Aby wyodrębnić audio z pliku wideo, użyj komendy
uv run .claude/skills/video-processor/scripts/video_processor.py extract-audio input.mp4 output.wav. Możesz zmienić format wyjściowy (domyślnie wav) na mp3, aac lub flac za pomocą opcji--format. - Do konwersji wideo do formatu MP4 uruchom
uv run .claude/skills/video-processor/scripts/video_processor.py to-mp4 input.avi output.mp4. Opcjonalnie dostosuj kodek wideo (domyślnie libx264) lub preset jakości (domyślnie medium) parametrami--codeci--preset. - Aby przekonwertować wideo do formatu WebM, użyj komendy
uv run .claude/skills/video-processor/scripts/video_processor.py to-webm input.mp4 output.webmz tymi samymi opcjami dostrajania kodeka i presetu. - Po wyodrębnieniu audio możesz transkrybować zawartość poleceniem
whisper output.wav, które wygeneruje plik tekstowy z transkryptem.