Toolverse
Wszystkie skille

video-processor

autor: basher83

Konwertuj wideo, wyodrębniaj audio i transkrybuj zawartość za pomocą sztucznej inteligencji

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Data Science
Wyświetlenia
112

O skillu

Skill do przetwarzania plików wideo z możliwością wyodrębniania ścieżki audio, konwersji formatów (MP4, WebM) i automatycznej transkrypcji za pomocą modelu Whisper. Narzędzie wykorzystuje FFmpeg do manipulacji multimediami i OpenAI Whisper do zamiany mowy na tekst. Idealne, gdy potrzebujesz szybko zmienić format wideo, wyciągnąć dźwięk lub uzyskać transkrypt rozmowy z nagrania.

Jak używać

  1. Zainstaluj wymagane narzędzia systemowe. Na macOS uruchom brew install ffmpeg. Na Ubuntu lub Debian użyj apt-get install ffmpeg. Sprawdź poprawność instalacji poleceniem ffmpeg -version.
  2. Zainstaluj model Whisper do transkrypcji. Uruchom pip install -U openai-whisper i zweryfikuj instalację poleceniem whisper --help.
  3. Aby wyodrębnić audio z pliku wideo, użyj komendy uv run .claude/skills/video-processor/scripts/video_processor.py extract-audio input.mp4 output.wav. Możesz zmienić format wyjściowy (domyślnie wav) na mp3, aac lub flac za pomocą opcji --format.
  4. Do konwersji wideo do formatu MP4 uruchom uv run .claude/skills/video-processor/scripts/video_processor.py to-mp4 input.avi output.mp4. Opcjonalnie dostosuj kodek wideo (domyślnie libx264) lub preset jakości (domyślnie medium) parametrami --codec i --preset.
  5. Aby przekonwertować wideo do formatu WebM, użyj komendy uv run .claude/skills/video-processor/scripts/video_processor.py to-webm input.mp4 output.webm z tymi samymi opcjami dostrajania kodeka i presetu.
  6. Po wyodrębnieniu audio możesz transkrybować zawartość poleceniem whisper output.wav, które wygeneruje plik tekstowy z transkryptem.

Podobne skille