video-processor

Name: video-processor
Author: basher83

autor: basher83

Konwertuj wideo, wyodrębniaj audio i transkrybuj zawartość za pomocą sztucznej inteligencji

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: basher83
Kategoria: Data Science
Wyświetlenia: 112

Repozytorium GitHub

O skillu

Skill do przetwarzania plików wideo z możliwością wyodrębniania ścieżki audio, konwersji formatów (MP4, WebM) i automatycznej transkrypcji za pomocą modelu Whisper. Narzędzie wykorzystuje FFmpeg do manipulacji multimediami i OpenAI Whisper do zamiany mowy na tekst. Idealne, gdy potrzebujesz szybko zmienić format wideo, wyciągnąć dźwięk lub uzyskać transkrypt rozmowy z nagrania.

Jak używać

Zainstaluj wymagane narzędzia systemowe. Na macOS uruchom brew install ffmpeg. Na Ubuntu lub Debian użyj apt-get install ffmpeg. Sprawdź poprawność instalacji poleceniem ffmpeg -version.
Zainstaluj model Whisper do transkrypcji. Uruchom pip install -U openai-whisper i zweryfikuj instalację poleceniem whisper --help.
Aby wyodrębnić audio z pliku wideo, użyj komendy uv run .claude/skills/video-processor/scripts/video_processor.py extract-audio input.mp4 output.wav. Możesz zmienić format wyjściowy (domyślnie wav) na mp3, aac lub flac za pomocą opcji --format.
Do konwersji wideo do formatu MP4 uruchom uv run .claude/skills/video-processor/scripts/video_processor.py to-mp4 input.avi output.mp4. Opcjonalnie dostosuj kodek wideo (domyślnie libx264) lub preset jakości (domyślnie medium) parametrami --codec i --preset.
Aby przekonwertować wideo do formatu WebM, użyj komendy uv run .claude/skills/video-processor/scripts/video_processor.py to-webm input.mp4 output.webm z tymi samymi opcjami dostrajania kodeka i presetu.
Po wyodrębnieniu audio możesz transkrybować zawartość poleceniem whisper output.wav, które wygeneruje plik tekstowy z transkryptem.

Podobne skille

nano-banana-pro

autor: garg-aayush

Generuj i edytuj obrazy za pomocą API Gemini 3 Pro – od tekstowych opisów do modyfikacji istniejących plików

Data Science

535772

pdf-processing

autor: Ming-Kai-LC

Przetwarzaj duże pliki PDF bez limitów Claude'a – dzielenie, ekstrakcja tekstu i OCR

Data Science

23134

pptx

autor: anthropics

Twórz, edytuj i analizuj prezentacje PowerPoint bezpośrednio w Claude'u

Data Science

134310

moon-dev-trading-agents

autor: moondevonyt

48+ agentów AI do autonomicznego handlu kryptowalutami na wielu giełdach

Data Science

102232

rust-coding-skill

autor: UtakataKyosui

Umiejętność Claude'a do pisania idiomatycznego, wydajnego kodu w Rust z prawidłową architekturą

Data Science

248325

codex

autor: Lucklyric

Zaawansowane rozumowanie AI do skomplikowanych zadań kodowania i architektury

Data Science

16163