V
videocut
Transkrypcja filmów mówionego słowa i automatyczne wykrywanie błędów. Generuj scenariusz do przeglądu i listę zadań do edycji.
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Videocut to umiejętność do przetwarzania filmów z mówionym słowem. Narzędzie wyodrębnia audio, transkrybuje je za pomocą API Volcano Engine, a następnie automatycznie identyfikuje błędy mowy i momenty ciszy. Generuje trzy artefakty: plik JSON z napisami na poziomie słowa, listę wstępnie wybranych błędów do usunięcia oraz interaktywną stronę HTML do przeglądu. Po zatwierdzeniu zmian w przeglądarce można automatycznie wykonać edycję wideo.
Jak używać
- Przygotuj plik wideo w formacie MP4 i przekaż go umiejętności poleceniem 'Pomóż mi wyciąć ten film mówionego słowa' lub 'Przetwórz ten film'. 2. Umiejętność automatycznie wyodrębni audio, prześle je do transkrypcji przez API Volcano Engine i wygeneruje napisy na poziomie słowa. 3. System przeanalizuje transkrypcję za pomocą AI, aby zidentyfikować potencjalne błędy mowy i momenty ciszy, tworząc listę wstępnie wybranych fragmentów do usunięcia. 4. Otwiera się interaktywna strona HTML w przeglądarce, na której możesz przejrzeć każdy zaproponowany błąd, potwierdzić lub odrzucić go, oraz dostosować wybory. 5. Po zatwierdzeniu zmian na stronie kliknij przycisk 'Wykonaj edycję' lub wydaj polecenie '/剪辑', aby automatycznie usunąć zaznaczone fragmenty z oryginalnego wideo. 6. Wynikowe pliki (transkrypcja, lista błędów, scenariusz do przeglądu i wideo) zostaną zapisane w strukturze katalogów z datą i nazwą pliku.