gettr-transcribe-summarize
Transkrypcja i streszczenie nagrań z postów GETTR — lokalnie na Apple Silicon
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Pobierz audio z postu GETTR, transkrybuj je lokalnie za pomocą MLX Whisper na procesorach Apple Silicon, a następnie utwórz streszczenie w postaci punków lub czasowego planu. Narzędzie wyodrębnia wideo z metadanych HTML, generuje transkrypcję ze znacznikami czasowymi w formacie VTT i automatycznie podsumowuje zawartość. Idealne do szybkiej analizy treści wideo bez wysyłania danych do chmury.
Jak używać
Zainstaluj wymagane zależności: mlx-whisper (przez pip) i ffmpeg (przez brew). Sprawdź, czy oba narzędzia są dostępne w wierszu poleceń.
Przygotuj adres URL postu GETTR — może to być link do zwykłego postu (gettr.com/post/...) lub transmisji na żywo (gettr.com/streaming/...).
Wyodrębnij identyfikator postu (slug) z adresu URL — to ciąg znaków po ostatnim ukośniku, np. p1abc2def.
Pobierz adres URL wideo z postu, uruchamiając skrypt: python3 scripts/extract_gettr_og_video.py "ADRES_URL_POSTU". Dla transmisji na żywo może być konieczne użycie automatyzacji przeglądarki.
Uruchom pipeline transkrypcji i pobierania: bash scripts/run_pipeline.sh "ADRES_URL_WIDEO" "SLUG". Jeśli treść nie jest w języku angielskim, dodaj flagę --language (np. --language zh dla chińskiego).
Czekaj na zakończenie przetwarzania — wynik to transkrypcja w formacie VTT ze znacznikami czasowymi oraz plik audio w formacie WAV. Następnie możesz wygenerować streszczenie w postaci punków lub czasowego planu na podstawie transkrypcji.