transcribe

Name: transcribe
Author: openai

autor: openai

Transkrypcja audio na tekst z rozpoznawaniem mówców

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: openai
Kategoria: Data Science
Wyświetlenia: 48

Repozytorium GitHub

O skillu

Zamień nagrania audio i wideo na tekst za pomocą API OpenAI. Skill obsługuje automatyczne rozpoznawanie i etykietowanie mówców (diaryzacja), idealne do transkrypcji rozmów, spotkań i wywiadów. Wybierz format wyjścia: zwykły tekst, JSON lub JSON z informacją o mówcach. Obsługuje wskazówki dotyczące języka i znanych uczestników.

Jak używać

Upewnij się, że masz zainstalowany Python 3 i narzędzie uv. Zainstaluj zależności poleceniem: uv pip install openai (lub python3 -m pip install openai, jeśli uv nie jest dostępne).
Ustaw zmienną środowiskową OPENAI_API_KEY z Twoim kluczem API z platformy OpenAI. Nigdy nie wklejaj klucza bezpośrednio w czacie — zamiast tego wyeksportuj go w swoim terminalu.
Przygotuj plik audio lub wideo, który chcesz transkrybować. Jeśli nagranie trwa dłużej niż ~30 sekund, skill automatycznie podzieli je na fragmenty.
Uruchom transkrypcję za pomocą bundled CLI. Dla szybkiej transkrypcji tekstu użyj domyślnych ustawień (model gpt-4o-mini-transcribe). Jeśli potrzebujesz rozpoznawania mówców, wskaż to życzenie — skill przełączy się na model gpt-4o-transcribe-diarize i zwróci wynik w formacie JSON z etykietami mówców.
Wyniki zostaną zapisane w katalogu output/transcribe/. Jeśli transkrybujesz wiele plików, użyj flagi --out-dir, aby uniknąć nadpisywania wyników.
Sprawdź jakość transkrypcji, etykiety mówców i granice segmentów. Jeśli potrzebujesz poprawy, poproś o pojedynczą, ukierunkowaną zmianę — skill obsługuje iteracyjne ulepszenia.

Podobne skille

xlsx

autor: anthropics

Twórz, edytuj i analizuj arkusze kalkulacyjne z formułami i wykresami

Data Science

40128

skill-installer

autor: openai

Instaluj umiejętności Codex z oficjalnej listy lub prywatnych repozytoriów GitHub.

Data Science

23118

codex

autor: Lucklyric

Zaawansowane rozumowanie AI do skomplikowanych zadań kodowania i architektury

Data Science

16163

stock-analyzer

autor: FrancyJGLisboa

Analiza techniczna akcji i ETF-ów w naturalnym języku – sygnały kupna i sprzedaży na podstawie RSI, MACD i Bollinger Bands.

Data Science

23128

docx

autor: anthropics

Twórz, edytuj i analizuj dokumenty Word z pełną kontrolą zmian i komentarzy

Data Science

39142

pdf

autor: anthropics

Przetwarzaj, wyodrębniaj i generuj pliki PDF programowo – od formularzy po scalanie dokumentów

Data Science

31144