Toolverse
Wszystkie skille

speech

autor: CharlesWiltgen

Transkrypcja mowy na tekst dla aplikacji iOS — szybka, prywatna, na urządzeniu

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Mobile

O skillu

Skill do implementacji transkrypcji mowy w czasie rzeczywistym na iOS 26+. Wykorzystuje SpeechAnalyzer — nowy interfejs Apple'a, który zastępuje starszy SFSpeechRecognizer. Obsługuje transkrypcję plików audio, długie nagrania (spotkania, wykłady), mowę z odległości oraz zarządzanie modelami. Wyniki przesyłane asynchronicznie, przetwarzanie na urządzeniu bez wysyłania danych na serwery.

Jak używać

  1. Dodaj skill do projektu Claude/Codex — skopiuj zawartość z repozytorium CharlesWiltgen/Axiom do katalogu skills swojego agenta.
  2. Zaimportuj moduł Speech w Swift: import Speech.
  3. Utwórz instancję SpeechTranscriber i skonfiguruj locale (język) dla transkrypcji — wybierz język zgodny z oczekiwanym wejściem audio.
  4. Przygotuj plik audio (URL) lub strumień audio — skill obsługuje różne formaty; upewnij się, że urządzenie ma iOS 26+.
  5. Uruchom transkrypcję za pomocą AsyncSequence — wyniki będą napływać asynchronicznie w postaci volatilnych (tymczasowych) i sfinalizowanych wyników.
  6. Obsługuj wyniki: volatilne wyniki pojawiają się podczas mówienia, sfinalizowane wyniki są gotowe do użytku — wyświetl je w interfejsie lub zapisz do bazy danych aplikacji.

Podobne skille