Toolverse
Wszystkie serwery MCP
Speech Interface (Faster Whisper)

Speech Interface (Faster Whisper)

autor: kvadratni

Głosowe interfejsy AI z pełnym przetwarzaniem lokalnym

Instalacja

Wklej poniższy fragment do konfiguracji wybranego klienta.

Instalacja

Szybkie info

Kategoria
Komunikacja
Transport
STDIO
Licencja
MIT
Gwiazdki GitHub
81
Wyświetlenia
465

Kompatybilne z

  • Claude Code
  • Claude Desktop
  • codex
  • Cursor
  • gemini-cli
  • VS Code
  • Windsurf

Znalezione w: mcp.directory

Co potrafi

  • Konwertuj mowę na tekst za pomocą faster-whisper
  • Generuj mowę z 54+ opcjami głosów
  • Transkrybuj pliki audio i wideo ze znacznikami czasu
  • Twórz narracje wielogłosowe dla historii
  • Przetwarzaj głos w czasie rzeczywistym z detektorem ciszy
  • Wyświetlaj wizualizację dźwięku w nowoczesnym UI

Dla kogo

  • Programiści budujący interfejsy głosowe dla asystentów AI
  • Tworzenie treści audio i narracji
  • Dostępność i interakcja bez użycia rąk
  • Transkrypcja plików multimedialnych lokalnie

Wyróżnia się

  • Całkowite przetwarzanie lokalne bez chmury
  • Nowoczesny interfejs PyQt z wizualizacją
  • Zapamiętywanie preferencji głosu

O serwerze

Speech Interface to serwer MCP integrujący możliwości interakcji głosowej dla modeli AI. Wykorzystuje faster-whisper i PyAudio do rozpoznawania i syntezy mowy, umożliwiając naturalne interfejsy głosowe działające całkowicie lokalnie. Obsługuje transkrypcję plików audio i wideo, generowanie mowy z 54+ opcjami głosów, detekcję ciszy w czasie rzeczywistym oraz wizualizację dźwięku w nowoczesnym interfejsie PyQt. Idealne dla programistów budujących asystentów AI z obsługą głosu, tworzenia treści audio i zapewniania dostępności bez użycia rąk.

Podobne serwery