
Speech Interface (Faster Whisper)
Głosowe interfejsy AI z pełnym przetwarzaniem lokalnym
Instalacja
Wklej poniższy fragment do konfiguracji wybranego klienta.
Instalacja
Szybkie info
- Kategoria
- Komunikacja
- Transport
- STDIO
- Licencja
- MIT
- Gwiazdki GitHub
- 81
- Wyświetlenia
- 465
Kompatybilne z
- Claude Code
- Claude Desktop
- codex
- Cursor
- gemini-cli
- VS Code
- Windsurf
Znalezione w: mcp.directory
Co potrafi
- Konwertuj mowę na tekst za pomocą faster-whisper
- Generuj mowę z 54+ opcjami głosów
- Transkrybuj pliki audio i wideo ze znacznikami czasu
- Twórz narracje wielogłosowe dla historii
- Przetwarzaj głos w czasie rzeczywistym z detektorem ciszy
- Wyświetlaj wizualizację dźwięku w nowoczesnym UI
Dla kogo
- Programiści budujący interfejsy głosowe dla asystentów AI
- Tworzenie treści audio i narracji
- Dostępność i interakcja bez użycia rąk
- Transkrypcja plików multimedialnych lokalnie
Wyróżnia się
- Całkowite przetwarzanie lokalne bez chmury
- Nowoczesny interfejs PyQt z wizualizacją
- Zapamiętywanie preferencji głosu
O serwerze
Speech Interface to serwer MCP integrujący możliwości interakcji głosowej dla modeli AI. Wykorzystuje faster-whisper i PyAudio do rozpoznawania i syntezy mowy, umożliwiając naturalne interfejsy głosowe działające całkowicie lokalnie. Obsługuje transkrypcję plików audio i wideo, generowanie mowy z 54+ opcjami głosów, detekcję ciszy w czasie rzeczywistym oraz wizualizację dźwięku w nowoczesnym interfejsie PyQt. Idealne dla programistów budujących asystentów AI z obsługą głosu, tworzenia treści audio i zapewniania dostępności bez użycia rąk.
Podobne serwery

Email Server
autor: ai-zerolab

JMAP (Fastmail)
autor: jahfer

Mailtrap Email API
autor: railsware

Voice Hooks
autor: johnmatthewtennant

Voice Interface
autor: shantur

Telnyx MCP Server
autor: team-telnyx