tts-audio-mastering

Name: tts-audio-mastering
Author: benchflow-ai

autor: benchflow-ai

Profesjonalne mastering audio dla syntezy mowy — czystość, normalizacja głośności, synchronizacja.

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: benchflow-ai
Kategoria: Mobile
Wyświetlenia: 1

Repozytorium GitHub

O skillu

Umiejętność do obróbki audio generowanego przez silniki TTS (text-to-speech). Zawiera praktyczne kroki czyszczenia sygnału, normalizacji głośności według standardu ITU-R BS.1770, wyrównania segmentów oraz przygotowania plików do dostarczenia. Idealna dla projektów wideo z dubbingiem, gdzie audio musi być spójne, wolne od artefaktów i gotowe do publikacji.

Jak używać

Wybierz silnik TTS odpowiedni do Twoich potrzeb: silniki neuronowe offline (np. Kokoro) dla stabilności i niezależności sieciowej, usługi chmurowe (np. Edge-TTS, OpenAI TTS) dla wyższej naturalności, lub formantowe (np. espeak-ng) do prototypowania. Zawsze sprawdź natywną częstotliwość próbkowania wygenerowanego audio przed konwersją do formatu wideo.
Zastosuj czyszczenie mowy dla każdego segmentu: usuń szumy niskich częstotliwości filtrem górnoprzepustowym na ~20 Hz, opcjonalnie zmniejsz ostre brzmienia filtrem dolnoprzepustowym na ~16 kHz, a na granicach segmentów dodaj krótkie zanikanie (fade-in i fade-out ~50 ms). Utrzymuj spójne ustawienia filtrów dla wszystkich segmentów.
Zmierz głośność wygenerowanego audio za pomocą narzędzia ebur128 w FFmpeg lub równoważnego miernika, aby uzyskać wartości zgodne ze standardem ITU-R BS.1770: zintegrowana głośność -23 LUFS, szczytowa wartość rzeczywista około -1,5 dBTP, opcjonalnie LRA około 11.
Zastosuj normalizację głośności (np. filtr loudnorm w FFmpeg) jako ostatni krok po czyszczeniu i edycji czasowej. Jeśli zmienisz tempo lub czas trwania segmentu po normalizacji, powtórz normalizację ponownie.
Dopasuj każdy segment audio do jego docelowego okna czasowego w projekcie wideo, zwracając uwagę na granice segmentów, aby uniknąć przerw lub nakładania się. Upewnij się, że wszystkie segmenty są wyrównane do wspólnej częstotliwości próbkowania i formatu przed eksportem.
Wyeksportuj ostateczne audio w formacie zgodnym z wymaganiami dostarczenia (np. WAV, MP3 lub format wideo), zachowując ustawienia głośności i czystości uzyskane w poprzednich krokach.

Podobne skille

mobile-ios-design

autor: wshobson

Projektuj natywne aplikacje iOS zgodnie z wytycznymi Apple, używając SwiftUI i nowoczesnych wzorców.

Mobile

107284

flutter-expert

autor: sickn33

Opanuj Flutter na wszystkich platformach – mobilne, webowe, desktopowe i embedded

Mobile

54112

build-iphone-apps

autor: glittercowboy

Twórz natywne aplikacje iPhone'a w Swift bez Xcode – od kodu do testów w terminalu

Mobile

1182

flutter-development

autor: aj-geddes

Twórz mobilne aplikacje na iOS i Android z Flutter – jeden kod, dwie platformy

Mobile

1,1601,122

react-native-architecture

autor: wshobson

Architektura produkcyjna dla aplikacji React Native z Expo, nawigacją i synchronizacją offline

Mobile

3978

swift-best-practices

autor: sammcj

Pisz bezpieczny kod Swift 6+ z nowoczesnymi wzorcami współbieżności i API design

Mobile

36140