Light-industry-up.ru

Экосистема промышленности

Voice Activity Detection

13-10-2023

VAD (англ. Voice Activity Detection) — обнаружение голосовой активности во входном акустическом сигнале для отделения активной речи от фонового шума или тишины. Голос, интерпретированный как шум, может порождать «вырезки» из разговора (chipping). Фон, интерпретируемый как голос, приводит к снижению эффективности компрессии (например, в DTX).

Фрагменты сигнала, классифицируемые как активная речь, могут в дальнейшем кодироваться любым вокодеком (например, CELP) при использовании в ПО для различения в кодируемой речи человеческого голоса и фонового шума.

CNG — обратный VAD процесс.


Voice Activity Detection.

© 2014–2023 light-industry-up.ru, Россия, Краснодар, ул. Листопадная 53, +7 (861) 501-67-06