Определение и природа формантов
Форманты — это устойчивые частотные полосы усиления в спектре звука, возникающие вследствие резонансных свойств речевого тракта или акустических полостей музыкальных инструментов. В акустике форманты рассматриваются как частотные пики в спектре, обусловленные усилением энергии в определённых частотных диапазонах. Они не являются гармониками звука, а представляют собой результат фильтрации основного и обертонного спектра, вызванной резонансами в полостях, через которые проходит акустическая волна.
Для описания формант используют обозначения F₁, F₂, F₃ и так далее — каждая из них соответствует определённому резонансному пику в спектре звука. Как правило, для речевого сигнала наибольшее значение имеют первые три форманта: F₁, F₂ и F₃.
Форманты в речи
Речевой тракт человека действует как сложный резонатор, изменяющийся во времени. Гортань генерирует исходный звуковой сигнал, содержащий основную частоту (f₀) и гармоники, а надгортанные полости (глотка, ротовая и носовая полости) выполняют функцию фильтра, формируя спектральную структуру, в том числе форманты.
Форманты играют критическую роль в различении гласных звуков. Положение и соотношение первых двух формант (F₁ и F₂) позволяют различать практически все гласные:
Например:
Таким образом, координаты F₁ и F₂ в частотной плоскости образуют акустическое пространство гласных.
Роль формант в распознавании речи
Восприятие гласных и ряда согласных в слуховой системе напрямую связано с положением формант. Даже при искажённом или зашумлённом сигнале слух способен распознавать речевые звуки благодаря устойчивости формантных структур. Слуховая система обладает способностью выделять пики амплитудного спектра и сопоставлять их с известными шаблонами речевых звуков.
Синтетическая речь, генерируемая на основе параметров формант, подтверждает, что восприятие возможно даже без естественного источника звука — при наличии правильных формантных характеристик.
Форманты согласных звуков
В отличие от гласных, согласные вносят в спектр больше турбулентности и шумовых компонентов. Однако и здесь форманты играют важную роль. Так, сонорные согласные (например, /л/, /р/, /м/, /н/) имеют выраженные формантные структуры, схожие с гласными. Кроме того, в плозивных и фрикативных согласных (например, /б/, /з/) можно наблюдать переходные участки формант — формантные переходы, по которым слух распознаёт место артикуляции согласного звука.
Форманты и музыкальные инструменты
Резонансные характеристики акустических музыкальных инструментов также обусловлены формантами. В частности, инструменты с ярко выраженными резонансными полостями (струнные, духовые) демонстрируют устойчивые частотные пики в спектре, сохраняющиеся независимо от высоты основного тона. Эти пики — акустические форманты инструмента — определяют его тембр.
Например, скрипка может иметь характерный формантный пик в районе 2500–3000 Гц, отвечающий за её «яркость» и «проникновенность». У духовых инструментов (например, саксофона или кларнета) форманты формируются благодаря геометрии трубки, наличию раструба и способу возбуждения.
Формантная структура и вокал
В вокальной акустике существует понятие певческого форманта — особой концентрации акустической энергии в диапазоне 2800–3200 Гц, создающей эффект «пробивной» вокальной подачи, позволяющий голосу быть слышимым на фоне оркестра. Этот формант формируется за счёт специфического взаимодействия гортанных и надгортанных резонаторов, чаще всего у профессиональных певцов.
Умелое управление артикуляцией и положением языка позволяет певцу изменять частоты формант, не меняя основного тона, тем самым обеспечивая богатую окраску звука.
Методы измерения формант
Выделение формант из звукового сигнала осуществляется с помощью спектрального анализа. Наиболее распространённый метод — линейное предсказание (Linear Predictive Coding, LPC). Он позволяет аппроксимировать речевой тракт в виде набора резонансных фильтров и определить местоположение спектральных пиков.
Альтернативный способ — анализ спектрограммы. Визуализация изменения формант во времени даёт представление о динамике речевого сигнала, особенно при изучении переходных процессов между звуками.
Форманты в искусственном синтезе речи
В системах синтеза речи форманты являются ключевыми параметрами. В формантном синтезе используются модели, в которых задаются частоты и полосы пропускания формант, а затем по ним формируется звуковой сигнал. Хотя этот метод уступает современным нейросетевым подходам по естественности, он позволяет точно контролировать акустические характеристики речи, включая тембр, интонацию и артикуляцию.
Акустические параметры формант
Каждая форманта характеризуется:
Полоса пропускания форманты зависит от степени затухания в резонансной системе. В речевом тракте это определяется потерями на стенках, трением воздуха, утечками через носовую полость и пр. Узкие полосы формант делают звук более звонким и резонансным, широкие — более глухим и неясным.
Форманты и восприятие тембра
Тембр звука определяется не только его основным тоном и огибающей, но и формантной структурой. Даже при одинаковой высоте звука и одинаковой громкости различные формантные характеристики создают эффект различия источника — например, различие между гобоем и флейтой, между мужским и женским голосом.
Восприятие тембра является следствием сложного взаимодействия между спектральным составом сигнала (в том числе формантами), его временной структурой и когнитивной обработкой в слуховой системе.
Изменчивость формант
Форманты подвержены вариациям под воздействием:
Значение формант в речевой патологии
Изменение формантной структуры может свидетельствовать о нарушениях артикуляции или резонанса. При расщелинах нёба, парезе язычной мускулатуры или дисфонии спектр речи теряет чёткость, форманты могут смещаться, расширяться или исчезать. Анализ формант используется в логопедии, фониатрии и речевой диагностике как объективный метод оценки речевых нарушений.