Форманты и их роль

Определение и природа формантов

Форманты — это устойчивые частотные полосы усиления в спектре звука, возникающие вследствие резонансных свойств речевого тракта или акустических полостей музыкальных инструментов. В акустике форманты рассматриваются как частотные пики в спектре, обусловленные усилением энергии в определённых частотных диапазонах. Они не являются гармониками звука, а представляют собой результат фильтрации основного и обертонного спектра, вызванной резонансами в полостях, через которые проходит акустическая волна.

Для описания формант используют обозначения F₁, F₂, F₃ и так далее — каждая из них соответствует определённому резонансному пику в спектре звука. Как правило, для речевого сигнала наибольшее значение имеют первые три форманта: F₁, F₂ и F₃.

Форманты в речи

Речевой тракт человека действует как сложный резонатор, изменяющийся во времени. Гортань генерирует исходный звуковой сигнал, содержащий основную частоту (f₀) и гармоники, а надгортанные полости (глотка, ротовая и носовая полости) выполняют функцию фильтра, формируя спектральную структуру, в том числе форманты.

Форманты играют критическую роль в различении гласных звуков. Положение и соотношение первых двух формант (F₁ и F₂) позволяют различать практически все гласные:

  • F₁ зависит от степени открытия рта: чем больше открытие (низкие гласные, как /а/), тем выше F₁.
  • F₂ зависит от положения языка по горизонтали: при переднем положении языка (как в /и/) F₂ высока, при заднем — низка.

Например:

  • Для гласного /и/: F₁ ≈ 300 Гц, F₂ ≈ 2500 Гц.
  • Для гласного /у/: F₁ ≈ 350 Гц, F₂ ≈ 900 Гц.
  • Для гласного /а/: F₁ ≈ 700 Гц, F₂ ≈ 1100 Гц.

Таким образом, координаты F₁ и F₂ в частотной плоскости образуют акустическое пространство гласных.

Роль формант в распознавании речи

Восприятие гласных и ряда согласных в слуховой системе напрямую связано с положением формант. Даже при искажённом или зашумлённом сигнале слух способен распознавать речевые звуки благодаря устойчивости формантных структур. Слуховая система обладает способностью выделять пики амплитудного спектра и сопоставлять их с известными шаблонами речевых звуков.

Синтетическая речь, генерируемая на основе параметров формант, подтверждает, что восприятие возможно даже без естественного источника звука — при наличии правильных формантных характеристик.

Форманты согласных звуков

В отличие от гласных, согласные вносят в спектр больше турбулентности и шумовых компонентов. Однако и здесь форманты играют важную роль. Так, сонорные согласные (например, /л/, /р/, /м/, /н/) имеют выраженные формантные структуры, схожие с гласными. Кроме того, в плозивных и фрикативных согласных (например, /б/, /з/) можно наблюдать переходные участки формант — формантные переходы, по которым слух распознаёт место артикуляции согласного звука.

Форманты и музыкальные инструменты

Резонансные характеристики акустических музыкальных инструментов также обусловлены формантами. В частности, инструменты с ярко выраженными резонансными полостями (струнные, духовые) демонстрируют устойчивые частотные пики в спектре, сохраняющиеся независимо от высоты основного тона. Эти пики — акустические форманты инструмента — определяют его тембр.

Например, скрипка может иметь характерный формантный пик в районе 2500–3000 Гц, отвечающий за её «яркость» и «проникновенность». У духовых инструментов (например, саксофона или кларнета) форманты формируются благодаря геометрии трубки, наличию раструба и способу возбуждения.

Формантная структура и вокал

В вокальной акустике существует понятие певческого форманта — особой концентрации акустической энергии в диапазоне 2800–3200 Гц, создающей эффект «пробивной» вокальной подачи, позволяющий голосу быть слышимым на фоне оркестра. Этот формант формируется за счёт специфического взаимодействия гортанных и надгортанных резонаторов, чаще всего у профессиональных певцов.

Умелое управление артикуляцией и положением языка позволяет певцу изменять частоты формант, не меняя основного тона, тем самым обеспечивая богатую окраску звука.

Методы измерения формант

Выделение формант из звукового сигнала осуществляется с помощью спектрального анализа. Наиболее распространённый метод — линейное предсказание (Linear Predictive Coding, LPC). Он позволяет аппроксимировать речевой тракт в виде набора резонансных фильтров и определить местоположение спектральных пиков.

Альтернативный способ — анализ спектрограммы. Визуализация изменения формант во времени даёт представление о динамике речевого сигнала, особенно при изучении переходных процессов между звуками.

Форманты в искусственном синтезе речи

В системах синтеза речи форманты являются ключевыми параметрами. В формантном синтезе используются модели, в которых задаются частоты и полосы пропускания формант, а затем по ним формируется звуковой сигнал. Хотя этот метод уступает современным нейросетевым подходам по естественности, он позволяет точно контролировать акустические характеристики речи, включая тембр, интонацию и артикуляцию.

Акустические параметры формант

Каждая форманта характеризуется:

  • Центральной частотой — частотой пика.
  • Полосой пропускания — шириной частотной области вокруг пика, в которой амплитуда остаётся значительной.
  • Амплитудой — уровнем усиления в данной полосе.

Полоса пропускания форманты зависит от степени затухания в резонансной системе. В речевом тракте это определяется потерями на стенках, трением воздуха, утечками через носовую полость и пр. Узкие полосы формант делают звук более звонким и резонансным, широкие — более глухим и неясным.

Форманты и восприятие тембра

Тембр звука определяется не только его основным тоном и огибающей, но и формантной структурой. Даже при одинаковой высоте звука и одинаковой громкости различные формантные характеристики создают эффект различия источника — например, различие между гобоем и флейтой, между мужским и женским голосом.

Восприятие тембра является следствием сложного взаимодействия между спектральным составом сигнала (в том числе формантами), его временной структурой и когнитивной обработкой в слуховой системе.

Изменчивость формант

Форманты подвержены вариациям под воздействием:

  • Индивидуальных анатомических особенностей: форма ротовой полости, длина речевого тракта, объём носовой полости.
  • Фонетического контекста: соседние звуки могут изменять форму артикуляционных полостей (коартикуляция).
  • Эмоционального состояния: напряжение мышц речевого тракта влияет на резонансные свойства.
  • Возрастных и гендерных различий: например, у мужчин форманты ниже, чем у женщин, за счёт большей длины речевого тракта.

Значение формант в речевой патологии

Изменение формантной структуры может свидетельствовать о нарушениях артикуляции или резонанса. При расщелинах нёба, парезе язычной мускулатуры или дисфонии спектр речи теряет чёткость, форманты могут смещаться, расширяться или исчезать. Анализ формант используется в логопедии, фониатрии и речевой диагностике как объективный метод оценки речевых нарушений.