Невербальная коммуникация. Экспериментально-психологические исследования. Владимир Морозов
Читать онлайн книгу.у мужчин. Указанное обстоятельство тем не менее не вызывает особых затруднений у слушателей в восприятии детской и женской речи, хотя в целом разборчивость детской и женской речи оказывается несколько ниже, чем мужской, особенно в верхней части звуковысотного диапазона голоса (Морозов, 1964b, Morozov, 1980).
Выше упоминалось о среднестатистических распределениях формантных областей на стационарных участках речевых звуков. Однако естественная речь характеризуется более или менее плавными переходами от одного артикулируемого звука к другому, что отражается на спектрах в наличии переходных процессов, т. е. участков между звуками, в которых содержится информация как о предыдущем, так и последующем звуке.
С целью изучения динамики звуковых процессов, и в частности речевых спектров, применяются динамические спектрографы, известные также в литературе под термином «видимая речь». На динамических спектрограммах, полученных с помощью данного прибора, по горизонтальной оси регистрируется время, по вертикальной – частота спектральных составляющих, а их интенсивности соответствует степень потемнения линий (Potter et al., 1947). Пример регистрации речевой фразы: «Девушка, как тебя зовут?» – при помощи динамического спектрографа приведен на рисунке 5. Жирными линиями здесь обозначены формантные частоты, характерным образом изменяющиеся по частотной шкале в процессе речи. Для более точного определения речевых формант существуют специальные методы и автоматические устройства – так называемые формантоискатели (Сапожков, Михайлов, 1983).
Рис. 5. Динамическая спектрограмма фразы «Девушка, как тебя зовут?», синтезированной с помощью синтезатора «OVE-3» (Деркач и др., 1983).
В верхнем ряду «Девушка как», в нижнем – «тебя зовут». Хорошо видны первые три форманты – F1, F2, F3, частоты которых изменяются в процессе воспроизведения фразы.
Среднестатистический (усредненный) спектр русской речи, полученный методом интегрирования (в частотных полосах спектрометра) большого числа речевых сигналов, охватывает весьма широкую полосу частот, примерно от 100 до 10 000 Гц, с постепенным падением к высоким частотам. Это не означает, что весь указанный частотный диапазон необходим для удовлетворительного восприятия и понимания речи слушателем.
Исследования показали, что речевой сигнал сохраняет достаточно высокую разборчивость при условии ограничения его спектрального состава как сверху (подавление высоких частот спектра при помощи фильтров низкой частоты), так и снизу (подавление низких частот спектра при помощи фильтров высокой частоты). Слоговая разборчивость 80 % обеспечивается при ограничении высоких частот от 2 кГц и выше или при ограничении низких частот от 2 кГц и ниже. Напомним, что 80 % слоговой разборчивости соответс твует 98 % разборчивости с лов (см. рис унок 1) и 99,5 % фразовой разборчивости (см. рисунок 2). Таким образом, обе половины спектра речевого сигнала, разделенного по частоте 2 кГц, обеспечивают практически 100-процентную правильность восприятия слушателем фразовой речи.
Еще более устойчивыми к