ТРЕХМЕРНАЯ МОДЕЛЬ РЕЧЕВОГО ТРАКТА И АЛГОРИТМ ВЫЧИСЛЕНИЯ ПЛОЩАДЕЙ ПОПЕРЕЧНЫХ СЕЧЕНИЙ
И. С. Макаров
Институт Проблем Передачи Информации РАН
- Badin
Institut de la Communication Parlée
В. Н. Сорокин
Институт Проблем Передачи Информации РАН
Ключевые слова: трехмерная артикуляторная модель, анатомическая база данных, отображение пространства артикуляторных параметров в пространство площадей поперечных сечений, корректирующая функция
В задачах автоматического распознавания, синтеза и сжатия представляется целесообразным определение формы речевого тракта по параметрам речевого сигнала. Такая задача называется обратной. Для решения обратной задачи относительно формы речевого тракта необходима кодовая книга, ставящая в соответствие измеренные акустические параметры речевого сигнала и артикуляторные параметры. Создание такой книги требует решения ряда частных задач. Прежде всего, необходимо построить анатомическую базу данных и сформировать алгоритм вычисления площадей поперечных сечений речевого тракта по текущим значениям управляемых параметров. Эти задачи решались с использованием результатов измерений формы речевого тракта посредством магнито-резонансной томографии, а также с помощью измерений на микролучевой рентгеноскопической установке. Основные результаты проведенного исследования: выяснилось, что глотка в процессе речеобразования может активно изменять свою ширину, что сказывается на значениях площадей поперечных сечений в глоточной области и, соответственно, на акустических параметрах речевого сигнала. Построена математическая модель глотки. С помощью факторного анализа были получены две собственные функции ширины глотки, покрывающие около 93% разброса измерений.
Полный текст статьи можно скачать здесь: