Сборник 2000

Эксперименты по синтаксическому анализу методом сравнения с архивом примеров.

Оливер Штрайтер, Чен Кежиан.

 

В работе описывается синтаксический анализатор для китайского языка, основанный на методе сравнения с архивом примеров. С помощью нечетких соответствий в синтаксически аннотированном корпусе отыскиваются синтаксические деревья. Затем между найденным деревом и предложением устанавливается линейное соответствие. Последующие структурные адаптации дают возможность обрабатывать незнакомые слова, учитывать мену категорий и метафорические употребления слова. С помощью деривационных адаптаций неуклюжие поддеревья анализируются заново с целью автоматической корректировки плохо соответствующих друг другу деревьев и для подстановки предварительно удаленных слов. Эта стратегия существенна для синтаксического анализа длинных предложений. Представлены результаты экспериментальной проверки различных вариантов предложенного подхода.