Эксперименты по синтаксическому анализу методом сравнения с архивом примеров.
Оливер Штрайтер, Чен Кежиан.
В работе описывается синтаксический анализатор для китайского языка, основанный на методе сравнения с архивом примеров. С помощью нечетких соответствий в синтаксически аннотированном корпусе отыскиваются синтаксические деревья. Затем между найденным деревом и предложением устанавливается линейное соответствие. Последующие структурные адаптации дают возможность обрабатывать незнакомые слова, учитывать мену категорий и метафорические употребления слова. С помощью деривационных адаптаций неуклюжие поддеревья анализируются заново с целью автоматической корректировки плохо соответствующих друг другу деревьев и для подстановки предварительно удаленных слов. Эта стратегия существенна для синтаксического анализа длинных предложений. Представлены результаты экспериментальной проверки различных вариантов предложенного подхода.