АВТОМАТИЧЕСКОЕ ПОПОЛНЕНИЕ СПЕЦИАЛИЗИРОВАННОГО ТЕЗАУРУСА
В. И. Пекар
Башкирский государственный педагогический университет
vpekar@ufanet.ru
Ключевые слова: лексические ресурсы, автоматическое приобретение знания, алгоритмы классификации, корпусное моделирование семантики, дистрибутивное сходство, таксономическое сходство.
Доклад посвящен проблеме автоматического пополнения тезауруса новыми лексическими единицами, извлекаемыми из текста. Исследование направлено на изучение возможностей повысить качество семантической классификации путем разработки эффективного классифицирующего алгоритма. В докладе описывается новый классифицирующий алгоритм, который использует информацию о таксономической организации семантических классов. На примере специализированного тезауруса проводились эксперименты, сравнивающие классификации, полученных с помощью этого метода, с классификациями, полученными с помощью "метода ближайших соседей". Результаты исследования показывают, что предложенный алгоритм проводит более качественную классификацию новых слов, чем "метод ближайших соседей".
Полный текст статьи можно скачать здесь: