Сборник «Компьютерная лингвистика и интеллектуальные технологии” (CoLing&IntTel) основывается на докладах, принятых к представлению на ежегодной международной конференции «Диалог».
Уже более 30 лет в полном соответствии со своим названием конференция Диалог является традиционным местом плодотворного обмена идеями и опытом между представителеми теоретической лингвистики и специалистами в области автоматической обработки текста (NLP).
В наше время, когда по общему признанию специалистов компьютерная лингвистика основывается на упрощенных и даже элементарных лингвистических моделях, сохранение этой традиции взаимодействия представляется особенно важным.
Задачей конференции и сборника CoLing&IntTel является развитие лингвистически ориентированного направления в компьютерной лингвистике. Это не означает, что Редакционный Совет сборника отвергает при отборе материалов работы, принадлежащие к доминирующему сегодня статистическому направлению – речь идет о том, чтобы соединить потенциал использования лингвистических моделей с новыми возможностями, открывшимися с появлением и все более широким использованием текстовых корпусов.
Сборник включает не только работы, принадлежащие к основным направлениям NLP, таким, например, как информационный поиск, машинный перевод, компьютерная лексикография, анализ и синтез речи, автоматическое извлечение лингвистических данных и знаний и т.п., но и работы в области лексической семантики, синтаксиса, теории коммуникации.
Это отражает научную цель, заключающуся в том, чтобы стимулировать разработку лингвистических моделей и описаний той степени полноты и эксплицитности, которая позволила бы решать на их основе вышеуказанные задачи NLP на качественно новом уровне.
В этой ориентации инженерной практики на адекватные лингвистические и коммуникативные модели и состоит специфика Диалога, отличающая его от большинства конференций по компьютерной лингвистике.
Каждый год мы выбираем одну-два ключевых темы для обсуждения, объединяющие интересы всех участников, как теоретиков, так и практиков. В этом году такой доминантой стало обсуждение проблем корпусометрии и методики корпусных исследований. Тема качественного и количественного анализа текстовых корпусов была выбрана не случайно, посольку корпуса являются сегодня тем общим, что объединяет всех исследователей: практически всякий лингвистический проект и исследование осноывается сегодня на корпусных данных. Но, увы, далеко не во всяком исследовании такого рода четко формулируется, какими необходимыми свойствами должен обладать корпус и методы работы с ним, чтобы полученные результаты заслуживали доверия.
Диалог является международной конференция с двумя официальными рабочими языками: русским и английским. Это отражает особую роль конференции: служить мостиком между современной мировой корпусной лингвистикой и исследованими российских ученых, в которых особое место отводится русскому языку, как объекту моделирования и анализа.
Приходится с сожалением констатировать, что русский язык оказался сегодня на периферии интересов мировой компьютерной лингвистики. Мы полагаем, что Диалог и его сборник призваны привлечь внимание как к проблемам, так и к достижениям российской компьютерной лингвистики. Именно поэтому среди авторов сборников как российские исследователи, так и авторитетные представители мировой компьютерной лингвистики.
ISSN 2221-7932 (Print), ISSN 2075-7182 (Online)
по всем вопросам обращаться по адресу Secretary@dialog-21.ru