Dialogue Evaluation 2024
CoBaLD Parsing
Описание и постановка задачи
Участникам предлагается два трека:
- CoBaLD Parse: задача разработки парсера лингвистической разметки для английского и русского языков в формате Enhanced CoBaLD, включающем морфологический, синтаксический и семантический уровни.
Формат базируется на Enhanced Universal Dependencies, предполагает восстановление эллипсиса для ряда вершин. Семантическая разметка основана на упрощенной версии семантики Compreno и включает разметку значений слов и отношений между словами. Для обучения предлагаются два датасета — русский и английский. - CoBaLD CLT: задача создания парсера лингвистической разметки формата CoBaLD для венгерского или сербского языка с помощью языкового переноса (Cross Lingual Transfer).
В данной задаче морфосинтаксическая разметка основана на базовой версии Universal Dependencies (UD) и не предполагает восстановления эллиптированных вершин. Семантическая часть, как и в первой задаче, представляет собой упрощенный вариант семантической разметки Compreno. Предлагаются два небольших датасета для сербского и венгерского, содержащих разметку, выверенную вручную.
График проведения
01.06.2024 — финальная публикация датасетов для трека CoBaLD Parse;
15.06.2024 — публикация датасетов для трека CoBaLD CLT;
20.08.2024 — окончание соревнования, подведение итогов;
28.08.2024 — дедлайн подачи статей.