Dialogue Evaluation 2024

CoBaLD Parsing

Описание и постановка задачи

Участникам предлагается два трека:

  • CoBaLD Parse: задача разработки парсера лингвистической разметки для английского и русского языков в формате Enhanced CoBaLD, включающем морфологический, синтаксический и семантический уровни.
    Формат базируется на Enhanced Universal Dependencies, предполагает восстановление эллипсиса для ряда вершин. Семантическая разметка основана на упрощенной версии семантики Compreno и включает разметку значений слов и отношений между словами. Для обучения предлагаются два датасета — русский и английский.
  • CoBaLD CLT: задача создания парсера лингвистической разметки формата CoBaLD для венгерского или сербского языка с помощью языкового переноса (Cross Lingual Transfer).
    В данной задаче морфосинтаксическая разметка основана на базовой версии Universal Dependencies (UD) и не предполагает восстановления эллиптированных вершин. Семантическая часть, как и в первой задаче, представляет собой упрощенный вариант семантической разметки Compreno. Предлагаются два небольших датасета для сербского и венгерского, содержащих разметку, выверенную вручную.

График проведения

01.06.2024 — финальная публикация датасетов для трека CoBaLD Parse;

15.06.2024 — публикация датасетов для трека CoBaLD CLT;

20.08.2024 — окончание соревнования, подведение итогов;

28.08.2024 — дедлайн подачи статей.