Об электронном словаре сочетаемости сложносочиненных и сложноподчиненных предложений
Агранат Т.Б., Кулагина О.С.
В настоящей работе рассматривается проблема сочетаемости типов отношений между простыми предложениями в составе сложного и описывается словарь сочетаемости сложносочиненных и сложноподчиненных предложений, составленный с использованием СУБД Access.
При автоматическом синтаксическом анализе текстов полезно устанавливать не только связи между отдельными словами, но и связи между простыми предложениями в составе сложного. Формальные показатели, которые могут при этом использоваться, следующие:
1) союзы и знаки препинания,
2) соотносительные слова,
3) порядок простых предложений,
4) модели управления, содержащие сведения о возможности наличия сентенциальных актантов, вводимых различными союзами,
5) сведения о сочетаемости типов отношений (СТО) между простыми предложениями (для случая сложного, содержащего не менее трех простых).
Сведения об СТО предлагается представить в виде электронного словаря-базы данных, и, соответственно, задача построения такого словаря является актуальной. Ниже представлена модель электронного словаря сочетаемости сложносочиненных и сложноподчиненных предложений, написанного с использованием СУБД Access.
При рассмотрении указанной сочетаемости внимание было сосредоточено на случае сложного из трех простых, поскольку, как показали некоторые ориентировочные подсчеты, предложения из четырех и более простых составляют лишь около одной десятой от общего числа предложений в научно-технических текстах. Случай трех простых было решено рассмотреть в общей форме, не связывая рассмотрение рамками конкретного приложения.
На возможность СТО влияет порядок простых предложений в составе сложного. Для сочинительных отношений возможно только линейное отношение следования, а для подчинительного – следования и вставления.
В настоящее время словарь СТО составлен для случая одного сочинительного и одного подчинительного отношения. Соответственно возможны следующие линейные схемы (ЛСх), в которых P1,P2,P3 обозначают простые предложения, а запись Pi{Pj}Pi* обозначает вставление Pj в Pi, причем Pi* - это продолжениеPi.
Возможны четыре ЛСх:
ЛСх1) P1 P2 P3
ЛСх2) P1{P2}P1* P3
ЛСх3) P1 P2{P3}P2*
ЛСх4) P1{P2 P3 }P1*
Для этих ЛСх возможны приводимые ниже структурные схемы(ССх), в которых указано направление отношений подчинения без указания типов. Используются следующие обозначения: Pi>Pj обозначает, что Pi подчиняет Pj; Pi=Pj обозначает, что Pi и Pj связаны сочинительным отношением; PI+Pjобозначает, что Pi и Pj связаны сочинительным отношением и обновременно подчиняют третье предложение или подчиняются ему.
Для ЛСх1 возможны следующие структурные схемы:
ССх1)(P1=P2) & (P2>P3).
ССх2)(P1=P2) & (P1>P3).
ССх3)(P1=P3) & (P1>P2).
ССх4)(P1=P3) & (P2<P3).
ССх5)(P1<P2) & (P2=P3).
ССх6)(P1>P2+P3).
ССх7)(P1<P2+P3).
ССх8)(P1+P2>P3).
Для ЛСх2 возможна ССх3: (P1>P2)& (P1=P3).
Для ЛСх3 возможна ССх1: (P1=P2)& (P2>P3).
Для ЛСх4 возможна ССх6: (P1>P2+P3).
Из указанных ССх при ЛСх1 очень маловероятна ССх4, поскольку она возможна только при отсутствии сочинительного союза между P1 и P3. Если же послеP1 идут оба союза, то мы имеем ЛСх3. Например: “ Петя решил задачу, но, хотя он все сделал правильно, ему поставили “хорошо”. Здесь “но” начинает P2.
В основе базы данных лежат типы сложносочиненных и сложноподчиненных предложений по классификации, принятой в Академической грамматике. Классификация сложносочиненных предложений имеет четыре уровня, сложносочиненных - три уровня. Эта иерархия отражена в базе и реализуется посредством отдельных, связанных между собой таблиц, что обеспечивает гибкость базы данных в случае необходимости модификации системы понятий. Соответственно в базе находятся четыре таблицы для сложноподчиненных предложений и три для сложносочиненных, в каждой из которых собраны типы предложений одного уровня иерархии. Такая структура позволяет не только легко находить информацию о сочетаемости двух типов предложений, но и однозначно интерпретировать, к какому более крупному классификатору относится каждое из этих предложений. Данная функция осуществляется при помощи разнообразных запросов, причем в дальнейшем любой пользователь может без труда извлекать необходимую ему информацию, создавая свои собственные запросы.
Посредством вспомогательных таблиц информация обо всех возможных видах сочетаемости передается в основную таблицу, которая связана с таблицей конкретных примеров. Такая структура позволяет, во-первых, обеспечить однозначную идентификацию примера как соответствующего определенному типу сочетаемости, а во-вторых, для каждого типа сочетаемости дать необходимое количество примеров с разным порядком следования простых предложений и разными схемами. Отсутствие сочетаемости также помечается в словаре.
В словаре принята форма представления с пятью окнами. В двух окнах задаются запрашиваемые типы отношений. В ответ на это задание в двух других показываются отношения следующего (более высокого) уровня иерархии. В пятом окне показываются примеры с различными схемами или указывается, при каких схемах заданные типы не сочетаются.
Возможности использования настоящего словаря не ограничиваются задачами автоматического анализа текстов, он может также быть полезным для теоретических лингвистических исследований. Словарь позволяет на наглядном материале изучать закономерности сочетаемости типов предложений.
Библиография.
Грамматика русского языка, т.2, М, 1980
Заварыкин В.В. Опыт построения электронного словаря сочетаемости сложносочиненных и сложноподчиненных предложений (дипломная работа) МГЛУ, 2000 (науч. рук. Агранат Т.Б.)
Калашникова Г.Ф. Многокомпонентные сложные предложения в современном русском языке, Харьков 1979 (рукопись депонирована в ИНИОН АН СССР).