Теория, описание, приложение: полемика и диалог
Е.А.Лютикова, С.Г.Татевосов
МГУ им. М.В.Ломоносова.
katjal@philol.msu.ru, tatevos@philol.msu.ru
1. Три разных лингвистики
Одна из самых болезненных проблем современной лингвистики состоит, по всей видимости, в том, что статус лингвистики как единой науки в настоящее время весьма проблематичен. В действительности существует три разных лингвистики - теоретическая, описательная и прикладная. Большинство тех, кто называет себя лингвистами, трудится в рамках одного из этих направлений и недоуменно, а иной раз и снисходительно взирает на происходящее внутри двух других. Следует отметить, что лингвистика, кажется, единственная наука, устроенная подобным образом. Трудно представить себе, скажем, чтобы проектировщики самолетов находились в неведении относительно законов аэродинамики, а теоретических физиков не интересовало бы, будет ли летать самолет, построенный на основе их теорий гравитации, аэродинамики, сопротивления материалов и т.д.
Между тем лингвист-теоретик, желающий, к примеру, узнать об устройстве конкретного языка, опираясь на данные грамматического описания, или познакомиться с действующей прикладной моделью, часто обнаруживает, что его теоретические знания мало в этом помогают. Три лингвистики устроены как три различные науки, иной раз с собственной терминологией и даже с собственной теорией. (Весьма характерно, что многие академические курсы “Прикладная лингвистика” включают, наряду с практикумом, некую “теоретическую составляющую”, соотношение которой с собственно “теорией языка” понять довольно сложно. С другой стороны, читая описательную грамматику, нередко приходится воссоздавать для себя теоретическую базу автора, чтобы затем переформулировать его утверждения в более привычных терминах).
Следует отметить также, что указанная “тройственность” лингвистики - безусловно, не врожденная, а благоприобретенная. Все известные лингвистические традиции “создавались для решения конкретных практических задач” (Алпатов 1998:17). Поскольку важнейшей из прикладных задач была задача обучения неродному языку (или родному языку в его архаичной форме), первыми возникают описательные грамматики. И лишь в эпоху схоластов в средневековой Европе появляются теоретические, “спекулятивные” сочинения. Разрыв между теорией и практикой, к сожалению, не был преодолен и во времена “компьютерного бума”; напротив, возникновение компьютерной лингвистики разделило лингвистов на тех, кто остался в русле теоретической лингвистики и тех, кто ушел в новую науку.
Таким образом, нам хотелось бы поставить проблему воссоздания лингвистики как единой науки о языке.
2. Дают - бери, бьют - беги, или что могут дать теоретическое, описательное и прикладное языкознание друг другу.
2.1. Теоретическая лингвистика
Теоретическая лингвистика формулирует обобщения относительно свойств любого естественного языка, иными словами, утверждает, что в принципе может быть и чего не может быть в произвольном человеческом языке.
Материал конкретных языков, зафиксированный в рамках описательного языкознания, оказывается безусловно востребованным теоретической лингвистикой. Далее, привлечение данных новых языков может существенным образом повлиять на развитие теории. Приведем пример.
Классическая теория связывания (Chomsky 1981), построенная в основном при опоре на английский языковой материал, формулирует универсальные ограничения на дистрибуцию анафорических средств языка в следующих терминах:
à Принципы теории связывания.
Принцип А. Анафор связан в своей непрозрачной области. (К анафорам относятся рефлексивные и взаимные местоимения.)
Принцип В. Прономинал свободен (= не связан) в своей непрозрачной области. (К прономиналам относятся обычные анафорические местоимения и фонологически пустые анафорические местоимения ( в генеративной грамматике называемые pro)).
Принцип С. Референциальное выражение (= полная ИГ) свободно.
à Понятие связанности.
ИГ a является связанной антецедентом b, если a находится в отношении структурного приоритета к b (= b с-командует a) и при этом обе ИГ помечены одинаковым референциальным индексом.
à Структурный приоритет (понятие предложено в работе Т. Рейнхарт (Reinhart 1983)).
Узел a обладает структурным приоритетом над узлом b (= a с-командует b) тогда и только тогда, когда узел, который непосредственно доминирует над a, также доминирует и над b, и ни a, ни b не доминируют друг над другом.
à Непрозрачная область
Непрозрачная область есть минимальная составляющая, содержащая одновременно анафорическое выражение и так называемый фактор непрозрачности. Фактором непрозрачности обычно выступает подлежащее предикации.
Стандартная теория связывания, однако, оказалась неспособной объяснить ряд языковых данных, связанных с функционированием анафорических средств. Например, она не описывает наблюдающегося по языкам варьирования рефлексива / анафорического местоимения в составе, например, обстоятельственной группы:
(1) немецкий
Hansi hat eine Schlange neben sichi / *ihni gesehen.
Ганс увидел змею рядом с собой.
(2) английский
Johni saw a snake near himi / ???himselfi.
Джон увидел змею рядом с собой.
Если, исходя из (1), постулировать локальную область для рефлексива в составе обстоятельственной группы как простое предложение с фактором непрозрачности – подлежащим, то невозможно объяснить связанность английского анафорического местоимения в этой области, и наоборот, если на основании английского примера считать, что для обстоятельственной группы локальная область меньше, чем предикация, мы столкнемся с трудностями в описании рефлексива в немецком предложении (1).
Далее, стандартная теория связывания оказывается неспособной объяснить с универсальных позиций и поведение рефлексивов за пределами простого предложения. Теория связывания постулирует, среди прочего, локальность (требование ближайшего антецедента) анафоров, и, тем самым, локальность рефлексивов. Тем не менее данные многих языков показывают, что областью связывания языковых единиц, возникающих в прототипическом рефлексивном контексте, может быть не только простая предикация, но и сложное предложение. Рефлексивы, антецедентом которых является актант другой предикации, получили название дистантных, или дальних рефлексивов (long distance reflexives). Простейшим примером дистантного рефлексива служит русское возвратное местоимение себя: в составе инфинитивного оборота оно допускает в качестве антецедента подлежащее главной предикации:
(3) русский
Машаi попросила Нинуj [Æj налить себеi,j чаю].
Таким образом, в теории связывания оказалось необходимым учитывать, что в разных языках рефлексивы способны употребляться на разном расстоянии от своего антецедента. Учет этих фактов вылился в определение в рамках теории связывания различных областей связывания (локальных областей). Важным достижением на этом пути стало открытие так называемой иерархии Мандзини-Уэкслера (Manzini, Wexler 1987). Согласно этой иерархии, область связывания для разных местоимений может определяться как минимальная составляющая, содержащая:
- подлежащее;
- любую категорию, специфически свойственную финитному глаголу;
- категорию времени;
- категорию референциального времени (не-таксисные формы, интерпретируемые независимо от времени глагола главного предложения);
- категорию корневого времени, которая обнаруживается только в глаголе главного предложения.
Языки могут выбирать в качестве области связывания одну из выделенных областей. Если некоторое местоимение Х языка L связано в некоторой области a, то оно тем самым связано и в области b, входящей в состав a. Для русского местоимения себя область связывания выбирается в соответствии с признаком (3) Мандзини и Уэкслера, поэтому оно может быть связано в составе инфинитивного оборота и везде в составе простого предложения.
Таким образом, использования некоторой теории в описательном языкознании может выступать как критерий истинности теории. То же самое можно сказать и о прикладном языкознании. Следует отметить, что теоретической лингвистике не всегда доступны принципы верификации естественных наук (повторяемость эксперимента и метод аксиоматизации) (Hausser 1999:7). По этой причине на первый план выходит верификация лингвистических теорий методом тестирования автоматических моделей, в которые имплементированы соответствующие теории. Примером подобной верификации может служить проверка теории “Смысл Û Текст” путем ее имплементации в систему машинного перевода семейства ЭТАП.
Такого рода эксперимент особенно важен для лингвистической теории ввиду следующего тезиса, высказываемого здесь в качестве эвристики:
Эффективность алгоритмов в конечном итоге определяется тем, отражают ли они истинное устройство языка-объекта или же моделируют его методом “черного ящика”.
2.2. Описательное языкознание
Этот раздел языкознания создает описания конкретных языков, фиксируя по возможности максимальное число языковых фактов и классифицируя их.
У теоретической лингвистики описательное языкознание наследует (или должно наследовать) формальный аппарат описания и лингвистическую терминологию. Этим достигается единообразие описания и его доступность для последующих обобщений. В качестве удачного примера можно привести шаблон конкретно-языкового описания, принятый в серии “Языки мира”.
Другой важнейшей задачей теоретической лингвистики, актуальной для описательного языкознания, является разработка анкет для исследования различных грамматических явлений. Представляется, что использование в полевой работе анкеты, составленной с учетом уже существующих типологических обобщений, знаний о засвидетельствованных и незасвидетельствованных языковых типах, представлений о возможных категориях и оппозициях, позволяет ожидать полноты собранного при помощи данной анкеты языкового материала.
Особо хотелось бы подчеркнуть, что преодоление европоцентричного подхода к анализу языковых данных, происходившее в теоретической лингвистике на протяжении XX века, к сожалению, до сих пор еще не воспринято в должной мере описательным языкознанием. Пересмотр “европоцентричной” установки, очевидно, является насущной задачей описательного языкознания.
Лингвистические приложения могут выявить неадекватность конкретно-языковых описаний и, более того, поставить новые описательные задачи. К примеру, лишь незначительное количество языковых описаний (мы имеем в виду как тексты грамматик, так и словари) содержит такую информацию, как полная модель управления предикатного слова. Между тем и автоматический анализ, и автоматический синтез дают неудовлетворительные результаты, не располагая указанной информацией. Следует подчеркнуть, что описание моделей управления – это не просто запрос прикладного языкознания; это требование именно полноты описания конкретного языка.
2.3. Прикладные области
Под прикладной лингвистикой мы понимаем любое применение лингвистических знаний в практической деятельности человека. Наиболее ярким представителем этой отрасли является автоматическая обработка естественного языка.
Прикладная лингвистика пользуется обычно материалом, представленным в описательных грамматиках и словарях. Характернейший пример – грамматический словарь А.А.Зализняка, имплементированный в подавляющее большинство морфологических анализаторов и синтезаторов русского языка. Здесь можно назвать также большое количество двуязычных словарей, словарь синтаксем Г.А.Золотовой и многое другое. К сожалению, как уже было отмечено, прикладные задачи часто выявляют несовершенство или неполноту языковых описаний, что приводит к необходимости их корректировки или расширения уже в рамках прикладных задач. Прикладному лингвисту нередко приходится на первом этапе своей деятельности решать именно описательные задачи, а затем переходить к задачам собственно практическим.
Теоретическая лингвистика влияет на прикладные области в первую очередь опосредованно, через описательную. Тем не менее существуют осмысленные вопросы, которые прикладная лингвистика может задать теоретической и на которые не может ответить описательное языкознание.
Это вопросы о том, что в принципе возможно в естественном языке. Такого рода вопросы могут возникать, например, когда в прикладную систему необходимо заложить возможность добавления новых языков, так чтобы это не привело к изменению общего устройства системы. Общие свойства естественного языка можно использовать в жестких алгоритмах, а параметры межъязыкового варьирования – в виде переменных, к которым обращается алгоритм. Например, для системы англо-русского машинного перевода можно в большинстве случаев обойтись без синтаксического анализа типов сентенциальных актантов и переводить английский инфинитив русским инфинитивом, а союз that – союзом что. Однако если стоит задача предусмотреть возможность добавления к системе языка другой структуры, например, татарского, следует учитывать, что тип конструкции с сентенциальным актантом является межъязыковой переменной и способ перевода конструкции с сентенциальным актантом нельзя закладывать в алгоритм.
3. Эмпирические проблемы лингвистической теории
В настоящем разделе мы обсудим три относительно независимые проблемы, которые касаются по преимуществу теоретической лингвистики, но которые, принимая во внимание сказанное выше, могут иметь важные последствия и для двух других отраслей лингвистики — описательной и прикладной. Эти проблемы были осознаны вначале как эмпирические проблемы — при попытке или использовать текущую систему взглядов на язык для описания нового языкового материала, или опираться на эти взгляды при решении прикладных задач, например, в области автоматического анализа текста. Появление этих проблем связано, как представляется, с несколькими распространенными заблуждениями, которым одинаково подвержены лингвисты, практикующие во всех отраслях лингвистики, обозначенных выше. Заголовки подразделов 3.1 — 3.3 отражают нашу точку зрения на эти проблемы.
3.1. Формализм — это больше, чем инструмент
Существуют различные точки зрения относительного того, как соотносятся лингвистическая теория и лингвистический формализм, и, к тому же, существенные расхождения в понимании самого термина “лингвистическая теория”. Во избежание терминологического недоразумения, оговоримся сразу же, что теорией мы в данном случае называем систему высказываний о том или ином явлении или группе явлений в языке (“теория вида”, “теория анафоры” и т.д.). Другое возможное прочтение этого термина, которое демонстрируют словоупотребления типа “теория Хомского”, “теория управления и связывания” и т.п., когда речь идет о последовательной системе взглядов на язык и на то, как должны строиться теории в первом понимании, мы называем теоретической системой. (Этот термин можно рассматривать как перевод английского framework.)
Часто можно услышать мнение, согласно которому формализм является чем-то вторичном по отношению к теоретической системе и что какой формализм ни возьми, это не повлияет на возможность сделать содержательные обобщения об исследуемом предмете. Утверждается, иными словами, идея переводимости формализмов; примером перевода могут служить широко известные правила, сопоставляющие произвольному дереву непосредственных составляющих дерево зависимостей и обратно. Мы придерживаемся иной точки зрения и считаем, что в общем случае формализмы непереводимы.
Если рассматривать формализм как (мета)язык, которым мы пользуемся, чтобы сформулировать ту или иную теорию, описывающую, истолковывающую и предсказывающую поведение исследуемого материала, то следует признать, что существуют такие формализмы, такие “языки”, используя которые в принципе невозможно сказать что-либо об изучаемом явлении. Пытаясь даже не то чтобы сделать какие-то обобщения о том, что мы наблюдаем, но хотя бы просто охарактеризовать наблюдаемое на таком языке, мы оказываемся в положении героини фильма Ж.-Л.Годара “Альфавилль”, которая пыталась уяснить для себя понятие consciousness, для которого в ее цивилизации не существовало никакого обозначения. И подобно тому как Институт Общей Семантики, манипулируя языком, избавлял жителей Альфавилля от излишнего знакомства с реальностью, в которой существовали такие вещи, как consciousness, создатель научной теоретической системы и формализма, на котором она излагается, может сделать так, что о некоторых существенных явлениях последователи этой системы не узнают никогда, поскольку даже не смогут их назвать. Рассмотрим материал турецкого языка, который показывает циклические vs. нециклические фонологические эффекты (Orgun 1998:179 и сл.).
В турецком языке имеется следующее Слоговое ограничение: морфологическая структура, содержащая аффиксы, не может быть односложной. Это ограничение ответственно за неприемлемость (4б) и (5б), в которых консонантный аффикс присоединяется к односложной основе. В (6б) и (7б), которые в точности соответствуют (4б) и (5б) с точки зрения словоизменительных грамматических характеристик, неприемлемости не возникает, поскольку данные словоформы содержат два слога.
(4) а. re: ‘(нота) до’ б. *re:-n ‘до-2sg’ в. *re:-n-den ‘до-2sg-abl’
(5) а. je ‘есть’ б. *je-n ‘есть-pass’ в. je-n-di ‘есть-pass-pst’
(6) а. sol ‘(нота) соль’ б. sol-ym ‘соль-1sg’
(7) а. jut ‘глотать’ б. jut-ul ‘глотать-pass’
Циклические эффекты, о которых идет речь, состоят в следующем. Если к словоформам, представленным в (4б) и (5б), добавить еще по одному аффиксу, доведя таким способом число слогов до двух — см. (4в) и (5в), — это будет иметь различные последствия для имен и глаголов. Глагольные двусложные словоформы с двумя аффиксами, как например, (5в), делаются полностью приемлемыми, в то время как именные словоформы, подобные (4в), продолжают оставаться недопустимыми. Это объясняется тем, что у имен Слоговое ограничение циклически применяется ко всем составляющим словоформы, начиная с максимальной и заканчивая минимальной. Под действие ограничения не подпадает словоформа re:-n-den в целом, содержащая ровно два слога, но подпадает структура re:-n, которая является составляющей re:-n-den. У глаголов Слоговое ограничение не является циклическим: оно распространяется на фонологическое слово, но не на его составляющие.
Мы утверждаем, что ограничения такого рода невозможно сформулировать в терминах формализма модели “Смысл Û Текст”, на котором описаны ее поверхностно-синтаксический и глубинно-морфологический уровни, а также правила перехода с одного уровня на другой. Мы утверждаем тем самым, что до тех пор пока теория описывает, объясняет и предсказывает свойства морфологических объектов, используя язык ПСП и ГМП, явления, представленные примерами (4)-(5), будут оставаться для нее невидимыми. Мы позволим себе опустить строгое обоснование этого утверждения, которое кажется нам интуитивно очевидным и которое, кроме того, является эмпирически проверяемым.
3.2. Точность понятий — не самоцель
Общеизвестно, что понятия, которые являются предметом научного знания, должны быть определены по возможности строго и однозначно (= о любом произвольно взятом объекте можно сказать, входит ли он в предметную область данного понятия). Существует, однако, устойчивое заблуждение, с которым, мы уверены, любой лингвист сталкивался не раз и которое придает идее точности такое значение, которое та, как кажется, не должна иметь: “главное — договориться о понятиях, а остальное приложится само собой”. Может быть, приложится, а может быть, и нет: здесь кажутся неочевидными две презумпции. Во-первых, теоретизирование с плохо определенными понятиями обречено, конечно, на провал, но из этого не следует, что теоретизирование с хорошо определенными понятиями обречено на успех. (Авторам по этой причине всегда казались отчасти странными утверждения типа “Основной результат работы — теоретический: внесены существенные уточнения / даны строгие определения понятиям падежа, рода, и т.д.”) Во-вторых, возможность дать строгое определение некоторому понятию далеко не гарантирует возможность дать такое определение любому понятию.
Давно известно о существовании нечетких понятий и категорий, которые нельзя определить таким образом, чтобы для всякого произвольного объекта х это определение задавало бы истинностное значение утверждению “х принадлежит рассматриваемой категории”. Классический пример — предикат быть лысым (См. подробнее обсуждение в Dahl 1985:10-12). Для индивида, у которого 0 волос, предикат принимает значение “И”. По всей видимости, для индивида с 0+1 волосами предикат по-прежнему остается истинным. Парадокс состоит в том, что если предикат является истинным для индивида с n волосами, то он является истинным и для индивида с n+1 волосами, и не существует такого k, что начиная с k+1 истинностное значение меняется на противоположное. Вместо этого, имеются четкие случаи, когда n=0, а ║быть лысым║ = И и n=5000 (среднее количество волос у здорового человека) и ║быть лысым║ = Л, а между ними располагается область, в которой истинностное значение не определено (или, иначе, оно находится внутри отрезка [0,1]). Предложить процедуру, разрешающую множество лысых людей, невозможно. Нечеткие понятия, таким образом, имеют ядро, или фокус, куда, в данном случае, попадают индивиды с выраженной лысиной, и достаточно размытую периферию, где определить принадлежность индивида к категории оказывается проблематичным.
Когда лингвист сталкивается с нечеткими понятиями, — а количество объектов в языке, для описания которых требуются нечеткие понятия, пугающе велико, — часто предлагается решить вопрос о границе данного понятия конвенционально: “Договоримся считать лысым всякого индивида, у которого волос меньше или равно 500 (или 300, или 1800 — кому что нравится). Ср. следующее утверждение:
(8) Граница между словообразовательными и словоизменительными, а также между семантическими и синтаксическими значениями нередко оказывается зыбкой; в изобилии встречаются промежуточные случаи. Однако предложенное деление обязывает нас к ОДНОЗНАЧНЫМ классификационным решениям даже по отношению к сомнительным случаям. Такая ситуация типична для естественных языков, где абсолютные и отчетливые противопоставления вообще встречаются достаточно редко. Тем не менее, мы не видим ничего порочного в таком несколько насильственном способе классификации, если при этом промежуточный характер соответствующих элементов отмечается явным образом. (Мельчук 1998:6)
Описательной лингвистике приходится принимать однозначные классификационные решения на каждом шагу. Результаты очень часто оказываются неудовлетворительными. В грамматике нивхского языка (Панфилов 1962) одно и тоже местоимение, например, перечисляется трижды — в рубрике “универсальные местоимения”, в рубрике “отрицательные местоимения” и в рубрике “неопределенные местоимения”. В грамматике языка амеле одно и та же единица охарактеризована дважды — как анафорическое местоимение и как возвратное местоимение. И даже в знаменитой грамматике бумаа (Dixon 1988) можно найти упоминание о показателе собирательности у имен и показателе “завершенности действия” у глаголов, а присмотревшись повнимательнее, обнаружить, что это, вполне возможно, один и тот же показатель. В любом описании любого языка можно при желании найти примеры такого же рода. Могут возразить, что подобные казусы возникают из-за того, что классификационные схемы, лежащие в основе частно-языковых описаний, плохи, и стоит подправить немного признаковую базу, как результаты станут существенно лучше.
Дело, как кажется, все же не в этом. Введение однозначности там, где ее на самом деле нет — как в случае с предикатом ‘быть лысым’ — в принципе не проясняет, а затемняет существо дело, не приближает, а отдаляет исследователя от понимания сущности явления. Реальность состоит в том, что переход от пышной шевелюры к полной лысине — процесс недискретный, и какую бы договоренность мы ни приняли, реальность от этого не изменится. Мы же, проводя дискретную границу по линии n£500, не только закрываем глаза на эту реальность, но и обрекаем себя на изнурительный и бесплодный спор о понятиях: почему n должно быть именно 500, а не 700 и не 300. Правильный ответ: не 500, не 700 и не 300 — этого n в действительности нет. Более близкий к лингвистике пример: “Можем ли мы называть эту категорию аористом, если она употребляется в таких-то, таких-то и таких-то случаях?” Правильный ответ: можем называть, можем не называть, это дело десятое. Давайте лучше посмотрим, чем эта категория напоминает и чем отличается от похожих категорий в других языках, допускает ли такую дистрибуцию наша теория и не пора ли нам внести в теорию какие-то изменения.
Повторим еще раз: существует огромное количество содержательных лингвистическим понятий, которые описываются законом исключенного третьего. Например, понятие кореферентности таково, что любые две ИГ в любом языке кореферентны, либо некореферентны, а понятие структурного приоритета таково, что любые два узла синтаксического дерева либо находятся в отношении структурного приоритета, либо не находятся, без всяких промежуточных случаев. Из этого однако, не следует, что все лингвистические понятия можно сформулировать именно таким способом, и главное, что на это надо тратить время и силы.
3.3. Эксплицитность и самосогласованность теории — не единственный и не главный критерий
Теоретическая система призвана не просто построить множество непротиворечивых утверждений о свойствах исследуемого материала, но и сформулировать содержательные обобщения — то есть обобщения, претендующие на то, чтобы описывать все так, как есть на самом деле. Требуется, далее, чтобы эти обобщения обладали предсказательной силой, то есть налагали определенные запреты на поведение материала (о запретительном характере научных предсказаний см. Поппер 1983) и, кроме того, поддавались фальсификации. Мы являемся решительными противниками точки зрения, сформулированной в виде распространенного эпистемологического принципа: “Важно, как мы будем это описывать. Как это устроено на самом деле — не наша забота.”. В качестве примера рассмотрим дистрибуцию нескольких морфем багвалинского языка и возможные способы описания и интерпретации этой дистрибуции.
Любое имя, способное занимать позицию вершины именной группы, имеет две основы — прямую и косвенную. Например, существительное ila ‘мать’ имеет прямую основу ila и косвенную ila-ł:i, которая образуется с помощью показателя ł:i. (9а-б) показывает номинатив единственного числа, совпадающий с прямой основой, и адэссив единственного числа, который образуется от косвенной основы с помощью показателя -X. (В порядке упрощения, несущественного для обсуждаемого явления, мы говорим только о словоформах единственного числа).
(9) а. ila б. ila- ł:i-X в. *ila-X
мать мать-OBL-AD мать-AD
Показатель -X, а также показатели грамматических падежей — эргатива, датива, аффектива, генитива, — и пространственных падежей, например, контэссива, интерэссива, инэссива, субэссива и т.д., не могут присоединяться к прямой основе (см. (9в)). С другой стороны, в багвалинском языке имеются послелоги, которые управляют номинативом, например, послелог XindiX (10а), который не может присоединяться к косвенной основе (10б).
(10) а. beL’ XindiX б. *beL’-a XindiX
сарай вокруг сарай-OBL вокруг
Эти два случая не создают проблем для описания и допускают обобщения в простых и интуитивно очевидных терминах:
(11) а. показатели косвенных падежей образуют падежные словоформы от косвенных основ;
б. послелоги управляют падежными словоформами.
Тривиальным следствием обобщения (11б) является то, что послелоги не присоединяются к морфологическим объектам, которые падежными формами не являются, в частности, к именным основам (косвенным, как в (10б)). Рассмотрим, однако, (12):
(12) а. ila-ł:i-ła б. ila- ła
мать-OBL-LOC мать-LOC
‘у матери; там, где мать’
Как показывает (12), сегмент ła ведет себя иначе, чем падежные показатели и послелоги: в отличие от падежных показателей, этот сегмент присоединятся к прямой основе (или, может быть, к падежной форме номинатива — это тот как раз тот случай, когда различить падежную форму и основу невозможно), а в отличие от послелогов, сочетается с косвенной основой.
Пусть (9)-(10) и (12) — это все доступные нам данные о дистрибуции рассматриваемых единиц. Тогда можно предложить две экстенсионально эквивалентные (=делающие одинаковые предсказания) теории, описывающие дистрибуцию падежных показателей, послелогов и сегмента ła. В соответствии с первой теорией, морфемы, составляющие именную группу, делятся без остатка на именные основы, показатели косвенных основ, падежные показатели и послелоги (некоторые другие морфемы, не существенные для нашего рассмотрения, оставим за скобками). Послелоги и падежные показатели подчиняются правилам, представленным в (11). В таком случае в багвалинском языке имеются две омонимичные единицы: падежный показатель ła, представленный в (12а), и послелог ła, представленный в (12б).
В соответствии со второй теорией, морфемы, составляющие именную группу, делятся на именные основы, показатели косвенных основ, падежные показатели, послелоги. Кроме того, имеется еще один особый класс морфем, назовем его классом слабых падежных показателей. Послелоги и падежные показатели по-прежнему подчиняются правилам (11а-б), а дистрибуция слабых падежных показателей описывается обобщением (11в):
(11) в. Слабые падежные показатели образуют падежные словоформы от прямых или косвенных основ.
В этом случае ła представляет собой морфологическую единицу (одну, а не две!) класса слабых падежных показателей.
Мы с пониманием относимся к точке зрения, согласно которой выбор одной из двух теорий — дело вкуса, поскольку обе они дают один и тот же результат: описывают свойства послелогов, падежных показателей, а также истолковывают нестандартное поведение сегмента ła. Для этого первая теория умножает количество словарных единиц, то есть интерпретирует дистрибуцию ła на уровне лексикона, а вторая умножает количество классов морфем, то есть относит “аномалию” в поведении łaна счет грамматики. Сторонники подхода “Важно, как описывать, неважно, как в действительности”, вероятно, предпочтут первую теорию, которая обеспечивает большую компактность и экономичность грамматики. Мы, однако, придерживаемся, противоположной точки зрения и считаем, что в действительности ситуация, которую предполагает первая теория, а именно,
(13) Одно и то же значение ‘находиться в том месте, где Х’ выражается двумя различными языковыми единицами, одна из которых относится к лексическому классу послелогов, а второе — к классу грамматических морфем, и эти единицы находятся в отношении свободного варьирования
невозможна или крайне маловероятна. Мы убеждены, что это является достаточным основанием для того, чтобы первая теория была решительно отвергнута. Наше убеждение базируется на следующем метафизическом принципе:
(14) Для естественного языка несвойственно выражение одного и того же значения с помощью различных языковых единиц, которые находятся в отношении свободного варьирования.
Данный принцип нефальсифицируем (переменная в нем не связана квантором всеобщности, критерий отождествления значений — как идентифицировать “одно и то же значение” — не указан и т.д.), и поэтому в соответствии с критерием демаркации (Поппер 1983) его нельзя рассматривать как эмпирическое (= строгое) высказывание. Тем не менее, именно эмпирические данные позволяют опираться на этот принцип с такой уверенностью, как если бы он имел статус физического закона. Действительно, если бы языки допускали регулярные отклонения от (14), мы на каждом шагу сталкивались бы, например, с глагольными системами, в которых значение‘прогрессив’ выражается конструкциями с двумя различными вспомогательными глаголами или, — сделаем аналогию с обсуждаемым багвалинским примером полной, — с глагольными системами, в которых значение ‘прогрессив’ выражается и вспомогательным глаголом, и аффиксом, причем глагол и аффикс свободно варьируют.
Хотим подчеркнуть: мы не утверждаем, что в языке нет свободного варьирования. Мы утверждаем лишь, что если теория описывает языковое явление так, что при этом требуется сделать эмпирически невозможное допущение (например, допущение о неограниченности свободного варьирования), то эта теория должна быть отвергнута, пусть даже она обеспечивает максимальную простоту, компактность, последовательность описания и другие вещи, приятные для познающего, но бесполезные для познания.
4. Заключение
Вывод, который мы бы хотели сделать из предшествующего обсуждения, достаточно тривиален: положение дел в любой науке нуждается в постоянной рефлексии со стороны тех, кто ею занимается. Время от времени мы должны задуматься, соответствуют ли предсказательные возможности теории эмпирическим данным, не противоречит ли практика применения этой теории в описательных целях методологическим установкам самой теории и удовлетворяет ли теория потребности, как было принято говорить, народного хозяйства. Особенно важно обсуждение этих проблем для лингвистики на рубеже веков, когда мы становимся свидетелями ухода господствовавшей на протяжении полувека структуралистской парадигмы. Разрыв между теоретической, описательной и прикладной лингвистикой может обернуться серьезными потерями для каждой из них, и если анализ проблем, которые мы затронули в настоящей статье, будет способствовать преодолению этого разрыва, мы считаем нашу задачу выполненной.
Литература
Алпатов В.М. (1998). История лингвистических учений. “Языки русской культуры”, М.
Мельчук И.А. (1998). Курс общей морфологии. Т.2. М. — Вена.
Панфилов В.З. (1962). Грамматика нивхского языка, ч. 1. М.
Поппер К. (1983). Логика и рост научного знания. М.
Chomsky N. (1981). Lectures on government and binding. Dordrecht: Foris.
Dahl, Ö. (1985). Tense and aspect systems. Oxford.
Dixon, R.M.W. (1988). A Grammar of Boumaa Fijian. Chicago.
Hausser, R. (1999). Foundations of Computational Linguistics: Man-Machine communication in natural language. Springer-Verlag Berlin — Heidelberg.
Manzini, M. R., and K. Wexler (1987). Parameters, binding theory, and learnability. In: Linguistic Inquiry, Vol.18, ? 3.
Orgun, C.O. (1998). “Cyclic and noncyclic phonological effects in a declarative grammar” In: Booij G., van Marle J. (eds.) Yearbook of Morphology 1997. Dordrecht — London.
Roberts, J.R. (1987). Amele. London — N.Y.