Описание структуры дискурса в рамках
Теории Риторической Структуры:
применение на русском материале
А.Л. Литвиненко
Московский Государственный Университет
antolit@mail.ru
В докладе рассматривается разработанная американскими лингвистами Уильямом Манном и Сандрой Томпсон методика описания структуры дискурса в виде сетей дискурсивных единиц, соединенных семантическими отношениями. Предлагаются изменения, необходимые для того, чтобы Теория могла быть использована для описания русских дискурсов различных типов. Указываются возможности, которые дает подобное представление структуры дискурса.
Теория Риторической структуры, разработанная в 1980е годы американскими лингвистами Уильямом Манном и Сандрой Томпсон, предлагает описание структуры дискурса в виде сетей дискурсивных единиц, соединенных семантическими отношениями, причем, как правило[1], дискурс имеет древовидную структуру. «Существует ряд весомых подтверждений того, что ТРС в значительной степени моделирует реальность и представляет собой важный шаг в понимании того, как дискурс устроен «на самом деле» (Кибрик, Плунгян, 1997). В частности, в работе Барбары Фокс (Fox, 1987), посвященной английской анафоре, показано, что выбор средства референции в дискурсе зависит от риторической структуры. Основной недостаток этой теории — применимость ее (в том варианте, в котором она предлагается Манном и Томпсон в настоящее время) к ограниченному набору типов дискурса. В частности, она не приспособлена к описанию структуры диалога. Предлагаемая модификация Теории учитывает особенности устного дискурса, во-первых, и русского дискурса, во-вторых.
Описание текстов в рамках данной теории позволяет проводить сравнительный анализ их структуры, получая статистически достоверные результаты. В частности, возможно исследование представленности различных типов семантических связей в различных типах текстов, а также сравнительное изучение не только отдельных отношений (между двумя или несколькими единицами), но и отдельных фрагментов структуры.
В настоящее время проводится коллективное исследование рассказов о сновидениях у детей с невротическими заболеваниями. Это продолжение разработок кандидата медицинских наук Е.А. Корабельниковой, предложившей метод экспертного анализа сновидений для диагностики и терапии невротических заболеваний у детей и подростков. В исследовании участвуют как психологи, так и лингвисты. Собственно материал для исследования — магнитофонные записи отчетов о сновидениях — был предоставлен Е.А. Корабельниковой. По большей части отчеты были записаны непосредственно при пробуждении, когда ребенок лучше помнит содержание сна. На данный момент это 56 отчетов от больных детей и контрольная группа из 32 здоровых. Описание этих рассказов в терминах ТРС позволяет выявить статистически достоверные различия в структуре рассказа у здоровых детей и детей с неврозами, несколько слов о которых будет сказано позднее.
- Теория риторической структуры У.Манна и С.Томпсон.
В (Mann, Thompson 1987: 1) авторы определяют ТРС как «теорию, описывающую основной аспект организации текста на естественном языке». Согласно (Mann, Matthiessen, Thompson, 1992), существуют 3 основных вида (или, скорее, уровня) структуры:
- Holistic structure — суперструктура, отвечающая за организацию текста на самом верхнем уровне и зависящая от его жанровой принадлежности. Сюда относятся разбивка на главы, организация формальных писем, использование формул типа «Искренне Ваш X» или «Касательно Y».
- Relational structure — структура связей, отвечающая за организацию собственно текста, превращающая его из простой последовательности предложений в некое единое целое.
- Syntactic structure — синтаксическая структура в обычном понимании.
ТРС — теория 2 вида, а именно теория структуры связей.
Основными понятиями ТРС являются дискурсивная единица и отношение. Теория представляет структуру текста в терминах отношений, связывающих между собой некоторые части этого текста. Текст некоторым образом делится на дискурсивные единицы, которые связываются между собой отношениями из определенного набора.
В (Mann, Matthiessen, Thompson, 1992) ТРС определяется с помощью следующего набора допущений.
- Организация текста.
Текст состоит из функционально значимых частей. Эти части являются элементами, из которых строятся более крупные части и целые тексты.
- Целостность и связность.
Для того, чтобы быть текстом, нечто написанное должно быть целостным и связным. Само это утверждение редко оспаривается, вопрос лишь в природе этой связности.
- Целостность, связность и функциональность.
Природа связности текста — функциональное его назначение. Текст пишется автором для некоторой цели, связность и целостность текста ей подчинены.
- Иерархичность.
Текст не является линейной последовательностью единиц. Напротив, текст организован иерархично: элементарные единицы объединяются в единицы большего объема, те объединяются между собой и так до уровня целого текста.
- Однородность иерархии.
Для объединения единиц любого объема существует общий, единый набор структурных связей.
- Вид структуры связей.
Текст имеет древовидную структуру; иными словами, структура текста, представленная с помощью ТРС представляет собой дерево.
- Асимметричность отношений.
Большая часть отношений — асимметрична, то есть из двух объединяемых единиц одна является более центральной, главной, а вторая — более периферийной. Первая называется, соответственно, ядром, а вторая — сателлитом.
В набор отношений входят также несколько симметричных отношений, в таком случае считается, что они объединяют ядра. Некоторые из них могут быть многоядерными (т.е. объединять более 2х отношений), но большинство являются бинарными.
- Природа отношений.
Отношения, организующие текст, являются функциональными, они отражают процесс организации текста согласно с некоторой известной пишущему целью, для которой и создается текст. Именно в этом смысле употребляется в теории термин «риторический».
При этом ТРС отражает уровень пре-реализации, т.е. то, как текст планируется и организуется в соответствии с его целью, а не то, какими средствами достигается эта цель.
- Число отношений.
Набор риторических отношений в принципе является открытым, но частота «появления» новых отношений необычайно мала.
В дальнейшем мы будем употреблять термины элементарная дискурсивная единица (a unit) или ЭДЕ, говоря о единицах самого низкого уровня, идискурсивная единица (a text span), говоря о единицах любого объема, если последний не имеет значения.
Характеризуя дискурсивные единицы, следует обратить внимание на два важных момента. Во-первых, на проблему непрерывности дискурсивной единицы, а во-вторых, на алгоритм деления текста на элементарные дискурсивные единицы.
В первых вариантах теории (Mann, Thompson, 1987 и 1989) дискурсивная единица определялась как непрерывный линейный отрывок текста, обладающий, однако, связностью и осмысленностью в интуитивном представлении «наивного носителя» языка. Однако в более поздних работах, например, в (Mann, Matthiessen, Thompson, 1992), авторы уже допускают возможность существования разрывных дискурсивных единиц, хотя и с оговоркой, что это скорее исключение, чем правило. Здесь дискурсивная единица определяется рекурсивно: это либо любой отрывок текста, имеющий ТРС-структуру, либо элементарная дискурсивная единица. Что касается ЭДЕ, то это обычно клауза. Таким образом, мы переходим к вопросу о делении текста на ЭДЕ.
Клауза — это элементарное предложение, состоящее из одной глагольной группы и одной или нескольких именных групп. Как уже было сказано, деление на ЭДЕ обычно совпадает с делением на клаузы, кроме некоторых случаев. Проблемы возникают при делении на ЭДЕ сложных предложений. Обстоятельственные придаточные и сочиненные клаузы обычно образуют отдельные ЭДЕ, а дополнительные и определительные придаточные обычно не выделяются. В случае английских причастных оборотов (которым в русском языке соответствуют деепричастные) необходимо обращение к семантике.
Рассмотрим пример деления на ЭДЕ отрывка литературного письменного текста.
(1) (М. А. Булгаков, «Мастер и Маргарита», с.324, СПб., «Кристалл», с/с, т.2).
Абрикосовая дала обильную желтую пену, и в воздухе запахло парикмахерской. Напившись, литераторы немедленно начали икать, расплатились, и уселись на скамейке лицом к пруду и спиной к Бронной.
Разделенный на ЭДЕ, этот отрывок будет выглядеть следующим образом:
(1а)
- Абрикосовая дала обильную желтую пену,
- и в воздухе запахло парикмахерской.
- Напившись,
- литераторы немедленно начали икать,
- расплатились,
- и уселись на скамейке лицом к пруду и спиной к Бронной.
В приведенном примере можно обратить внимание на две вещи: во-первых, однородные сказуемые образуют отдельные ЭДЕ, во-вторых, деепричастие «напившись» также образует отдельную единицу 3, которая вместе с единицами 4, 5 и 6 образует временную последовательность действий.
В ТРС риторическим отношениям даются определения, состоящие из двух зон. В первой зоне указываются связанные с данным отношением ограничения, которые могут быть 3х типов: ограничения на ядро, ограничения на сателлит и ограничения на сочетание ядра и сателлита. Во второй зоне указывается эффект данного риторического отношения, т.е. то впечатление, которое его использование оказывает на слушателя.
Рассмотрим, например, определение отношения CONCESSION (УСТУПКА). В данной работе принято следующее оформление определений:
название отношения |
CONCESSION (УСТУПКА) |
ограничения на ядро |
Пишущий позитивно оценивает ядро. |
ограничения на сателлит |
Пишущий не утверждает, что сателлит не имеет силы |
ограничения на сочетание ядра и сателлита |
Пишущий признает возможную несовместимость ядра и сателлита; пишущий считает, что ядро и сателлит одновременно имеют место; знание того, что ядро и сателлит одновременно имеют место, увеличивает позитивный взгляд читателя на ядро. |
эффект |
Воспринимая ядро и сателлит, читатель увеличивает свой позитивный взгляд на ядро. |
локус эффекта
|
Сочетание ядра и сателлита. |
В (Mann, Matthiessen, Thompson, 1992) предложен следующий список отношений:
Таблица 1. Исходный набор риторических связей.
Асимметричные отношения |
|||||
английский термин |
русский термин[2] |
английский термин |
русский термин |
английский термин |
русский термин |
Evidence |
Свидетельство |
VolitionalCause |
Волитивная Причина |
Restatement |
Переформулировка |
Concession |
Уступка |
VolitionalResult |
Волитивный Результат |
Antithesis |
Антитезис |
Elaboration |
Развитие, или Детализация |
Non-volitional Cause |
Неволитивная Причина |
Solutionhood |
Решение |
Motivation |
Мотивация |
Non-volitionalResult |
Неволитивный Результат |
Enablement |
Обеспечение возможности |
Justify |
Обоснование |
Circumstance |
Обстоятельство |
Purpose |
Цель |
Condition |
Условие |
Background |
Фон |
Interpretation |
Интерпретация |
Evaluation |
Оценка |
Otherwise |
Альтернатива |
Summary |
Резюме |
Means |
Средство |
|
|
|
|
Симметричные отношения |
|||||
Sequence |
Последовательность |
Contrast |
Контраст |
Joint |
Конъюнкция |
Из всех приведенных здесь отношений многоядерными являются только 2 — последовательность и конъюнкция.
Еще некоторое число отношений, предложенных Манном и Томпсон, не входит в этот список — главным образом, потому, что для них нет четких определений. Тем не менее, они используются в работе — на основе их «интуитивной» понятности. Это отношения Disjunction (Дизъюнкция) и Comparison(Сравнение), причем Дизъюнкция — симметричное многоядерное отношение, а Средство и Сравнение — асимметричные бинарные.
Для того чтобы проиллюстрировать применение ТРС к конкретному тексту, рассмотрим дерево разбора примера (1):
(1в)
Далее, необходимо заметить, что на связи между единицами накладываются следующие ограничения:
- Одно ядро может быть связано с несколькими сателлитами;
- Один сателлит может быть связан только с одним ядром.
Иными словами, отношение Сателлит®Ядро является функциональным.
- Необходимость дополнений к предложенной методике. Предлагаемая модификация Теории.
Теория Риторической структуры была разработана на материале английских письменных текстов различных жанров: письма формального и личного характера, статьи из газет и журналов, рекламные брошюры и даже кулинарные рецепты. Однако использование подобных материалов в качестве основы Теории привело к неодинаковой представленности различных компонентов смысла (например, коммуникативные связи в исходном варианте Теории описываются плохо) и возникновению сложностей при попытке использовать предложенные авторами средства для описания дискурса на другом языке (на русском). Поэтому необходимо было разработать правила применения данной методики на русском материале, а также расширить набор предложенных Манном и Томпсон средств.
Помимо указанных отчетов о сновидениях (которые в основном представляют собой спонтанный устный монологический нарратив) автором использовались данные книги “Русская разговорная речь: тексты” (М., 1978) и записи бытового диалога, собранные в домашних условиях в 1996-99 гг., в которых участвовали близкие родственники, друзья и знакомые автора. Последние записи использовались в основном при разработке отношений, описывающих диалогический дискурс.
Предлагаемая модификация ТРС включает следующий набор изменений, необходимый для того, чтобы Теория могла быть использована для описания русских дискурсов различных типов.
А. Правила на ЭДЕ для русского дискурса.
- Прежде чем приступать к делению устного дискурса на ЭДЕ, необходимо его затранскрибировать и разделить сначала на интонационные единицы (проставить синтагматические и фразовые границы), а затем на синтаксические единицы (высказывания), так как большая часть правил деления на ЭДЕ основана на синтаксических параметрах.
Только в тех случаях, где их недостаточно, нужно обращаться к семантике: например, деепричастный оборот в русском языке может обозначать образ действия, причину, часть последовательности действий, сопутствующее действие.
- В прототипическом случае ЭДЕ совпадает с клаузой, то есть каждая предикация выделяется в отдельную ЭДЕ, если это не противоречит другим правилам. В частности, однородные сказуемые представляют собой разные единицы (см. пример (2)).
- Сентенциальные актанты, кроме придаточных при глаголах мысли, речи и ощущений, принадлежат к той же ЭДЕ, что и матричный предикат[3]. Придаточные дополнительные при глаголах мысли, речи и ощущений выделяются в отдельную ЭДЕ. Прямая речь выделяется в отдельную ЭДЕ (разбивается на несколько отдельных ЭДЕ, если содержит более 1 клаузы).
(2) (БД сновидения)
- Ну ... мама не ругалась,
- и сказала так
- что ... если сейчас не придет папа ... в общем на ужин,
- (как обычно у нас в семь часов ужин)
- ты по= оденешься
- и пойдешь за ним.
Здесь можно обратить внимание на то, что в разговорной речи 2 возможных способа передачи чужой речи — придаточные дополнительные и прямая речь — часто смешиваются. В примере (2) употреблен союз что, после которого, исходя из формы местоимений, следует прямая, а не косвенная речь.
- Определительные придаточные и причастные обороты, являющиеся нерестриктивными определениями, выделяются в отдельную ЭДЕ (или несколько ЭДЕ) — см.(4). Рестриктивные определения, независимо от их формы, принадлежат к той же ЭДЕ, что и определяемое слово — см. (3).
(3) (БД сновидения)
- Я шел вперед, вперед,
- и ... и вдруг вижу,
- что там чего-то сверкает.
- И я ... и я по= подошел к нему,
- к этому дереву ... у которого сверкало чего-то.
(4) (БД сновидения)
- Тогда мой командир наградил меня золотой медалью,
- которая стоила двести долларов.
- Разбиение высказываний с деепричастными оборотами зависит от семантической функции оборота. Обстоятельства образа действия в отдельную ЭДЕ не выделяются. Обстоятельства причины, сопутствующие или предшествующие действия выделяются в отдельную ЭДЕ.
- Сериальные конструкции («пойду посмотрю», «сижу читаю») не разбиваются, образуя одну ЭДЕ.
Б. Допущение существования разрывных единиц.
Такие дискурсивные единицы образуются в результате инкорпорации одной единицы в другую. Для устного дискурса это не очень частое явление (например, в нашей базе из 103 рассказов о сновидениях всего 2 случая инкорпорации), однако для письменного литературного языка это, по-видимому, нормально: так часто оформляются деепричастные обороты, обстоятельственные придаточные и т.п. Например, у Л. Н. Толстого в отрывке длиной около 15 ЭДЕ (т.е. приблизительно 3 сложных предложения) может быть 3-4 подобных вставки.
В. Введение некоторого числа новых отношений, необходимых для описания устного, в том числе диалогического дискурса. Приведем здесь краткий список этих отношений.
- Коммуникативные отношения, связывающие реплики в диалоге: Вопрос, Ответ, Директив, Согласие, Возражение, Экспрессив, Комиссив (Обязательство), Запрет, Отказ, Декларация. Эти отношения используются ТОЛЬКО при описании устного диалогического дискурса (т.е. для описания реального устного общения). При передаче диалога в чужой речи — в повествовании — используются другие средства. Такое решение мотивировано тем, что в нарративном тексте рассказчик ставит в один ряд вербальные и невербальные события, а значит, диалог в рассказе нужно передавать как последовательность событий (так же, как «Пришел. Увидел. Победил»), а не как реальный диалог, имеющий сложную ветвящуюся структуру.
- Оформительные отношения, описывающие средства, используемые говорящим/пишущим для упорядочивания структуры рассказа: Заголовок, Сеттинг(описание исходной ситуации, «декораций» в начале сюжета), Кода (то же, что Сеттинг, но завершающее рассказ), Отступление (маркирует отступление от темы), Повтор (в отличие от предложенной Манном и Томпсон Переформулировки, описывает чистые повторы; это различие представляется стилистически важным), Концовка («Вот и все», «Конец», «Моя сказала»).
- Отношения Содержание и Источник, описывающие ввод чужой речи при глаголах мысли/речи («он сказал, что...») и источника информации («И вдруг вижу: мальчик идет») соответственно. Здесь необходимо упомянуть, что в первом случае ядром является ЭДЕ, содержащая глагол мысли/речи, так как именно речевое действие СКАЗАЛ, ОТВЕТИЛ и т.п. является частью последовательности событий нарратива. Во втором случае ядром является событие, указанное в сентенциальном актанте (как более существенное для развития сюжета), а источник информации (вижу, слышу) выносится в сателлит.
- Отношение Фальстарт, описывающее речевые сбои.
- Отношение Невербальная Реакция, описывающее невербальную реакцию на вербальное событие (указание на жесты и проч.).
Таким образом, к исходному набору из 27 отношений прибавлено еще 20 (впрочем, надо отметить, что к наиболее разработанной Манном и Томпсон группе отношений, описывающих собственно логико-семантическую связь утверждений и событий, добавлено всего 3 — Содержание, Источник и Невербальная Реакция — а остальные 17 описывают коммуникативные связи и оформительные компоненты структуры дискурса, которым Манн и Томпсон уделяли мало внимания).
Приведенный здесь набор связей является, с нашей точки зрения, базовым, т.е. необходимым и достаточным для приемлемо адекватного описания дискурсивной структуры. При этом он принципиально не является закрытым, и его можно расширять в случае необходимости различения более тонких оттенков смысла.
Описание структуры дискурса подобным образом дает возможность, во-первых, сравнительного описания различных дискурсов или типов дискурсов с точки зрения наличия в них определенных отношений, групп отношений или типовых фрагментов структуры; во-вторых, введения некоторых количественных характеристик структуры дискурса, основанных на древовидности получающегося графа (таких, как, например, глубина ветвления — абсолютная и относительно объема дискурса в ЭДЕ).
Что касается предварительных результатов проводимого исследования, можно упомянуть следующие полученные данные. Уточним, что данные могут различаться в зависимости от возраста детей. В статистическом исследовании рассматривались младшая группа (8-11 лет) и средняя (12-14 лет).
- Объем текста в ЭДЕ у детей с неврозами приблизительно в 2 раза больше, чем у здоровых детей (во всех возрастных группах).
- Значения максимальной глубины текста (т.е. длины самой длинной ветви дерева) по-разному варьируются у здоровых и больных детей.
ГЛУБИНА |
младшая группа |
старшая группа |
||
(значение) |
здоровые |
больные |
здоровые |
больные |
минимальное |
3 |
3 |
3 |
3 |
максимальное |
7 |
9 |
7 |
13 |
среднее по выборке |
4,12 |
5,81 |
4,50 |
7,53 |
- Представленность некоторых отношений также сильно отличается. Например, дети с неврозами используют отношение Контраст приблизительно в 3-4 раза чаще, чем здоровые дети, отношения Неволитивная Причина и Результат — в 2-3 раза чаще, Повтор и Переформулировка — в 2-3 раза чаще. Также дети с неврозами гораздо чаще обращаются к событиям действительности при истолковании своих сновидений, используя отношение Фон.
Опыт применения Теории Риторической структуры для описания дискурсов различных типов (устного и письменного, прозаического и поэтического, монологического и диалогического, художественного и научного) показывает, что эта теория является достаточно вариативной, чтобы ее можно было назвать универсальной, то есть применимой к дискурсам различного типа.
ЛИТЕРАТУРА
- (Кибрик, Плунгян, 1997) А.А. Кибрик, В. А. Плунгян. Функционализм. // Фундаментальные направления современной американской лингвистики, изд. МГУ, 1997. 276-339.
- (Корабельникова, 1997) Сновидения при невротических расстройствах у детей и подростков (автореферат диссертации кандидата медицинских наук). М., 1997.
- (Fox, 1987) Barbara Fox. Discourse structure and anaphora in written and conversational English. Cambridge: Cambridge University Press, 1987.
- (Mann, Matthiessen, Thompson, 1992) William Mann, Christian Matthiessen, and Sandra A. Thompson. Rhetorical structure theory and text analysis. // Discourse Description. Amsterdam: Benjamins, 1992; 39-78.
- (Mann, Thompson 1987) William Mann, and Sandra A. Thompson. Rhetorical structure theory: A theory of text organization. University of Southern California, 1987.
- (Mann, Thompson 1989) William Mann, Christian Matthiessen, and Sandra A. Thompson. Rhetorical structure theory and text analysis. University of Southern California, 1989.
[1] Кроме редких случаев непроективности, вызванной, например, вставочными конструкциями.
[2] В данной работе мы будем использовать в основном русские термины, чтобы сделать текст более понятным и избежать необходимости постоянно обращаться к общему списку связей. Тем не менее, желательно избегать всякого рода коннотаций, присущих русским терминам, и не присущих английским. В риторических схемах используются английские названия.
[3] Например, эмотивные глаголы (типа радоваться, что/когда...) представляют собой отдельную проблему, которая на данный момент не имеет окончательного решения.