Кибрик А.А. (kibrik@comtv.ru)
Институт языкознания РАН,
Кодзасов С.В. (sankod@yandex.ru), Худякова М.В. (mariya.kh@gmail.com)
Московский государственный университет им. М.В. Ломоносова
В книге Кибрик и Подлесская (ред.) 2009 была предложена система просодически ориентированной дискурсивной транскрипции для устной русской речи. В докладе предлагается ряд расширений к транскрипции, в том числе различие между выделительными и тональными акцентами, более подробная разметка тональных акцентов, интервал движения тона в акценте, динамическое раздвоение гласных и др.
1. Вводные замечания
В настоящее время очень актуальна проблема создания корпусов устной речи. Все больше распространяется точка зрения о том, что ограничение языкового материала лишь письменным текстом не дает возможности сформировать адекватные представления о естественном языке. При этом устная речь не может исследоваться «как таковая», лишь в виде звукового сигнала. Для ее объективного и подробного анализа необходима репрезентация в графическом виде. Такую репрезентацию обычно называют дискурсивной транскрипцией (Du Bois et al. 1992; Edwards 2001).
В книге Кибрик и Подлесская (ред.) 2009 (ниже – К&П2009) была предложена система транскрибирования устного дискурса для русского языка. Эта система ориентирована на то, чтобы специально подготовленные транскрайберы могли последовательно и надежно транскрибировать исходный дискурс в звуковой форме. Более краткое и предварительное описание этой системы содержится также в статье Кибрик и Подлесская 2003.
2. Транскрипционная система К&П2009
Система транскрипции К&П2009 не является чисто просодической или тем более фонетической. Ее целью была репрезентация основных аспектов устного дискурса, в том числе дискурсивной семантики (в частности, иллокутивные и фазовые значения). Однако просодический компонент занимает в этой системе большое место. Основные просодические компоненты, отражаемые в данной системе, следующие:
· паузы, в том числе абсолютные и заполненные, а также их длительность
· акценты
· тоны в акцентах
· некоторые дискурсивно значимые движения тона за пределами акцентов
· сегментные нелексические явления (смычки, придыхание)
· удлиненная реализация фонем
· тональный регистр
· темп произнесения
· фонетическая редукция
· эмфатическая просодия
Необходимо отметить очень важный принцип дискурсивной транскрипции К&П2009. Эта транскрипция отражает локальную дискурсивную структуру, которая носит квантованный характер. Дискурс порождается в виде последовательность квантов, или шагов – так называемых элементарных дискурсивных единиц (ЭДЕ). ЭДЕ идентифицируются транскрайбером главным образом на основе следующих просодических признаков:
· единый тональный контур
· наличие, как правило, одного главного акцента
· темповый паттерн: ускорение в начале, замедление к концу
· громкостный паттерн: громче в начале, тише к концу
· пограничная паузация
Эти признаки не являются обязательными и далеко не всегда присутствуют одновременно, но кумулятивно они определяют просодический прототип ЭДЕ.
В транскрипте ЭДЕ отображаются как отдельные строки.
3. Примеры транскриптов, созданных в соответствии с системой К&П2009
В книге К&П2009, помимо описания системы транскрибирования устного дискурса, содержится также корпус устной речи «Рассказы о сновидениях», полностью затранскрибированный на основе этой системы. Корпус состоит из 129 рассказов, общая длительность звучания – около 2 часов.
Приведем два рассказа из книги К&П2009, записанных при помощи этой транскрипционной системы. Отметим, что каждый рассказ в корпусе отражается в виде следующих компонентов:
· идентификационного кода, включающего инициалы рассказчика, указание на пол и возраст
· общее описание, в том числе длительность рассказа, просодическую характеристику и качество записи
· колонки с временнóй разметкой – время от начала рассказа до начала данной ЭДЕ
· колонки с номерами ЭДЕ в рамках рассказа
· колонки, содержащей транскрипционную запись ЭДЕ
· колонки комментариев.
034z АМ м 11 лет
Длительность рассказа 40.8 с.
Склонность к интонации многоточия. В первой половине рассказа фрикативное г.
Качество записи высокое. На заднем плане слышны голоса, визг.
0.0 |
1. |
>>/сон вот, |
Начало произнесения первой фонемы не попало в запись. |
0.3 |
2. |
когда я \потеря-ался. |
|
1.5 |
|
∙∙∙(0.9) Угу. |
Тихо. |
3.2 |
3. |
∙∙∙(0.5) Вотh-h я-а вышел из /дома, |
|
5.2 |
4. |
были-иh == |
|
5.5 |
5. |
∙∙(0.4) ээ(0.4) никого \не было –дома, |
|
7.3 |
6. |
мне оставили \ключи. |
|
8.4 |
7. |
∙∙∙∙(1.0) Я-а ∙∙(0.1) /погулял чуть-чуть, |
Внутри начальной паузы посторонний скрип. |
10.9 |
8. |
∙∙(0.4) /потом-м вот захотел /–е-есть... |
|
12.7 |
9. |
∙∙(0.4) пошёл /домой, |
|
13.7 |
10. |
там никого \не-е было... |
|
14.8 |
11. |
∙∙(0.4) /потом начал искать своих \роди-ителей... |
|
17.1 |
12. |
∙∙∙(0.5) потом ∙∙(0.2) /в-вышел ∙∙(0.1) ээ(0.2) ’из \подъезда, |
|
19.7 |
13. |
никого н-нигде \не-ет... |
|
21.0 |
14. |
∙∙∙(0.9) /о-обошёл вотh-h ∙∙(0.2) где-то пол-/–у-улицы... |
|
24.2 |
15. |
∙∙(0.2) никого \не было. |
|
25.2 |
16. |
∙∙∙(0.5) Потом я-а /испугался , |
|
27.1 |
17. |
∙∙∙(0.7) /побежал вот куда гла-а= \глаза глядят, |
В оборванном фрагменте гла-а= фрикативное г, далее во фрагменте глаза глядят оба раза смычное. |
29.9 |
18. |
∙∙(0.4) /вдруг увидел какого-то /мальчика, |
На увидел накладывается техническая помеха. В слове вдруг последнюю фонему произносит смычно. |
31.9 |
19. |
∙∙(0.1) я у него \спросил: |
|
33.1 |
20. |
∙∙(0.4) «/Где мои \родители?» |
|
34.4 |
21. |
∙∙∙(0.5) \Ну-у’, |
|
35.1 |
22. |
∙∙(0.2) он \сказал: |
Начало строки на фоне постороннего стука. |
35.9 |
23. |
∙∙∙(0.5) «\Возвращайся /домой¡, |
|
37.5 |
24. |
ты \увидишь их \–там.», |
|
38.5 |
25. |
∙∙(0.3) я вернулся /домой, |
|
39.7 |
26. |
и их-х \увидел. |
Тихо. Последний слог — шепотом. |
084n ДК м 11 лет
Длительность рассказа 58.2 с.
В паузах часто шумные вдохи. В конце рассказа слышно, что у рассказчика насморк. Часто встречается скрипучий голос. Отчетливая артикуляция и просодия. Не выговаривает твердое р.
Качество записи высокое.
0.0 |
1. |
Я-а ∙∙∙(0.7) ’’(0.1) у своего /\дру-уга, |
На первые три слова накладывается техническая помеха. Слово друга произносит как дыруга. |
2.7 |
2. |
∙∙∙(0.5) т-там ∙∙(0.1) ээ(0.2) наш /дом ∙∙(0.1) отрем-м= || ре-е= || ∙∙(0.2) на \ремонт \поста-авили. |
Заполненная пауза и фрагмент ре-е — скрипучим голосом. |
7.9 |
3. |
∙∙∙(0.8) И-и /–всех ∙∙(0.2) /\переслали ээ(0.1) в другой \дом, |
Несколько слогов на протяжении этой строки произносит скрипучим голосом. |
12.0 |
4. |
∙∙(0.4) какой-то /\гря-азный... |
Удлиненный слог — со скрипом. В этой и двух следующих строках говорит с отвращением. |
13.6 |
5. |
/\се-ерый... |
|
14.4 |
6. |
∙∙∙(0.7) там /–ле-естница побитая... |
|
16.8 |
7. |
∙∙∙∙(1.1) И вот там ещё моя \мама ~ |
|
19.7 |
8. |
∙∙∙(0.5) {ЧМОКАНЬЕ 0.2} эээ(0.8) ∙∙∙∙(1.2) И-и /\мы-ы’ ∙∙∙(0.5) /гулять собра́лись, |
|
24.9 |
9. |
∙∙(0.4) а я /\куртку /забыл одеть, |
На слове одеть слышен тихий стук. |
27.1 |
10. |
а мой друг /\выбежал, |
|
28.2 |
11. |
<ему показали> |
|
28.6 |
12. |
∙∙(0.4) /\музыка неприятная , |
|
30.1 |
13. |
на площадке какие-то /\пья-аницы были... |
|
32.4 |
14. |
∙∙∙∙(1.4) И я /\испуга-ался, |
Фрагмент и я — скрипучим голосом. |
35.3 |
15. |
∙∙∙(0.9) и-и там-м ∙∙(0.1) так и-и ос= ∙∙∙(0.6) =–тался там-м, |
Слог тал — скрипучим голосом. |
39.6 |
16. |
∙∙∙(0.6) {ШМЫГАНЬЕ 0.3} ’’(0.2) пытался /–две-ерь запереть к парадному там... |
Слово дверь произносит со смехом. |
43.4 |
17. |
∙∙∙∙(1.0) (Не \запиралась.) |
Тихо. |
45.0 |
18. |
потом ∙∙(0.4) в зв= в /–звоно-ок звонил... |
Первое слово — тихо. |
47.5 |
19. |
(Никто не /–открывал...) |
|
48.9 |
20. |
{ШМЫГАНЬЕ 0.5} ∙∙∙(0.9) {ЧМОКАНЬЕ 0.4} потом там ∙∙∙(0.6) ээ(0.3) \ещё громче музыку /включили, |
|
54.2 |
21. |
∙∙(0.3) и я \просну-улся. |
В этой и следующей строке есть акценты на первом безударном слоге акцентированных слов. |
55.8 |
22. |
∙∙(0.4) И /больше вот \ничего не помню. |
Слово ничего произносит по слогам. |
4. Возможные расширения просодического компонента транскрипции
Не существует никакого объективно заданного набора признаков, которые должны отражаться в дискурсивной транскрипции. Каждая система транскрипции имеет тот уровень детализации, который соответствует исследовательским целям ее авторов. Кроме того, каждая такая система всегда является прагматичным компромиссом. С одной стороны, полнота и подробность – это плюс. С другой стороны, чем более подробна транскрипция, тем больше она содержит различных конвенций и обозначений и тем труднее читается. Кроме того, увеличение степени подробности всегда означает увеличение трудо- и времязатрат. В транскрипционной системе К&П2009 имеется определенный баланс между этими противонаправленными критериями. В целом, эта система была ориентирована на описание локальной дискурсивной структуры, а не собственно фонетики устной речи.
Тем не менее, существует целый ряд направлений, в которых эта транскрипционная система может быть расширена и углублена. Опираясь на работы Кодзасов1996, Кодзасов 2009, Кодзасов и др. 2008, в данном докладе мы предлагаем несколько расширений системы К&П2009. Большинство из них касаются акцентных признаков; возможность некоторых из этих расширений была указана уже в Кибрик и Подлесская (ред.) 2009, раздел 4.5.4. В первую очередь, в отличие от К&П2009, мы различаем два типа акцентов – выделительные и тональные.
4.1 Выделительные акценты
Артикуляционно выделительные акценты представляют собой дыхательные толчки, сопровождающие ударные слоги некоторых слов, входящих в ЭДЕ. Просодическая роль выделительных акцентов — создание ритмической схемы высказывания. В расширенном варианте транскрипции выделительный акцент обозначается символом * перед словом, на которое он падает. Например:
(1) 034z
5.5 |
5. |
∙∙(0.4) ээ(0.4) *никого/ не\ было *до(2)ма, |
Выделительный акцент не обязательно предполагает изменение тона – ср., например, акцент на ударном слоге слова дома в (1). Чаще всего, однако, выделительные акценты одновременно являются тональными (о них см. ниже); такое сочетание имеет место в слове никого в примере (1).
4.2 Тональные акценты
Тональные акценты представляют собой отклонения от некоторого базового уровня тона. Тональные акценты размечены в К&П2009, однако лишь для ударных слогов слов. Между тем, тональные акценты не всегда привязаны к ударному слогу; кроме того, тональных акцентов в слове может быть более одного. Поэтому в расширенном варианте транскрипции знаки тональных акцентов (/, \ и др.) пишутся не перед словом, а после той фонемы, на которой размещено значимое движение тона.
Чаще всего, конечно, падение или повышение тона происходит в пределах ударного слога, см. пример (2):
(2) 084n
16.8 |
7. |
∙∙∙∙(1.1) И вот та/м ещё/ моя *ма\ма ~ |
Однако достаточно часто оно бывает не локализовано или происходит на целом слове или группе слов, см. комментарий о падении тона в слове ремонт в строке 2 рассказа 084n в разделе 5 ниже. Особый интерес представляют случаи, когда тональный акцент размещен на предударном слоге, как, например, на первом слоге слова собра́лись в (3):
(3) 084n
19.7 |
8. |
∙∙∙(0.5) {ЧМОКАНЬЕ 0.2} эээ(0.8) ∙∙∙∙(1.2) И-и/– (2) мы-ы/\(2)’ ∙∙∙(0.5) *гуля//(2)ть со\бра́(2)лись, |
4.3. Интервалы изменения тона
В расширенном варианте транскрипции была введена градация интервалов движения тона в тональных акцентах. Изменения могут быть средние (примерно от 1/2 до 2/3 октавы), большие (порядка 1 октавы) и малые (порядка 1/3 октавы). Соответствующие обозначения для изменений тона (восходящий и нисходящий соответственно):
· средние /, \
· большие //, \\
·
малые /,
\.
Ровный тон (–) обозначается, если он входит в состав тонального комплекса с раздвоением гласной, см. ниже.
4.4 Динамическое раздвоение гласных
Динамическое раздвоение гласных — это распадение звуковой волны гласного на два компонента по амплитуде. Раздвоение обозначается символом (2) после соответствующей гласной (и после знака тонального акцента, если он имеется). Это явление широко представлено в спонтанной устной речи. Так, в следующем примере представлено три таких случая в одной ЭДЕ:
(4) 084n
7.9 |
3. |
∙∙∙(0.8) И-и/–(2) *все/–(2)х ∙∙(0.2) пересла/ли\ ээ(0.1) в друго/й *до\(2)м, |
5. Транскрипты, оформленные на основе расширенной просодической транскрипции
Ниже представлены транскрипты тех же двух рассказов из корпуса «Рассказы о сновидениях», которые были приведены выше в соответствии с системой К&П2009. Здесь транскрипты реализованы согласно расширениям, описанным в разделе 4. Несколько дополнительных признаков, таких как степень раствора рта, размечены в колонке комментариев. Попутно с внесением расширений в транскрипте были исправлены несколько неточностей, замеченных в предыдущем варианте. Читатель может самостоятельно сравнить два варианта транскрипта.
034z АМ м 11 лет
Длительность рассказа 40.8 с.
Склонность к интонации многоточия. В первой половине рассказа фрикативное г.
Качество записи высокое. На заднем плане слышны голоса, визг.
0.0 |
1. |
>>*сон во\(2)т, |
Начало произнесения первой фонемы не попало в запись. |
0.3 |
2. |
*когда я *потеря-а\(2)лся. |
|
1.5 |
|
∙∙∙(0.9) Угу. |
Тихо. |
3.2 |
3. |
∙∙∙(0.5) Во/тh-h я-а вы/\шел из до/ма, |
|
5.2 |
4. |
бы |
|
5.5 |
5. |
∙∙(0.4) ээ(0.4) *никого/ не\ было *до(2)ма, |
|
7.3 |
6. |
мне *оста\(2)вили *ключи\. |
|
8.4 |
7. |
∙∙∙∙(1.0) *Я-а/\(2) ∙∙(0.1) погуля/л чуть-чу\ть, |
Внутри начальной паузы посторонний скрип. |
10.9 |
8. |
∙∙(0.4) *пот/ом-м вот захоте\л *е-есть... |
|
12.7 |
9. |
∙∙(0.4)
пош/ё\л *домо |
|
13.7 |
10. |
та\м никого *не-е |
Слово там произносится с узким раствором рта. |
14.8 |
11. |
∙∙(0.4) по–т/о–м начал искать своих *роди-ителей... |
Деклинация тона на словах начал искать своих родителей. |
17.1 |
12. |
∙∙∙(0.5) потом
∙∙(0.2) *в-вы/шел
∙∙(0.1) ээ(0.2)
’и |
|
19.7 |
13. |
никого\ н-нигде\ не-е\т... |
|
21.0 |
14. |
∙∙∙(0.9) *о-обо/шё/л во\тh-h ∙∙(0.2) где\-то *пол‑у‑улицы\... |
|
24.2 |
15. |
∙∙(0.2) ни |
Деклинация тона. |
25.2 |
16. |
∙∙∙(0.5) Потом я-а *испуга/лся , |
|
27.1 |
17. |
∙∙∙(0.7) *побежа\л вот
куда гла-а= *глаза |
В оборванном фрагменте гла-а= фрикативное г, далее во фрагменте глаза глядят оба раза смычное. |
29.9 |
18. |
∙∙(0.4) *вдру/г увидел како\го-то *ма/льчика, |
На увидел накладывается техническая помеха. В слове вдруг последнюю фонему произносит смычно. |
31.9 |
19. |
∙∙(0.1) я у него *спроси |
|
33.1 |
20. |
∙∙(0.4) «*Где\ мои *роди |
|
34.4 |
21. |
∙∙∙(0.5) \Ну-у’\(2), |
|
35.1 |
22. |
∙∙(0.2) он *ска\зал: |
Начало строки на фоне постороннего стука. |
35.9 |
23. |
∙∙∙(0.5) «*Возвраща\йся *домо/й¡, |
|
37.5 |
24. |
ты *уви\дишь
их та |
|
38.5 |
25. |
∙∙(0.3)
я верну |
|
39.7 |
26. |
и их-х *уви\дел. |
Тихо. Последний слог — шепотом. |
084n ДК м 11 лет
Длительность рассказа 58.2 с.
В паузах часто шумные вдохи. В конце рассказа слышно, что у рассказчика насморк. Часто встречается скрипучий голос. Отчетливая артикуляция и просодия. Не выговаривает твердое р.
Качество записи высокое.
0.0 |
1. |
Я-а ∙∙∙(0.7) ’’(0.1) у своего *дру-у//га\, |
На первые три слова накладывается техническая помеха. Слово друга произносит как даруга. |
2.7 |
2. |
∙∙∙(0.5) т-там ∙∙(0.1) ээ(0.2) наш *до//м ∙∙(0.1) отрем‑м= || ре-е= || ∙∙(0.2) на/ *ремо\нт по\ста-авили. |
Заполненная пауза и фрагмент ре-е — скрипучим голосом. В слове ремонт падение тона не локализовано. В слове поставили упереднение ударного а. |
7.9 |
3. |
∙∙∙(0.8) И-и/–(2) *все/–(2)х ∙∙(0.2) пересла/ли\ ээ(0.1) в друго/й *до\(2)м, |
Несколько слогов на протяжении этой строки произносит скрипучим голосом. Слово дом — узкий раствор рта. |
12.0 |
4. |
∙∙(0.4) какой-то *гря-а |
Удлиненный слог — со скрипом. В этой и двух следующих строках говорит с отвращением. |
13.6 |
5. |
*се-е |
|
14.4 |
6. |
∙∙∙(0.7) там *ле-е/(2)стница поби |
|
16.8 |
7. |
∙∙∙∙(1.1) И вот та/м ещё/ моя *ма\ма ~ |
|
19.7 |
8. |
∙∙∙(0.5) {ЧМОКАНЬЕ 0.2} эээ(0.8) ∙∙∙∙(1.2) И-и/– (2) мы‑ы/\(2)’ ∙∙∙(0.5) *гуля//(2)ть со\бра́(2)лись, |
|
24.9 |
9. |
∙∙(0.4) а я/– *к/у\ртку *забы//л оде/(2)ть, |
На слове одеть слышен тихий стук. |
27.1 |
10. |
а мо/й дру–г *вы/б–е\жа/л, |
|
28.2 |
11. |
<ему показали> |
|
28.6 |
12. |
∙∙(0.4) *му//зы\ка неприя |
|
30.1 |
13. |
на площадке какие-то *пья-а/\ницы были... |
|
32.4 |
14. |
∙∙∙∙(1.4) И я *испуга-а/лся\, |
Фрагмент и я — скрипучим голосом. |
35.3 |
15. |
∙∙∙(0.9) и-и та/\м-м ∙∙(0.1) так и-и ос= ∙∙∙(0.6) =*тался там-м, |
Слог тал — скрипучим голосом. |
39.6 |
16. |
∙∙∙(0.6) {ШМЫГАНЬЕ 0.3} ’’(0.2) пытался *две-е/рь запереть к парадному там... |
Слово дверь произносит со смехом. |
43.4 |
17. |
∙∙∙∙(1.0) (Не запира |
Тихо. |
45.0 |
18. |
потом ∙∙(0.4) в зв= в *звоно-о/\(2)к звонил... |
Первое слово — тихо. |
47.5 |
19. |
(Никто |
|
48.9 |
20. |
{ШМЫГАНЬЕ 0.5} ∙∙∙(0.9) {ЧМОКАНЬЕ 0.4} потом
там ∙∙∙(0.6) ээ(0.3) \ещё\ гро\мче му\зыку *вклю |
|
54.2 |
21. |
∙∙(0.3) и\ я просну-у\(2)лся. |
В этой и следующей строке есть акценты на первом безударном слоге акцентированных слов. |
55.8 |
22. |
∙∙(0.4) И бо/–(2)льше во\т */ничего\ не по\мню. |
Слово ничего произносит по слогам. |
6. Заключительные замечания
В данном докладе предлагается ряд расширений к транскрипционной системе устной русской речи, описанной в книге Кибрик и Подлесская (ред.) 2009. Была добавлена разметка таких просодических параметров, как выделительные акценты, интервал движения тона, раздвоение гласных, была уточнена разметка тональных акцентов.
На дальнейших этапах мы предполагаем добавить в эту разметку такие параметры, как тайминг тональных акцентов, долготные акценты, типы фонаций и некоторые другие.
Литература
1. Кибрик А.А., Подлесская В.И. 2003. К созданию корпусов устной русской речи: принципы транскрибирования // Научно-техническая информация. Серия 2-6. С.5-11.
2. Кибрик А.А., Подлесская В.И. (ред.) 2009. Рассказы о сновидениях: Корпусное исследование устного русского дискурса. М.: ЯСК.
3. Кодзасов С.В. 1996. Комбинаторная модель фразовой просодии // Просодический строй русской речи. М.: Ин-т русского языка РАН. С.85-123.
4. Кодзасов С.В. 2009. Исследования в области русской просодии. М.: ЯСК.
5. Кодзасов С.В., Архипов А.В., Захаров Л.М., Кривнова О.Ф. 2008. База данных «Интонация русских информационных текстов» // Компьютерная лингвистика и интеллектуальные технологии. Вып. 7 (14). По материалам международной конференции «Диалог 2008». М.: ИППИ РАН. С.206-209.
6. Du Bois, J.W., Schuetze-Coburn, S., Cumming, S., Paolino, D. 1992. Discourse transcription // Santa Barbara Papers in Linguistics, 4. Santa Barbara: UCSB.
7. Edwards, J.A. 2001. The transcription of discourse. // D. Schiffrin, D. Tannen, H. Hamilton (eds.) The handbook of discourse analysis. Oxford: Blackwell. С.321-348.
[1] Данное исследование поддержано грантом РГНФ №08-04-00165а. Работа А.А.Кибрика также поддерживалась грантом Фонда поддержки отечественной науки.