Сборник 2001

Некоторые проблемы выбора эквивалентов для японских глаголов

при японско-русском автоматическом переводе

 

А.C. Панина

Институт востоковедения РАН

 

 

 

Выбор переводного эквивалента при автоматическом переводе представляет трудность даже для родственных языков; когда же входной и выходной языки типологически и генетически удалены друг от друга настолько сильно, как японский и русский, эта задача становится особенно сложной.

Прежде всего возникает неизбежная проблема выбора эквивалента, относящегося к нужной предметной области. Самый очевидный способ ее решения – изначально исходить из определенной предметной области, по возможности максимально ограниченной, и не рассматривать значений, которые к ней не относятся. Систему, предназначенную для перевода японских математических текстов, никто не упрекнет, если для глагола вару в ее словаре будет только перевод «делить», а не «разбивать», не говоря уже о значении «разбавлять алкогольный напиток».

Возможное решение также – ориентироваться по другим словам, встречающимся в том же тексте: в окружении лексики, связанной с фотосъемкой, японский глаголуцусу будет скорее значить «фотографировать», чем «смотреться (в зеркало)». Теоретически и этот, и предыдущий способ ненадежны, поскольку текст может не быть полностью однородным в отношении предметной области, и в том же фотографическом окружении может встретиться, скажем, сочетание сураидо о уцусу – «показывать (а не «фотографировать») диапозитивы». Практически же ограничение диапазона рассматриваемых значений как средство снятия «межотраслевой» неоднозначности применимо к японскому так же, как и к другим языкам.

В ряде случаев существенную помощь оказывает японская письменность, где некоторые многозначные и омонимичные лексемы записываются разными иероглифами в зависимости от значения. Иероглифическая запись позволяет однозначно различить не только аогу «смотреть снизу вверх» и «обмахивать» или ниру «варить» и «быть похожим», но и более тонкие случаи, такие как ау – «соответстововать», «встречаться» и «попадать в неприятную ситуацию». С другой стороны, по нескольку написаний есть не у всех слов – например, приведенный выше глагол вару в любом из своих значений пишется одинаково. Кроме того, иероглифы, вне зависимости от того, разные они или нет, используются далеко не всегда, по желанию автора, и часто уступают место слоговой азбуке, которая не способствует снятию неоднозначности.

Проблема выбора может вызываться также необходимостью конкретизировать перевод в случае, когда значение входной единицы шире, чем у любого из ее эквивалентов. Например, японский глагол каму обобщает смысл, разделенный в русском между словами «кусать» и «жевать»:

гохан о   еку      кандэ     табэнасаи

еда АКК  хорошо  кусать:дс  есть:импер - «Пережевывай еду как следует!»

хито    но  юби  о   намэоватта   ато    канарадзу  каму

человек ГЕН палец АКК долизать:зс.пв после обязательно кусать:зс.нв - «(Кошка) после того, как кончит лизать человеку пальцы, обязательно кусает»

Выбор между эквивалентами здесь тем более сложен, что описываемые ими ситуации достаточно близки. Опираться на тип субъекта (человек/животное, исходя из предположения, что люди не кусаются) возможно только когда субъект выражен, когда же он опущен, как в приведенных выше примерах, придется обратиться к прямому объекту (еда/не еда).

Если каму носит характер единичного примера, то некоторые различия, важные с точки зрения русского языка, в японском не отражаются довольно систематически. Так, значительная группа японских глаголов, в отличие от их русских эквивалентов, не делает различия для действий с жидкостями и предметами:

Маку:

дооро    ни  мидзу  о   маку

мостовая  в  вода  АКК  рассредоточить:зс.нв - «Полить мостовую водой»

мити   ни  суна   о     маку

дорога  в  песок  АКК  рассредоточить:зс.нв - «Посыпать дорогу песокм»

пууру   но     нака    ни  иси    я  боору  о   маку

бассейн ГЕН внутренность в  камень  и  мяч  АКК  рассредоточить:зс.нв – «Разбросать в бассейне камни и мячи»

Сутэру:

кусатта          мируку  о   сутэру

прокиснуть:ас.пв  молоко АКК выбросить:зс.нв – «Вылить прокисшее молоко»

гоми   о   сутэру

мусор АКК выбросить:зс.нв – «Выбросить мусор»

Могуру:

мидзу ни  могуру

вода  в   нырнуть:зс.нв – «Нырнуть в воду»

могура  га   цути  ни  могуру

крот  НОМ  земля  в  нырнуть:зс.нв – «Крот зарыватеся в землю»

цукуэ  но  сита  ни  могуру

стол  ГЕН  низ   в   нырнуть – «Забраться под стол»

Акэру:

набэ      но  мидзу о     нагаси  ни  акэру

кастрюля ГЕН  вода АКК  раковина  в  освободить:зс.нв - «Вылить воду из кастрюли в раковину»

кабан    но   наками   о    цукуэ но   уэ  ни акэру

портфель ГЕН содержимое АКК стол ГЕН  верх в  освободить – «Вытряхнуть содержимое портфеля на стол»

Коборэру и его каузатив кобосу:

оиру   га   коборэта

масло  НОМ пролиться:зс.пв – «Пролилось машинное масло»

пан-кудзу         га   коборэта

хлебная крошка  НОМ  пролиться:зс.пв – «Просыпались хлебные крошки»

Абиру и его каузатив абисэру:

мидзу о  абиру

вода АКК облиться:зс.пв – «Облиться (или «быть облитым») водой»

суна  о    абитэ     карада о  кирэи ни суру

песок АКК облиться:дс тело АКК чистый в делать:зс.нв – «Купаться в песке» (букв. «Делать тело чистым, осыпая себя песком»).

Кабуру и его каузатив кабусэру:

комугико о  кабуру

мука  АКК накрыться:зс.нв – «Быть осыпанным (сверху) мукой»

мидзу о   кабуру

вода АКК накрыться:зс.нв – «Быть облитым водой». Основное значение – «надевать головной убор»:

кацура/бооси о    кабуру

парик/шляпа АКК накрыться:зс.нв – «Надеть парик/шляпу».

Кроме разницы в объеме понятий между японским и русским, иногда не совпадает сам принцип их выделения. Примером может служить глагол сусуру, который значит «всасывать пищу» с факультативным компонентом «издавая звук», но при этом стилистически нейтрален и не несет отрицательной оценки:

соба  о    сусуру

лапша АКК всасывать:зс.нв – «Есть японскую лапшу»,

ацуи         о-тя  о     сусуру

горячий:ас.нв  чай  АКК  всасывать:зс.нв – «Прихлебывать горячий чай».

Отсутствие соответсвующей единицы в русском заставляет делать выбор между переводами «есть» и «пить».

Проблемы могут возникать и при более частном несовпадени значений, касающемся главным образом их коммуникативной организации. Так, японский глагол нуу«шить», употребляясь в значении починки, способен оформлять устраняемое повреждение как прямой объект. Его русский перевод «шить» не имеет такой диатезы, что заставляет в этом случае пользоваться другим эквивалентом:

сяцу    о    нуу

рубашка АКК шить:зс.нв – «Шить рубашку»

хокороби о   нуу

дырка  АКК шить:зс.нв – «Зашивать дырку»

Аналогично, прямым дополнением глагола хору «копать» может служить не только обрабатываемое вещество (суна/юки/цути о хору – «копать песок/снег/землю») и возникающее в результате место (икэ/ана о хору – «копать пруд/яму»), но и извлекаемый из земли объект. Иногда он удачно соответствует русскому аналогу: дзягаимо о хору– «копать картошку». Однако когда речь идет о полезных ископаемых, приходится использовать другой перевод: сэкитан/сэкиюу о хору – «добывать нефть/каменный уголь».

Межсловная сочетаемость и в русском, и в японском языке в значительной степени индивидуальна для каждой единицы, поэтому и правила выбора перевода неизбежно привлекают информацию самой разной степени общности, вплоть до индивидуальной. Так, глагол кэдзуру - «строгать/скоблить/резать», - переводится как «точить» в единственном сочетании: эмпицу о кэдзуру «точить карандаш».

Глагол осу – «прилагать усилие к предметам в направлении от себя», - может переводиться как «нажимать», когда это усилие прилагается в вертикальном направлении, и как «толкать», когда в горизонтильном; если сделать «толкать» переводом по умолчанию, случаи вертикального приложения силы в основном можно задать небольшими списками: ботан/кии/пэдару о осу – «нажимать кнопку/клавишу/педаль», сутанпу о осу – «ставить печать».

Значение глагола ному шире, чем у его русского эквивалента «пить», в нескольких отношениях. Во-первых, ному употребляется по отношению к супу, причем вне зависимости от использования инструмента:

суупу о  супуун  дэ    ному

суп  АКК ложка ИНСТР пить:зс.нв – «Есть суп ложкой».

Выбор перевода для этого сочетания может быть задан индивидуально. Во-вторых, данный глагол имеет также значение «глотать не жуя небольшие предметы». Эти употребления не очень многочисленны, поскольку главным выражением смысла «глотать» служит составной глагол номикому, однако образуются вполне свободно:

уккари     гому             о    нонда

случайно жевательная_резинка АКК  пить:зс.пв – «Случайно проглотил жевательную резинку»

хэби  га    каэру  о    ному

змея НОМ лягушка АКК  пить:зс.нв – «Змея глотает лягушку», и т.п.

Метонимические употребления типа «выпил две чашки» встречаются редко, однако при выборе эквивалента для ному на основании типа прямого объекта (жидкость/не жидкость) придется следить, чтобы не пострадал перевод гораздо более обычных предложений с эллипсисом:

гурасу  о    укэтоттэ   нонда

стакан АКК  принять:дс  пить:зс.пв – «Взял стакан и выпил»

По приведенным примерам видно, что правила выбора эквивалента, обращаясь к типам актантов, требуют выделения классов самого разного состава и степени абстрактности и склонны становиться довольно запутанными. Поэтому в некоторых случаях мыслим и способ, состоящий в том, чтобы не проводить конкретизации, а пользоваться, ценой некоторого ущерба для стиля выходного текста, приблизительным эквивалентом.

Скажем, глагол аогу «обмахивать» можно переводить как «раздувать», используя класс типа «костер/огонь/пламя...». Этот выбор можно делать при синтезе русского текста, сопоставив аогу в качестве эквивалента индивидуальную лексическую функцию, выражение которой уточняется в зависимости от русской лексемы-спутника. А можно  вовсе не делать выбора, используя компромиссный эквивалент, охватывающий оба случая, что даст неловкие, но относительно понятные сочетания «махать на (лицо/огонь)».

Целесообразность подобного решения в каждом случае должна определяться конкретной выгодой от такой экономии. Если для аогу потеря понятности очевидна, а выигрыш невелик, то для глагола ябуру преимуществ может оказаться больше: конкретизирующий перевод данного глагола ставит перед необходимостью учитывать, что по-русски стену пробивают, бумажную ширму или натянутый брезент прорывают, а окно и яичную скорлупу разбивают. Последний случай содержит и дополнительную неоднозначность – по-японски одним словом обозначаются не только яйца птиц, рептилий и насекомых, но и икра; одно и то же сочетание

тамаго но   кара     о     ябуру

яйцо ГЕН  оболочка АКК  разорвать:зс.нв

может, таким образом, соответствовать и переводу «разорвать оболочку икринки», и «разбить скорлупу яйца».

Во всех этих случаях можно воспользоваться общим переводом «проделать отверстие». По-видимому, это будет отвечать и японской языковой реальности, поскольку с точки зрения японского вышеперечисленные употребления обычно трактуются как одно значение данного глагола.

Конечно, такой перевод не сохранит стилистической нейтральности исходного текста: в русском языке использование абстрактного обозначения вместо частных является маркированным и может даже заставить предположить, что имеет место отклонение от стандартной ситуации – например, что окно не застеклено, а затянуто бумагой и т.п., чего нет в примерах с ябуру. Кроме того, проблема выбора эквивалента не будет решена полностью, поскольку все равно придется особо обрабатывать сочетания типа доа/каги о ябуру – «взломать дверь/замок», однако экономия налицо.

С другой стороны, подобный способ не всегда можно реализовать, поскольку наличие или отсутствие удачного приблизительного эквивалента настолько же индивидуально, как и наличие точного. Например, его нет для глагола хару, обозначающего, в частности, каузацию того класса ситуаций, к которым применяется ябуру:

гарасу  о    хару

стекло АКК натянуть:зс.нв – «Вставить стекло»

ками    о   хару

бумага АКК натянуть:зс.нв – «Натянуть бумагу»

тэнто    о  хару

палатка АКК натянуть:зс.нв – «Поставить палатку»

В качестве другого примера глагола с чрезвычайно широким значением можно привести цукуру – «изготовлять»:

фуку     о  цукуру

одежда АКК делать:зс.пв – «Шить одежду»,

асагохан  о    цукуру

завтрак  АКК делать:зс.нв – «Готовить завтрак»,

хикооки о    цукуру

самолет АКК делать:зс.нв – «Строить самолет»

Частота использования этого глагола чрезвычайно высока и не уступает употребительности более конкретных слов; для всех приведенных примеров именно цукуруявляется обычным, стилистически немаркированным способом передать соответствующий смысл.

Такая же повсеместная употребительность характерна и для глагола цукау – «использовать», - настолько абстрактного, что особый конкретизирующий перевод требуется едва ли не для каждого типа объекта:

сутикку-нори       о    цукау

клеющий_карандаш АКК  использовать:зс.нв – «Клеить клеющим карандашом»

эиго            о     цукау

английский_язык АКК  использовать:зс.нв – «Говорить по-английски»

наифу  то  фооку   о    цукау

нож    и  вилка  АКК  использовать:зс.нв – «Есть ножом и вилкой», и т.п.

Серьезность проблемы усугубляется тем, что во многих случаях имеет место не просто случайное несовпадение границ понятий в двух языках, а фундаментальное различие принципа распределения информации по фразе. Можно сказать, что для японского в целом свойственна тенденция к расчлененному выражению смыслов, которые по-русски обычно сосредотачиваются в одном слове.

Поскольку конструкции такого типа являются свободными, уточняющая часть в них может легко опускаться. Так, значение «сеять» стандартно передается сочетанием танэ о маку – «разбрасывать семена», однако при повторах могут возникать, например, фразы типа

аки   ни  маку                то...

осень  в  рассредоточить:зс.нв  если... – «Если сеять осенью»

Прямое дополнение, служащее опорой для выбора конкретизирующего перевода, не выражено, однако глагол все равно должен переводиться как «сеять». Принимая во внимание, что в том же тексте может встретиться, и также сократиться до сказуемого, и выражение типа

хатакэ ни комупосуто о    маку

поле  в  компост  АКК  рассредоточить:зс.нв – «Разбрасывать на поле компост»,

видно, насколько затруднительно обеспечить по-настоящему надежный выбор перевода.

Подобным же образом способ действия, заложенный во многих русских глаголах физического воздействия и каузации, по-японски часто передается при помощи аналитических конструкций; главный глагол в них имеет неспецифицированное значение, которое уточняется при помощи глагола с более конкретным смыслом, выступающего в деепричастной форме как обстоятельство образа действия:

яитэ   / цуцуитэ  /косуттэ   ана       о   акэру

жечь:дс /тыкать:дс /тереть:дс  отверстие АКК открыть - «Прожечь/проткнуть/протереть отверстие», букв. «Открыть отверстие жжением/тыканьем/трением»

вара    о   андэ       цукутта      каго

солома АКК  плести:дс  делать:ас.пв  корзинка – «Корзинка, сплетенная из соломы», букв. «Корзинка, которую изготовили, плетя солому»

или же просто указанием на инструмент:

дориру / хари дэ      ана     о    акэру

сверло / игла ИНСТР отверстие АКК  открыть – «Просверлить/проколоть отверстие»

Однако инструмент не обязательно принадлежит к центральным участникам ситуации и может оказаться не выражен. Так, для глагола кэсу с общим смыслом «каузировать исчезнуть» существуют применительно к изображениям, надписям и т.п. две возможности: «стереть» и «зачеркнуть». Обе эти ситуации описываются в японском расчлененно, либо с придаточным образа действия:

сэн    о     хиитэ     кэсу

линия АКК провести:дс  уничтожить – букв. «уничтожить, проведя линию»,

либо через уточнение инструмента:

кэсигому / боорупэн дэ   кэсу

ластик   / ручка  ИНСТР  уничтожить – букв. «уничтожить ластиком/шариковой ручкой».

Однако вполне нормально и употребление этого глагола без уточнения: аяматта дзи о кэсу - «стереть/зачеркнуть неправильный иероглиф», представляющее проблему не только для системы автоматического перевода, но и для человека.

Аналогично глагол вару, помимо соответствия русским «ломать», «разбивать» и «колоть» (маки о вару – «колоть дрова»), может в зависимости от инструмента означать также «резать», так что при некоторых видах объектов инструмент служит опорой для снятия неоднозначности:

суика о     хоотео / боо  дэ      вару

арбуз АКК  нож  / палка ИНСТР  расчленить – букв. «расчленить арбуз ножом/палкой».

Когда инструмент в подобной ситуации не выражен, выбор перевода человеком может иногда основываться на довольно косвенной информации, как в следующем примере:

коно  суика  о   муццу ни   варинасаи

этот  арбуз АКК  шесть  в   расчленить:импер – «Разрежь этот арбуз на шесть частей!»

Основанием, чтобы предпочесть «разрежь», служит тот факт, что при разрезании количество получаемых частей в норме контролируется деятелем, а при разбивании – нет, и, соответственно, не может быть содержанием приказа.

Столь же запутанную проблему представляет глагол катамэру – «уплотнять», которому часто соответствует перевод «лепить»:

нэндо    о  боору  но    ео      ни   катамэру

глина  АКК  шар  ГЕН  подобие  в   уплотнить - «слепить из глины шар».

Эти два глагола по-разному коммуникативно организуют обозначаемую ситуацию. Для катамэру, как для «уплотнить», важно вещество, с которым производится действие; именно оно оформляется как прямой объект, а конечное состояние если и выражается наряду с ним, то факультативно. Для «лепить» ситуация обратная («лепить шар», но не «*лепить глину»), поэтому употребление данного слова в переводе может требовать иногда достаточно нетривиальных преобразований:

юки о     тэ    дэ    катамэ,      ватаси ни  нагэта

снег АКК  рука ИНСТР уплотнить:сс  я    в   кинуть:зс.пв - букв. «Уплотнил снег руками и кинул в меня».

Пожалуй, единственным переводом на русский язык для данного сочетания является «слепил снежок». Однако смоделировать ведущие к такому выбору действия переводчика при помощи формальных средств представляется весьма затруднительным.

 

Таким образом, при автоматическом переводе глаголов с японского языка на русский, помимо обычных трудностей, связанных с индивидуальными особенностями сочетаемости отдельных лексем, приходится сталкиваться также с проблемой, которую представляют характерные для японского языка аналитические конструкции с использованием слов общего значения, требующие при переводе на русский однословного эквивалента.

Разница в значениях бывает настолько существенной, что избежать необходимости конкретизирующего перевода можно, только поставив стиль выходного русского текста на грань приемлемости. Однако поскольку конструкции такого рода в японском представляют собой свободные сочетания, и присутствие в них уточняющих компонентов в значительной мере факультативно, во многих случаях ближайшее окружение переводимого слова может не содержать достаточно информации для выбора конкретизирующего эквивалента.

 

Использованные грамматические сокращения:

АКК – показатель прямого дополнения

ас – атрибутивный статус глаголов и предикативных прилагательных

ГЕН – показатель генетива

дс – деепричастный статус глаголов

зс – заключительный статус глаголов

импер - императив

ИНСТР – показатель инструмента

нв – настоящее время

НОМ – показатель подлежащего

пв – прошедшее время

сс – срединный статус глаголов