Некоторые проблемы выбора эквивалентов для японских глаголов
при японско-русском автоматическом переводе
А.C. Панина
Институт востоковедения РАН
Выбор переводного эквивалента при автоматическом переводе представляет трудность даже для родственных языков; когда же входной и выходной языки типологически и генетически удалены друг от друга настолько сильно, как японский и русский, эта задача становится особенно сложной.
Прежде всего возникает неизбежная проблема выбора эквивалента, относящегося к нужной предметной области. Самый очевидный способ ее решения – изначально исходить из определенной предметной области, по возможности максимально ограниченной, и не рассматривать значений, которые к ней не относятся. Систему, предназначенную для перевода японских математических текстов, никто не упрекнет, если для глагола вару в ее словаре будет только перевод «делить», а не «разбивать», не говоря уже о значении «разбавлять алкогольный напиток».
Возможное решение также – ориентироваться по другим словам, встречающимся в том же тексте: в окружении лексики, связанной с фотосъемкой, японский глаголуцусу будет скорее значить «фотографировать», чем «смотреться (в зеркало)». Теоретически и этот, и предыдущий способ ненадежны, поскольку текст может не быть полностью однородным в отношении предметной области, и в том же фотографическом окружении может встретиться, скажем, сочетание сураидо о уцусу – «показывать (а не «фотографировать») диапозитивы». Практически же ограничение диапазона рассматриваемых значений как средство снятия «межотраслевой» неоднозначности применимо к японскому так же, как и к другим языкам.
В ряде случаев существенную помощь оказывает японская письменность, где некоторые многозначные и омонимичные лексемы записываются разными иероглифами в зависимости от значения. Иероглифическая запись позволяет однозначно различить не только аогу «смотреть снизу вверх» и «обмахивать» или ниру «варить» и «быть похожим», но и более тонкие случаи, такие как ау – «соответстововать», «встречаться» и «попадать в неприятную ситуацию». С другой стороны, по нескольку написаний есть не у всех слов – например, приведенный выше глагол вару в любом из своих значений пишется одинаково. Кроме того, иероглифы, вне зависимости от того, разные они или нет, используются далеко не всегда, по желанию автора, и часто уступают место слоговой азбуке, которая не способствует снятию неоднозначности.
Проблема выбора может вызываться также необходимостью конкретизировать перевод в случае, когда значение входной единицы шире, чем у любого из ее эквивалентов. Например, японский глагол каму обобщает смысл, разделенный в русском между словами «кусать» и «жевать»:
гохан о еку кандэ табэнасаи
еда АКК хорошо кусать:дс есть:импер - «Пережевывай еду как следует!»
хито но юби о намэоватта ато канарадзу каму
человек ГЕН палец АКК долизать:зс.пв после обязательно кусать:зс.нв - «(Кошка) после того, как кончит лизать человеку пальцы, обязательно кусает»
Выбор между эквивалентами здесь тем более сложен, что описываемые ими ситуации достаточно близки. Опираться на тип субъекта (человек/животное, исходя из предположения, что люди не кусаются) возможно только когда субъект выражен, когда же он опущен, как в приведенных выше примерах, придется обратиться к прямому объекту (еда/не еда).
Если каму носит характер единичного примера, то некоторые различия, важные с точки зрения русского языка, в японском не отражаются довольно систематически. Так, значительная группа японских глаголов, в отличие от их русских эквивалентов, не делает различия для действий с жидкостями и предметами:
Маку:
дооро ни мидзу о маку
мостовая в вода АКК рассредоточить:зс.нв - «Полить мостовую водой»
мити ни суна о маку
дорога в песок АКК рассредоточить:зс.нв - «Посыпать дорогу песокм»
пууру но нака ни иси я боору о маку
бассейн ГЕН внутренность в камень и мяч АКК рассредоточить:зс.нв – «Разбросать в бассейне камни и мячи»
Сутэру:
кусатта мируку о сутэру
прокиснуть:ас.пв молоко АКК выбросить:зс.нв – «Вылить прокисшее молоко»
гоми о сутэру
мусор АКК выбросить:зс.нв – «Выбросить мусор»
Могуру:
мидзу ни могуру
вода в нырнуть:зс.нв – «Нырнуть в воду»
могура га цути ни могуру
крот НОМ земля в нырнуть:зс.нв – «Крот зарыватеся в землю»
цукуэ но сита ни могуру
стол ГЕН низ в нырнуть – «Забраться под стол»
Акэру:
набэ но мидзу о нагаси ни акэру
кастрюля ГЕН вода АКК раковина в освободить:зс.нв - «Вылить воду из кастрюли в раковину»
кабан но наками о цукуэ но уэ ни акэру
портфель ГЕН содержимое АКК стол ГЕН верх в освободить – «Вытряхнуть содержимое портфеля на стол»
Коборэру и его каузатив кобосу:
оиру га коборэта
масло НОМ пролиться:зс.пв – «Пролилось машинное масло»
пан-кудзу га коборэта
хлебная крошка НОМ пролиться:зс.пв – «Просыпались хлебные крошки»
Абиру и его каузатив абисэру:
мидзу о абиру
вода АКК облиться:зс.пв – «Облиться (или «быть облитым») водой»
суна о абитэ карада о кирэи ни суру
песок АКК облиться:дс тело АКК чистый в делать:зс.нв – «Купаться в песке» (букв. «Делать тело чистым, осыпая себя песком»).
Кабуру и его каузатив кабусэру:
комугико о кабуру
мука АКК накрыться:зс.нв – «Быть осыпанным (сверху) мукой»
мидзу о кабуру
вода АКК накрыться:зс.нв – «Быть облитым водой». Основное значение – «надевать головной убор»:
кацура/бооси о кабуру
парик/шляпа АКК накрыться:зс.нв – «Надеть парик/шляпу».
Кроме разницы в объеме понятий между японским и русским, иногда не совпадает сам принцип их выделения. Примером может служить глагол сусуру, который значит «всасывать пищу» с факультативным компонентом «издавая звук», но при этом стилистически нейтрален и не несет отрицательной оценки:
соба о сусуру
лапша АКК всасывать:зс.нв – «Есть японскую лапшу»,
ацуи о-тя о сусуру
горячий:ас.нв чай АКК всасывать:зс.нв – «Прихлебывать горячий чай».
Отсутствие соответсвующей единицы в русском заставляет делать выбор между переводами «есть» и «пить».
Проблемы могут возникать и при более частном несовпадени значений, касающемся главным образом их коммуникативной организации. Так, японский глагол нуу«шить», употребляясь в значении починки, способен оформлять устраняемое повреждение как прямой объект. Его русский перевод «шить» не имеет такой диатезы, что заставляет в этом случае пользоваться другим эквивалентом:
сяцу о нуу
рубашка АКК шить:зс.нв – «Шить рубашку»
хокороби о нуу
дырка АКК шить:зс.нв – «Зашивать дырку»
Аналогично, прямым дополнением глагола хору «копать» может служить не только обрабатываемое вещество (суна/юки/цути о хору – «копать песок/снег/землю») и возникающее в результате место (икэ/ана о хору – «копать пруд/яму»), но и извлекаемый из земли объект. Иногда он удачно соответствует русскому аналогу: дзягаимо о хору– «копать картошку». Однако когда речь идет о полезных ископаемых, приходится использовать другой перевод: сэкитан/сэкиюу о хору – «добывать нефть/каменный уголь».
Межсловная сочетаемость и в русском, и в японском языке в значительной степени индивидуальна для каждой единицы, поэтому и правила выбора перевода неизбежно привлекают информацию самой разной степени общности, вплоть до индивидуальной. Так, глагол кэдзуру - «строгать/скоблить/резать», - переводится как «точить» в единственном сочетании: эмпицу о кэдзуру «точить карандаш».
Глагол осу – «прилагать усилие к предметам в направлении от себя», - может переводиться как «нажимать», когда это усилие прилагается в вертикальном направлении, и как «толкать», когда в горизонтильном; если сделать «толкать» переводом по умолчанию, случаи вертикального приложения силы в основном можно задать небольшими списками: ботан/кии/пэдару о осу – «нажимать кнопку/клавишу/педаль», сутанпу о осу – «ставить печать».
Значение глагола ному шире, чем у его русского эквивалента «пить», в нескольких отношениях. Во-первых, ному употребляется по отношению к супу, причем вне зависимости от использования инструмента:
суупу о супуун дэ ному
суп АКК ложка ИНСТР пить:зс.нв – «Есть суп ложкой».
Выбор перевода для этого сочетания может быть задан индивидуально. Во-вторых, данный глагол имеет также значение «глотать не жуя небольшие предметы». Эти употребления не очень многочисленны, поскольку главным выражением смысла «глотать» служит составной глагол номикому, однако образуются вполне свободно:
уккари гому о нонда
случайно жевательная_резинка АКК пить:зс.пв – «Случайно проглотил жевательную резинку»
хэби га каэру о ному
змея НОМ лягушка АКК пить:зс.нв – «Змея глотает лягушку», и т.п.
Метонимические употребления типа «выпил две чашки» встречаются редко, однако при выборе эквивалента для ному на основании типа прямого объекта (жидкость/не жидкость) придется следить, чтобы не пострадал перевод гораздо более обычных предложений с эллипсисом:
гурасу о укэтоттэ нонда
стакан АКК принять:дс пить:зс.пв – «Взял стакан и выпил»
По приведенным примерам видно, что правила выбора эквивалента, обращаясь к типам актантов, требуют выделения классов самого разного состава и степени абстрактности и склонны становиться довольно запутанными. Поэтому в некоторых случаях мыслим и способ, состоящий в том, чтобы не проводить конкретизации, а пользоваться, ценой некоторого ущерба для стиля выходного текста, приблизительным эквивалентом.
Скажем, глагол аогу «обмахивать» можно переводить как «раздувать», используя класс типа «костер/огонь/пламя...». Этот выбор можно делать при синтезе русского текста, сопоставив аогу в качестве эквивалента индивидуальную лексическую функцию, выражение которой уточняется в зависимости от русской лексемы-спутника. А можно вовсе не делать выбора, используя компромиссный эквивалент, охватывающий оба случая, что даст неловкие, но относительно понятные сочетания «махать на (лицо/огонь)».
Целесообразность подобного решения в каждом случае должна определяться конкретной выгодой от такой экономии. Если для аогу потеря понятности очевидна, а выигрыш невелик, то для глагола ябуру преимуществ может оказаться больше: конкретизирующий перевод данного глагола ставит перед необходимостью учитывать, что по-русски стену пробивают, бумажную ширму или натянутый брезент прорывают, а окно и яичную скорлупу разбивают. Последний случай содержит и дополнительную неоднозначность – по-японски одним словом обозначаются не только яйца птиц, рептилий и насекомых, но и икра; одно и то же сочетание
тамаго но кара о ябуру
яйцо ГЕН оболочка АКК разорвать:зс.нв
может, таким образом, соответствовать и переводу «разорвать оболочку икринки», и «разбить скорлупу яйца».
Во всех этих случаях можно воспользоваться общим переводом «проделать отверстие». По-видимому, это будет отвечать и японской языковой реальности, поскольку с точки зрения японского вышеперечисленные употребления обычно трактуются как одно значение данного глагола.
Конечно, такой перевод не сохранит стилистической нейтральности исходного текста: в русском языке использование абстрактного обозначения вместо частных является маркированным и может даже заставить предположить, что имеет место отклонение от стандартной ситуации – например, что окно не застеклено, а затянуто бумагой и т.п., чего нет в примерах с ябуру. Кроме того, проблема выбора эквивалента не будет решена полностью, поскольку все равно придется особо обрабатывать сочетания типа доа/каги о ябуру – «взломать дверь/замок», однако экономия налицо.
С другой стороны, подобный способ не всегда можно реализовать, поскольку наличие или отсутствие удачного приблизительного эквивалента настолько же индивидуально, как и наличие точного. Например, его нет для глагола хару, обозначающего, в частности, каузацию того класса ситуаций, к которым применяется ябуру:
гарасу о хару
стекло АКК натянуть:зс.нв – «Вставить стекло»
ками о хару
бумага АКК натянуть:зс.нв – «Натянуть бумагу»
тэнто о хару
палатка АКК натянуть:зс.нв – «Поставить палатку»
В качестве другого примера глагола с чрезвычайно широким значением можно привести цукуру – «изготовлять»:
фуку о цукуру
одежда АКК делать:зс.пв – «Шить одежду»,
асагохан о цукуру
завтрак АКК делать:зс.нв – «Готовить завтрак»,
хикооки о цукуру
самолет АКК делать:зс.нв – «Строить самолет»
Частота использования этого глагола чрезвычайно высока и не уступает употребительности более конкретных слов; для всех приведенных примеров именно цукуруявляется обычным, стилистически немаркированным способом передать соответствующий смысл.
Такая же повсеместная употребительность характерна и для глагола цукау – «использовать», - настолько абстрактного, что особый конкретизирующий перевод требуется едва ли не для каждого типа объекта:
сутикку-нори о цукау
клеющий_карандаш АКК использовать:зс.нв – «Клеить клеющим карандашом»
эиго о цукау
английский_язык АКК использовать:зс.нв – «Говорить по-английски»
наифу то фооку о цукау
нож и вилка АКК использовать:зс.нв – «Есть ножом и вилкой», и т.п.
Серьезность проблемы усугубляется тем, что во многих случаях имеет место не просто случайное несовпадение границ понятий в двух языках, а фундаментальное различие принципа распределения информации по фразе. Можно сказать, что для японского в целом свойственна тенденция к расчлененному выражению смыслов, которые по-русски обычно сосредотачиваются в одном слове.
Поскольку конструкции такого типа являются свободными, уточняющая часть в них может легко опускаться. Так, значение «сеять» стандартно передается сочетанием танэ о маку – «разбрасывать семена», однако при повторах могут возникать, например, фразы типа
аки ни маку то...
осень в рассредоточить:зс.нв если... – «Если сеять осенью»
Прямое дополнение, служащее опорой для выбора конкретизирующего перевода, не выражено, однако глагол все равно должен переводиться как «сеять». Принимая во внимание, что в том же тексте может встретиться, и также сократиться до сказуемого, и выражение типа
хатакэ ни комупосуто о маку
поле в компост АКК рассредоточить:зс.нв – «Разбрасывать на поле компост»,
видно, насколько затруднительно обеспечить по-настоящему надежный выбор перевода.
Подобным же образом способ действия, заложенный во многих русских глаголах физического воздействия и каузации, по-японски часто передается при помощи аналитических конструкций; главный глагол в них имеет неспецифицированное значение, которое уточняется при помощи глагола с более конкретным смыслом, выступающего в деепричастной форме как обстоятельство образа действия:
яитэ / цуцуитэ /косуттэ ана о акэру
жечь:дс /тыкать:дс /тереть:дс отверстие АКК открыть - «Прожечь/проткнуть/протереть отверстие», букв. «Открыть отверстие жжением/тыканьем/трением»
вара о андэ цукутта каго
солома АКК плести:дс делать:ас.пв корзинка – «Корзинка, сплетенная из соломы», букв. «Корзинка, которую изготовили, плетя солому»
или же просто указанием на инструмент:
дориру / хари дэ ана о акэру
сверло / игла ИНСТР отверстие АКК открыть – «Просверлить/проколоть отверстие»
Однако инструмент не обязательно принадлежит к центральным участникам ситуации и может оказаться не выражен. Так, для глагола кэсу с общим смыслом «каузировать исчезнуть» существуют применительно к изображениям, надписям и т.п. две возможности: «стереть» и «зачеркнуть». Обе эти ситуации описываются в японском расчлененно, либо с придаточным образа действия:
сэн о хиитэ кэсу
линия АКК провести:дс уничтожить – букв. «уничтожить, проведя линию»,
либо через уточнение инструмента:
кэсигому / боорупэн дэ кэсу
ластик / ручка ИНСТР уничтожить – букв. «уничтожить ластиком/шариковой ручкой».
Однако вполне нормально и употребление этого глагола без уточнения: аяматта дзи о кэсу - «стереть/зачеркнуть неправильный иероглиф», представляющее проблему не только для системы автоматического перевода, но и для человека.
Аналогично глагол вару, помимо соответствия русским «ломать», «разбивать» и «колоть» (маки о вару – «колоть дрова»), может в зависимости от инструмента означать также «резать», так что при некоторых видах объектов инструмент служит опорой для снятия неоднозначности:
суика о хоотео / боо дэ вару
арбуз АКК нож / палка ИНСТР расчленить – букв. «расчленить арбуз ножом/палкой».
Когда инструмент в подобной ситуации не выражен, выбор перевода человеком может иногда основываться на довольно косвенной информации, как в следующем примере:
коно суика о муццу ни варинасаи
этот арбуз АКК шесть в расчленить:импер – «Разрежь этот арбуз на шесть частей!»
Основанием, чтобы предпочесть «разрежь», служит тот факт, что при разрезании количество получаемых частей в норме контролируется деятелем, а при разбивании – нет, и, соответственно, не может быть содержанием приказа.
Столь же запутанную проблему представляет глагол катамэру – «уплотнять», которому часто соответствует перевод «лепить»:
нэндо о боору но ео ни катамэру
глина АКК шар ГЕН подобие в уплотнить - «слепить из глины шар».
Эти два глагола по-разному коммуникативно организуют обозначаемую ситуацию. Для катамэру, как для «уплотнить», важно вещество, с которым производится действие; именно оно оформляется как прямой объект, а конечное состояние если и выражается наряду с ним, то факультативно. Для «лепить» ситуация обратная («лепить шар», но не «*лепить глину»), поэтому употребление данного слова в переводе может требовать иногда достаточно нетривиальных преобразований:
юки о тэ дэ катамэ, ватаси ни нагэта
снег АКК рука ИНСТР уплотнить:сс я в кинуть:зс.пв - букв. «Уплотнил снег руками и кинул в меня».
Пожалуй, единственным переводом на русский язык для данного сочетания является «слепил снежок». Однако смоделировать ведущие к такому выбору действия переводчика при помощи формальных средств представляется весьма затруднительным.
Таким образом, при автоматическом переводе глаголов с японского языка на русский, помимо обычных трудностей, связанных с индивидуальными особенностями сочетаемости отдельных лексем, приходится сталкиваться также с проблемой, которую представляют характерные для японского языка аналитические конструкции с использованием слов общего значения, требующие при переводе на русский однословного эквивалента.
Разница в значениях бывает настолько существенной, что избежать необходимости конкретизирующего перевода можно, только поставив стиль выходного русского текста на грань приемлемости. Однако поскольку конструкции такого рода в японском представляют собой свободные сочетания, и присутствие в них уточняющих компонентов в значительной мере факультативно, во многих случаях ближайшее окружение переводимого слова может не содержать достаточно информации для выбора конкретизирующего эквивалента.
Использованные грамматические сокращения:
АКК – показатель прямого дополнения
ас – атрибутивный статус глаголов и предикативных прилагательных
ГЕН – показатель генетива
дс – деепричастный статус глаголов
зс – заключительный статус глаголов
импер - императив
ИНСТР – показатель инструмента
нв – настоящее время
НОМ – показатель подлежащего
пв – прошедшее время
сс – срединный статус глаголов