AI翻訳を上手に活用するための3つの基本ルール

このシリーズでは、情報を「つかう」、「つたえる」という利⽤者の視点で、AI翻訳の活⽤を考えていきます。
これまでのAI翻訳に関する議論では、まず原⽂が存在し、翻訳担当者が原文を翻訳するという視点で論じられてきました。これは情報を提供する側の視点です。

多くの⼈がスマートフォンを利⽤する時代になりました。情報利⽤者が⾃⾝でスマートフォンに搭載されている翻訳機能を用いて、原文の言語を問わずに自在に情報を得ることを想定する必要がでてきました。情報は利⽤者が内容を理解して初めて⽬的を達成します。利⽤者が情報を必要に応じて理解可能な言語に変換し、適切に情報活⽤できるようにすることは、情報の価値を高めることに繋がります。そのためには、誤訳や訳抜けが発⽣しないように原⽂を書くことが必要になります。

これは決して難しいことではありません。以下の3つの基本的なルールを押さえることで対応できます。
この3つのルールはライティングでも基本的な決まりごとであり、⼈が翻訳するかNMTで翻訳するかに関わらず必要なものです。

目次

Rule 1. 論理的に、簡潔に、また正確に書く

普通にライティングするときも、翻訳するために原⽂を書くときも、まずこのルールを順守することが必要です。このルールを具体的に説明するために、「グライスの協調の原理」を紹介します。「グライスの協調の原理」とは、コミュニケーションを効率的に進めるために必要な要素(公理)を説明したものです。「グライスの協調の原理」は「量、質、関連性、⼿法の4つの公理」から成り⽴っています。

量: テキストの量が少なすぎれば、理解しにくくなります。かといってテキストの量が多すぎると、伝えたいことがテキストの中に隠されてしまいます。少なすぎず、多すぎず、伝えるために必要な適切な量のテキストが必要です。
質: テキストの内容が間違っていたり、その論理がでたらめであれば、適切に伝わりません。主語と述語を明快に書き、 ”who does what to whom” (誰が誰に何をするのか)などがすぐにわかるように簡潔に書きます。
関連性(コンテキスト): ⽂を書くときに、突然、それまでと関係のないことを書くと読者は⼾惑ってしまいます。論理にしてもストーリーにしても、前の⽂と関係のあることを書くことが重要です。
⼿法: 情報の種類によってそれぞれ効果的な伝達⽅法を使⽤します。

いずれの公理も当たり前の内容なので簡単なことのようですが、この公理を守れていない⽂をよく⾒かけます。守れていないと、翻訳するときも適切に翻訳されなくなります。どんな⽂でも翻訳できると強弁する⽅もいらっしゃるかもしれませんが、それは実際には不可能です。間違って翻訳されれば、なんとか翻訳できたとしても、相⼿には適切に伝わらなくなります。
上記の⼿法の3つについては、皆さんご納得いただけたと思います。もちろん、関連性(コンテキスト)についても誰も関係のない話はしないよとご理解いただけていることと思いますが、ところが、実際には必ずしも守られていないことがあります。読者の経験や知識のバックグラウンドを調べないままにライティングしたりしていませんか。または、そこまで⼤胆なことはしないにせよ、ちょっとした気配りが足りなかったりします。
以下の例をご覧ください。

■関連性(コンテキスト)を補完する
⼈間翻訳とAI翻訳の違いは、細かなコンテキストの流れに対応できるかどうかというところにあります。⼈間は⽂と⽂のつながりや⽂章全体の流れやトーン、つまりコンテキストや背景を把握し、それを各⽂の翻訳に反映させることができます(優秀な翻訳者の場合ですが)。しかし、AI翻訳はこれまでの機械翻訳(MT)と異なってAIなのだからとはいうものの、⽂単位での翻訳になりますので、⽂と⽂のつながりまでなかなか反映してくれることは難しいのです。たとえば、以下の⽂を見てください。

原⽂: You may be infected with Ebola hemorrhagic fever, no matter how cold the weather is.
Countries in the polar zone have reported cases of Ebola hemorrhagic fever.
AI翻訳結果: どんなに寒くても、エボラ出⾎熱に感染する可能性があります。 極地の国々は、エボラ出⾎熱の症例を報告しています。


翻訳結果の2つ⽬の⽂のつながりが少しぎこちなくなっています。1つ⽬の⽂で「どんなに寒くても」と⾔っておきながら、2つ⽬の⽂では当然のことのように寒冷地でのエボラ出⾎熱の症例について語っています。このように、AI翻訳はコンテキストを読めないので、⽂単位での翻訳になることを意識して原⽂を書くべきだということが確認できます。原⽂のCountries in the polar zoneというところは、Even with countries in the polar zone (極地の国々でさえも)としてあげる必要があります。

原⽂: You may be infected with Ebola hemorrhagic fever, no matter how cold the weather is. Even with countries in the polar zone have reported cases of Ebola hemorrhagic fever.
AI翻訳結果: どんなに寒くても、エボラ出⾎熱に感染する可能性があります。 極地の国々でも、エボラ出⾎熱の症例が報告されています。


こういったちょっとした気遣いをすることで、翻訳性能は向上します。こういった気遣いをpre-edit (プリエディット)と⾔います。翻訳したりNMTにかけたりする前に、⼈間の翻訳者でもNMTでも翻訳しにくそうなところを事前に修正しておくわけですね。

Rule 2. 言語に固有のメタファー(比喩)を避ける

基本ルールの2つ目は、「言語に固有のメタファー(比喩)を避ける」です。
2つの言語間でスムーズにコミュニケーションするためには、日本語/英語それぞれのネイティブにしかわからないメタファーを避ける必要があります。たとえば、以下の例文を見てみましょう。

例1:

原文:あの政治家は腹が黒い。
AI翻訳結果:That politician has a dark stomach.

原文の「腹が黒い」というメタファーは理解されず、日本語原文のままに直訳されています。日本語の原文を書き起こすときや翻訳する前に、日本語に固有なメタファーを言語間で共通で一般的な表現に置き換えておく必要があります。このことを、ローカリゼーションの世界では「Internationalization (I18n)」と呼びます。「Localization (L10n)」する前に、テキストをまず「一般化」するわけです。

例2:

修正原文:あの政治家は誠実ではない。
AI翻訳結果:That politician is not sincere.(政治家の場合はThat politician is not honest.のほうがしっくりするような気がしますが、これでもだいじょうぶだと思います。)

「一般化」した表現で文を書くことで、翻訳における不要な間違いを避けることができます。ところが、以下の例を見てください。以下の例文ではメタファーが適切に翻訳されています。なかなかやるな、NMTというところでしょうか。

例3:

原文:You can catch flu, no matter how you take care about your health.
AI翻訳結果:どんなに健康に気を付けても、インフルエンザにかかる。

この場合のcanは「能力」ではなく「その可能性がある」という意味を表します。catchはインフルエンザ菌を運悪くつかんでしまう→つまり、罹患してしまうというメタファーです。can catchで「罹患する可能性がある」ということになります。インフルエンザは病気としても一般的なので、このNMTツールは、すでにこのメタファーを学習しているものと思われます。ところが、特殊で難解な病名の場合は、NMTはそれを病名として認識しないので、以下のような珍訳が生じることになります。

例4:

原文:You can catch Ebola hemorrhagic fever, no matter how you take care about your health.
AI翻訳結果:どのように健康に気を配っていても、エボラ出血熱をキャッチすることができます。

このような珍訳を避けるためには、原文を、メタファーを含まないより一般的な表現に変える必要があります。can catchをmay be infected(感染する)と具体的にします。

例5:

修正原文:You may be infected with Ebola hemorrhagic fever, no matter how you take care about your health.
AI翻訳結果:どのように健康に気を配っていても、エボラ出血熱に感染する可能性があります。

これでNMTでも適切に翻訳できるようになります。言語に固有のメタファーを避けて、原文を「一般化」するよう心がけます。

<参考>すべてのメタファーがだめだというわけではない。
翻訳するときにメタファーを避けると申しあげましたが、避けるのは日本語/英語それぞれのネイティブにしかわからないものの場合だけです。日本語/英語で共通のメタファーも数多くあります。共通メタファーの多くは、幕末から明治にかけて英語などの文献から日本語に翻訳されたものです。
 幕末から明治にかけて多くの概念が日本語に翻訳されました。「科学」や「文化」、「論理」や「倫理」、「資本」や「左翼」といったそれまでの日本に存在しなかった概念や「一石二鳥」や「豚に真珠」などのことわざが日本語に翻訳されました。その中には「何が彼女をそうさせたか」といった、いわゆる無生物主語を使った文章表現技法などもありました。これは日本語に逐語翻訳されたものですが、同様に逐語的に翻訳されたメタファーもありました。

メタファーの例
日本文:我が道を行く。(人生を道に見立てる)
英文: I’m going my way.
日本文:人の海で自分を見失ってしまいました。(大勢の人を海に見立てる)
英文: I was lost in a sea of nameless faces.

メタファー生成の流れ — 素材から目標へ
素材[物理的につながれた関係] → 目標[近しい関係]

日本文:船がブイにつながれている。 → あの代議士は暴力団とつながっている。
英文:The ship is connected to the buoy. → That representative is connected to the gangsters.

メタファーに似たものにメトニミー(換喩)があります。メトニミーは素材に近いものに置き換えます。つまり、素材自体ではなく素材に関係のあるものに置き換えます。夏目漱石の「坊ちゃん」に出てくる教頭は「赤シャツ」ですよね。

メトニミーの例
日本文:やかんが沸いています。(沸いているのは「やかん」ではなくやかんの中の「水」)
英文: The kettle is boiling.

日本文:彼はBMWを運転しています。(運転しているのは「BMW」ではなくBMWの「車」)
英文:He drives a BMW.

このように、日本語原文でも英文でもメタファーやメトニミーは互いに似通っていたりします。また、英語のイディオムでも日本語としてもよく理解できるものもあります。たとえば、以下の例をご覧ください:

to come out of your shell 殻から出てくる → 社交的になる (← 殻に閉じこもる)
keep me posted 投稿し続けてね → 必ず連絡してね
hot off the press 印刷したばかり → 最新の (刷りたての)
すぐにわかるものばかりですね。

Rule 3. 和製英語や定着していないカタカナ用語は使用しない

日本語の中には、英語の原義から外れた和製英語があります。また、新たにカタカナ用語をつくりだすことを好む文化があります。和製英語を不用意に使うと誤訳が生じる原因になります。あるメーカーが自社の商品開発をオフショア化(海外の企業に委託開発)しようとして、開発仕様書に(良かれと思って)カタカナ用語を多用したところ、海外の委託先からほとんど理解してもらえなかったという笑えぬ笑い話があります。

実は、和製英語のような現象は日本語に限ったことではなく、ヨーロッパ言語などでも見られます。使用する際の注意を喚起する意図で、これらの用語はFalse friends(偽りの友)と呼ばれています。たとえば、スペイン語のrealizarは英語のrealizeではありません。realizarは英語ではcarry out(実行する)という意味になります。また、イタリア語のdisposizione(arrangement)は英語のdispositionとは完全には一致しません。

原文:部屋を畳からフローリングに替えた。
AI翻訳結果:I changed the room from tatami mats to flooring.

フローリングという言葉は和製英語です。翻訳結果では直訳になっています。英語で正しくはwooden floorと言います。
英語原文:I changed the room from tatami mats to wooden floor.
AI翻訳結果:部屋を畳からフローリングに変更しました。

英語から日本語への翻訳では、適切に和製英語に替えてくれています。以下にもう2例挙げます。
原文:社会からさまざまな財貨やサービスを受け入れて、それにプラスアルファを付けて社会に還元する。
AI翻訳結果:We accept various goods and services from society and give them back to society with a plus alpha.

プラスアルファは和製英語です。英語としてはsomething extraとかplus Xと言います。

英語原文:We accept various goods and services from society and give them back to society with something extra.
AI翻訳結果:さまざまな商品やサービスを社会から受け入れ、何か特別なものを社会に還元しています。

プラスアルファはsomething extraには置き換えられませんでしたし、英語のsomething extraはプラスアルファには置き換えられませんでした。このように、カタカナ用語を使うときは、注意が必要です。

原文:その会社は今年の春にハイビジョンテレビを売り出した。
AI翻訳結果:The company launched a high-definition television this spring.
AIリバース翻訳:同社は今春、高精細テレビを発売した。

「ハイビジョンテレビ」は和製英語です。日本語としては高精細度テレビと言います(しかし、この日本語はあまり使用されていないようですね)。翻訳結果ではhigh-definition televisionと英語として適切に翻訳されています。
このように新しい技術用語には和製英語が多く使われています。たとえば、リニアモーターカー=linear motor carは、英語圏ではmagrev trainと呼ばれています。

このように日本語には和製英語がたくさん使われているので注意が必要です。もちろん、NMTでもその違いは適切に置き換えてくれる場合もありますが、和製英語や定着していないカタカナ用語は、誤訳の原因となり得ますので、使用しないことが大事なポイントになります。

お問い合わせ

お気軽にお問い合わせください。
※株式会社情報システムエンジニアリングよりご案内させていただきます。

*)セールスに関してご返信はいたしませんので、あらかじめご了承ください。

個人情報の取り扱いについて

  • URLをコピーしました!
目次