MENU

情報を「つかう」「つたえる」視点で考えるAI翻訳活⽤法

株式会社エレクトロスイスジャパン 中村 哲三

情報を「つかう」「つたえる」視点で考えるAI翻訳活⽤法

株式会社エレクトロスイスジャパン
中村 哲三

情報を「つかう」「つたえる」視点で考えるAI翻訳活⽤法

[2021.10]日本語固有の助数詞は適切に翻訳できるか(第2回)

今回は、日本語固有の助数詞*の第2回目です。
前回は、日英、英日共に良い結果を得られたものを見ていきました(前回記事)。日常的によく使われるものですので、恐らくどの言語でも理解できそうな感じでした。さて、今回は「日英、英日共に結果が良くなかったもの」を取り上げます。
 日英の結果が駄目ですとそれに引っ張られて英日にも影響が出てくることになりそうですので、まず最初に、日英は良い結果だったが、英日が駄目だったものを紹介した後、日英、英日共に結果が良くなかったものを紹介いたします。

原文例を日英でAI翻訳にかけた後、それを英日で日本語に戻してみます。英日のリバース翻訳のプロセスで、適切に日本語の助数詞が翻訳されるかどうかを確認していきます。

日本語固有の助数詞は適切に翻訳できるか?(3回シリーズ)
第1回 日英、英日共に良い結果を得られたもの(2021.9公開
第2回 日英、英日共に結果が良くなかったもの (今回)
第3回 日英は良い結果で、英日が良くなかったもの (2021.11公開予定)

【ご案内】TCシンポジウム2021 on the Web 10月で発表します。
[KH03N]AI翻訳だからこそ、翻訳元の文に論理性が必要
~ツール特性を整理し、1次著作物制作でのAI翻訳活用を考える~

日時:10月6日(水) 13:30~14:30(60分)[聴講無料]
セッション概要:https://jtca-web.com/sessions/2021/4611/

10月の発表では、検証結果に基づいて、ツールを活用して実践していく方法をご案内いたします。

評価のレジェンド
◎ 問題なく翻訳できている
〇 なんとかクリアした
△ 助数詞が適切に翻訳できていない
× 翻訳できていない

*助数詞は、「豚3匹」などのように、ものの数を数えるときに数字の後に着けるもので「個」、「枚」、「回」、「組」などです。

■日英は良い結果だったが、英日は駄目だったもの

英日のリバース翻訳が良くなかったものです。翻訳結果はいずれもAI翻訳によるものです。

原文: 各自の演奏は5曲までとする。
◎ Each person can play up to 5 songs.
× お一人様5曲まで再生できます。

助数詞はクリアできたが、翻訳自体がまちがっていました。「play」には「演奏する」と「再生する」という意味があります。

原文: 桜の花が一枝添えられていた。
◎ A branch of cherry blossoms was attached.
× 桜の枝がついていました。

原文: 一筆啓上いたします。
◎ I will give you a brief message.
× 簡単なメッセージを差し上げます。

こういった漢語的表現も理解できましたが、英日リバース翻訳で、先ほどの「一缶」と同様に、「一筆」というわけにはいきませんでした。

原文: その負傷した兵士の腕には、七重八重に包帯が巻かれていました。
◎ The injured soldier’s arm was bandaged seven-fold and eight-fold.
× 負傷した兵士の腕は7倍と8倍に包帯を巻かれていました。

原文: 寄付は10口まででお願いします。
◎ Please donate up to 10 units.
× 10台まで寄付してください。

原文: 彼は、新居用にとタンスを一棹持参した。
◎ He brought a chest of drawers for his new home.
× 彼は新しい家のために箪笥を持ってきました。

原文: 八重桜の八重の花が満開になって、たいへんきれいです。八重桜の花言葉は「豊かな教養」です。
〇 The double flowers of the double cherry blossoms are in full bloom and are very beautiful. The flower language of Yae Sakura is “rich culture”.
× 八重咲きの八重咲きが満開でとても綺麗です。 さくら八重の花言葉は「豊かな文化」です。

原文: 彼は夕食用に、豆腐を6丁使ってマーボ豆腐をつくります。
〇 He uses 6 tofu to make marbo tofu for dinner.
× 彼は6豆腐を使って夕食にマルボ豆腐を作っています。

原文: 彼女は、ビールを5本とも一気に飲んでしまいました。
◎ She drank all five beers at once.  five bottles of beerの意味と解釈しているようなのでOK
× 彼女は5つのビールすべてを一度に飲みました。

原文: その公園では、牛が三頭、馬が5頭、羊が2頭、そしてうさぎが10羽飼育されています。
◎ The park has three cows, five horses, two sheep, and ten rabbits.
× 公園には牛3頭、馬5頭、羊2頭、ウサギ10頭がいます。

原文: 壇上には、一面の鏡と2本のろうそくと一盛りの果物、そして一輪の花が生けられた花瓶が置かれていた。
〇 On the stage was a mirror, two candles, a heap of fruit, and a vase with a single flower.
× ステージには、鏡、2本のろうそく、果物の山、そして一輪の花瓶がありました。

原文: 1服のお茶の、体に与える影響は非常に大きい。
× The effect of one cup of tea on the body is very large.
〇 お茶1杯の体への影響は非常に大きいです。

■日英、英日共に結果が良くなかったもの


日本語の助数詞が特殊すぎて、日英での翻訳から助数詞が適切に翻訳できなかったものです。結果として、英日のリバース翻訳にまで影響しました。

【ご案内】TCシンポジウム 2021 10月 特別セッション(有料)
英文テクニカルコミュニケーション力を進化させる
— UXライティングや新常態に対応できる英文ライティングを考える

論理的な書き方を心がけるためのポイントが学べます

■開催概要
日時:10月6日(水) 10:00~12:15
詳細情報:https://jtca-web.com/sessions/2021/4655/
於:TCシンポジウム on the Web (Zoom形式)
講師: 中村 哲三 (株)エレクトロスイスジャパン

原文: 彼女は一抱えの薪を重そうに運んできました。
× She carried a handful of firewood heavy.
× 彼女は一握りの重い薪を運んだ。

原文: 母は、子供たちの学習用にと鉛筆を5打購入しました。
× My mother bought five pencils for her children’s learning. 
これはさすがに無理でした。

原文: その家の床の間には、一幅の掛け軸がかかっていたが、聞くところによるとその掛け軸は盗難にあったということだ。
× There was a wide hanging scroll between the floors of the house, but I heard that the hanging scroll was stolen. 

ついに、ここで力尽きた感じです。「床の間」= alcoveも適切に翻訳できていません。

原文: そうめんは、いつもだいたい3把は食べられます。
× You can always eat about 3 pieces of somen.
 
これもだめでした。

こういったものは、原文を書くときに翻訳しやすくなるように言い換えることが必要です。
言い換えにチャレンジします。

原文修正: 彼女は両手いっぱいに薪を重そうに運んできました。 
〇 She carried firewood heavy in her hands.
× 彼女は重い薪を手に持っていた。

原文修正: 母は、子供たちの学習用にと鉛筆を5ダース購入しました。
◎ My mother bought five dozen pencils for her children’s learning.
◎ 母は子供たちの学習のために5ダースの鉛筆を購入しました。

原文修正: その家の床の間には、由緒ありそうな掛け軸がかかっていたが、聞くところによるとその掛け軸は盗難にあったということだ。
〇 There was a hanging scroll that seemed to be venerable in the alcove of the house, but I heard that the hanging scroll was stolen.
× 家の床の間に由緒あるような掛軸がありましたが、掛軸が盗まれたそうです。

原文修正:私は、そうめんをいつもだいたい3束は食べられます。
◎ I can always eat about 3 bundles of somen.
◎ 私はいつも素麺を3束くらい食べることができる。

これである程度は翻訳を改善できました。
少し特殊な助数詞は英語に翻訳しやすい表現に言い換える必要がありますね。
(第2回 おわり)

[2021.9]日本語固有の助数詞は適切に翻訳できるか(第1回)

 今回は、日本語固有の助数詞を取り上げます。助数詞は、「豚3匹」などのように、ものの数を数えるときに数字の後に着けるもので、「個」、「枚」、「回」、「組」などです。助数詞は、外国人の日本語学習者を戸惑わせたり、日本人も戸惑ったりするものもありますが、日本語の文章表現を豊かにする一要素であり、日本語と切っても切り離せないものです。
 AI翻訳が助数詞にどこまで対応できるかを調べます。日英でAI翻訳にかけた後、それを英日のAI翻訳で日本語に戻してみます。英日のリバース翻訳のプロセスで、適切に日本語の助数詞が翻訳されるかを確認していきます。

日本語固有の助数詞は適切に翻訳できるか?(3回シリーズ)
第1回 日英、英日共に良い結果を得られたもの(2021.9公開)
第2回 日英、英日共に結果が良くなかったもの (2021.10公開
第3回 日英は良い結果で、英日が良くなかったもの (2021.11公開予定)

■第1回 日英、英日共に良い結果を得られたもの

AI翻訳が、助数詞にどこまで対応できるか調べてみます。

評価のレジェンド
◎ 問題なく翻訳できている
〇 なんとかクリアした
△ 助数詞が適切に翻訳できていない
× 翻訳できていない

注)例文で「原文」等の明記がないものは全てAI翻訳の結果です。

最初に、助数詞が適切に英語に翻訳され、さらにその英語から日本語にリバース翻訳して助数詞が再現されたものです。

原文:大空に飛行機が三機飛んでいる。
◎ Three planes are flying in the sky.
◎ 3機の飛行機が空を飛んでいます。

原文:古城の城壁には、三門の大砲が置かれていました。
◎ On the wall of the old castle, there were three cannons.
◎ 古い城の壁には3門の大砲がありました。

原文:競技会のために、靴を三足買いました。
◎ I bought three pairs of shoes for the competition. 
◎ 大会用に靴を3足購入しました。

英語にも助数詞的な要素があります。

原文:1発の銃声が深夜の街にこだました。
◎ A single gunshot echoed in the city at midnight.  英語にも助数詞的な要素がある
◎ 真夜中に1発の銃声が街に響き渡った。

原文:刺身を5人前注文されたのはどなたですか?
◎ Who ordered the sashimi for 5 servings?  英語にも助数詞的な要素がある
◎ 刺身を5人前で注文したのは誰ですか?

原文:彼は三位に入賞しました。
◎ He won the third place.
〇 彼は3位を獲得しました。

今回の助数詞は、よく使われるものなので、どの言語でも理解できそうです。

ご参考までに、英語の助数詞的表現を挙げます。
a sheet of paper: 紙1枚
a piece of chalk: チョーク1本
a glass of water: グラス1杯の水
a bottle of water: ボトル1本の水
a cup of coffee: 1杯のコーヒー
a bunch of green onions: 1束のネギ
a bundle of pasta: パスタ1束
two pairs of pants: ズボン2着
four head of cattle: 牛4頭
a crowd of spectators: 観客の群れ
a school of little fish: 小魚の群れ
a pride of lions: ライオンの群れ
a troop of schoolchildren: 学童の一団

(第1回おわり)

[2021.8] AI翻訳は、どんな文でも翻訳できるのでしょうか?

TCシンポジウム2021 on the Webで事例研究発表します。その概要をお伝えします。

事例研究発表[TH01]
AI翻訳だからこそ、翻訳元の文に論理性が必要
~ツール特性を整理し、1次著作物制作でのAI翻訳活用を考える~

日時:8月25日(水) 10:00~11:00(60分)[聴講無料]
セッション概要:https://jtca-web.com/sessions/2021/3884/

AI翻訳であれば、分野を限定することで「どんな文でも翻訳できる」と聞くこともありますが、実現可能なことなのでしょうか?主語と述語が対応していない、目的語が存在しないなどの文は論理的でありませんが、翻訳結果は得られるので嘘ではなさそうです。しかし、その翻訳結果が「このレベルではAI翻訳はまだ使えたものではない」といった評価につながり、AI翻訳の導入をためらうという例をよく耳にします。今日のAI翻訳は、ニューラルネットワークに基づくディープラーニングを重ねることで翻訳性能が向上すると言われていますが、翻訳性能が向上するのをただ待つだけしかないのでしょうか?
これらの疑問が今回の事例研究発表に繋がりました。

翻訳元の⽂に論理的で簡潔でわかりやすいものを使⽤することで、AI翻訳の品質を向上させることができ、そして、それが結果として⼈による翻訳作業においても正確性向上や効率化に寄与できるのではないか?といった点を検証していきます。論理的な問題点を含む翻訳元の例文とその翻訳結果を見ながら検証し、注意すべきポイントと具体的な対応策の検討を行います。この事例発表に参加することで、翻訳元のどこを修正すればAI翻訳の品質向上に繋げられるかを確認できます。

セッション概要はこちらをご覧ください。
https://jtca-web.com/sessions/2021/3884/
皆さまのご参加をお待ちしております。

情報を「つかう」「つたえる」視点で考えるAI翻訳活⽤法(連載コラム第2弾)
AI翻訳を上⼿に活⽤するための3つの基本ルール

AI自動翻訳の翻訳品質を考える前に
見落としがちなこと (連載コラム第1弾)

ひとことメモ

連載コラム第2弾
情報を「つかう」「つたえる」視点で考えるAI翻訳活⽤法(3回シリーズ)

このシリーズでは、情報を「つかう」、「つたえる」という利⽤者の視点で、AI翻訳の活⽤を考えていきます。
これまでのAI翻訳に関する議論では、まず原⽂が存在し、翻訳担当者が原文を翻訳するという視点で論じられてきました。これは情報を提供する側の視点です。
多くの⼈がスマートフォンを利⽤する時代になりました。情報利⽤者が⾃⾝でスマートフォンに搭載されている翻訳機能を用いて、原文の言語を問わずに自在に情報を得ることを想定する必要がでてきました。情報は利⽤者が内容を理解して初めて⽬的を達成します。利⽤者が情報を必要に応じて理解可能な言語に変換し、適切に情報活⽤できるようにすることは、情報の価値を高めることに繋がります。そのためには、誤訳や訳抜けが発⽣しないように原⽂を書くことが必要になります。

これは決して難しいことではありません。以下の3つの基本的なルールを押さえることで対応できます。
AI翻訳を上⼿に活⽤するための3つの基本ルール
Rule 1. 論理的に、簡潔に、また正確に書く
Rule 2. ⾔語に固有のメタファー(⽐喩)を避ける
Rule 3. 和製英語や定着していないカタカナ⽤語は使⽤しない

この3つのルールはライティングでも基本的な決まりごとであり、⼈が翻訳するかNMTで翻訳するかに関わらず必要なものです。

■Rule 1.  論理的に、簡潔に、また正確に書く

普通にライティングするときも、翻訳するために原⽂を書くときも、まずこのルールを順守することが必要です。このルールを具体的に説明するために、「グライスの協調の原理」を紹介します。「グライスの協調の原理」とは、コミュニケーションを効率的に進めるために必要な要素(公理)を説明したものです。「グライスの協調の原理」は「量、質、関連性、⼿法の4つの公理」から成り⽴っています。

量: テキストの量が少なすぎれば、理解しにくくなります。かといってテキストの量が多すぎると、伝えたいことがテキストの中に隠されてしまいます。少なすぎず、多すぎず、伝えるために必要な適切な量のテキストが必要です。
質: テキストの内容が間違っていたり、その論理がでたらめであれば、適切に伝わりません。主語と述語を明快に書き、 ”who does what to whom” (誰が誰に何をするのか)などがすぐにわかるように簡潔に書きます。
関連性(コンテキスト): ⽂を書くときに、突然、それまでと関係のないことを書くと読者は⼾惑ってしまいます。論理にしてもストーリーにしても、前の⽂と関係のあることを書くことが重要です。
⼿法: 情報の種類によってそれぞれ効果的な伝達⽅法を使⽤します。

いずれの公理も当たり前の内容なので簡単なことのようですが、この公理を守れていない⽂をよく⾒かけます。守れていないと、翻訳するときも適切に翻訳されなくなります。どんな⽂でも翻訳できると強弁する⽅もいらっしゃるかもしれませんが、それは実際には不可能です。間違って翻訳されれば、なんとか翻訳できたとしても、相⼿には適切に伝わらなくなります。
上記の⼿法の3つについては、皆さんご納得いただけたと思います。もちろん、関連性(コンテキスト)についても誰も関係のない話はしないよとご理解いただけていることと思いますが、ところが、実際には必ずしも守られていないことがあります。読者の経験や知識のバックグラウンドを調べないままにライティングしたりしていませんか。または、そこまで⼤胆なことはしないにせよ、ちょっとした気配りが足りなかったりします。
以下の例をご覧ください。

■関連性(コンテキスト)を補完する
⼈間翻訳とAI翻訳の違いは、細かなコンテキストの流れに対応できるかどうかというところにあります。⼈間は⽂と⽂のつながりや⽂章全体の流れやトーン、つまりコンテキストや背景を把握し、それを各⽂の翻訳に反映させることができます(優秀な翻訳者の場合ですが)。しかし、AI翻訳はこれまでの機械翻訳(MT)と異なってAIなのだからとはいうものの、⽂単位での翻訳になりますので、⽂と⽂のつながりまでなかなか反映してくれることは難しいのです。たとえば、以下の⽂を見てください。

原⽂: You may be infected with Ebola hemorrhagic fever, no matter how cold the weather is.
Countries in the polar zone have reported cases of Ebola hemorrhagic fever.
AI翻訳結果: どんなに寒くても、エボラ出⾎熱に感染する可能性があります。 極地の国々は、エボラ出⾎熱の症例を報告しています。


翻訳結果の2つ⽬の⽂のつながりが少しぎこちなくなっています。1つ⽬の⽂で「どんなに寒くても」と⾔っておきながら、2つ⽬の⽂では当然のことのように寒冷地でのエボラ出⾎熱の症例について語っています。このように、AI翻訳はコンテキストを読めないので、⽂単位での翻訳になることを意識して原⽂を書くべきだということが確認できます。原⽂のCountries in the polar zoneというところは、Even with countries in the polar zone (極地の国々でさえも)としてあげる必要があります。

原⽂: You may be infected with Ebola hemorrhagic fever, no matter how cold the weather is. Even with countries in the polar zone have reported cases of Ebola hemorrhagic fever.
AI翻訳結果: どんなに寒くても、エボラ出⾎熱に感染する可能性があります。 極地の国々でも、エボラ出⾎熱の症例が報告されています。


こういったちょっとした気遣いをすることで、翻訳性能は向上します。こういった気遣いをpre-edit (プリエディット)と⾔います。翻訳したりNMTにかけたりする前に、⼈間の翻訳者でもNMTでも翻訳しにくそうなところを事前に修正しておくわけですね。

Rule 2. 言語に固有のメタファー(比喩)を避ける

基本ルールの2つ目は、「言語に固有のメタファー(比喩)を避ける」です。
2つの言語間でスムーズにコミュニケーションするためには、日本語/英語それぞれのネイティブにしかわからないメタファーを避ける必要があります。たとえば、以下の例文を見てみましょう。

原文:あの政治家は腹が黒い。
AI翻訳結果:That politician has a dark stomach.

原文の「腹が黒い」というメタファーは理解されず、日本語原文のままに直訳されています。日本語の原文を書き起こすときや翻訳する前に、日本語に固有なメタファーを言語間で共通で一般的な表現に置き換えておく必要があります。このことを、ローカリゼーションの世界では「Internationalization (I18n)」と呼びます。「Localization (L10n)」する前に、テキストをまず「一般化」するわけです。

修正原文:あの政治家は誠実ではない。
AI翻訳結果:That politician is not sincere.(政治家の場合はThat politician is not honest.のほうがしっくりするような気がしますが、これでもだいじょうぶだと思います。)

「一般化」した表現で文を書くことで、翻訳における不要な間違いを避けることができます。ところが、以下の例を見てください。以下の例文ではメタファーが適切に翻訳されています。なかなかやるな、NMTというところでしょうか。

原文:You can catch flu, no matter how you take care about your health.
AI翻訳結果:どんなに健康に気を付けても、インフルエンザにかかる。

この場合のcanは「能力」ではなく「その可能性がある」という意味を表します。catchはインフルエンザ菌を運悪くつかんでしまう→つまり、罹患してしまうというメタファーです。can catchで「罹患する可能性がある」ということになります。インフルエンザは病気としても一般的なので、このNMTツールは、すでにこのメタファーを学習しているものと思われます。ところが、特殊で難解な病名の場合は、NMTはそれを病名として認識しないので、以下のような珍訳が生じることになります。

原文:You can catch Ebola hemorrhagic fever, no matter how you take care about your health.
AI翻訳結果:どのように健康に気を配っていても、エボラ出血熱をキャッチすることができます。

このような珍訳を避けるためには、原文を、メタファーを含まないより一般的な表現に変える必要があります。can catchをmay be infected(感染する)と具体的にします。

修正原文:You may be infected with Ebola hemorrhagic fever, no matter how you take care about your health.
AI翻訳結果:どのように健康に気を配っていても、エボラ出血熱に感染する可能性があります。

これでNMTでも適切に翻訳できるようになります。言語に固有のメタファーを避けて、原文を「一般化」するよう心がけます。

[2021.6]連載コラム第2弾2回目 – Rule 2. 言語に固有のメタファー(比喩)を避ける
<終わり>

<参考>すべてのメタファーがだめだというわけではない。
翻訳するときにメタファーを避けると申しあげましたが、避けるのは日本語/英語それぞれのネイティブにしかわからないものの場合だけです。日本語/英語で共通のメタファーも数多くあります。共通メタファーの多くは、幕末から明治にかけて英語などの文献から日本語に翻訳されたものです。
 幕末から明治にかけて多くの概念が日本語に翻訳されました。「科学」や「文化」、「論理」や「倫理」、「資本」や「左翼」といったそれまでの日本に存在しなかった概念や「一石二鳥」や「豚に真珠」などのことわざが日本語に翻訳されました。その中には「何が彼女をそうさせたか」といった、いわゆる無生物主語を使った文章表現技法などもありました。これは日本語に逐語翻訳されたものですが、同様に逐語的に翻訳されたメタファーもありました。

メタファーの例
日本文:我が道を行く。(人生を道に見立てる)
英文: I’m going my way.
日本文:人の海で自分を見失ってしまいました。(大勢の人を海に見立てる)
英文: I was lost in a sea of nameless faces.

メタファー生成の流れ — 素材から目標へ
素材[物理的につながれた関係] → 目標[近しい関係]

日本文:船がブイにつながれている。 → あの代議士は暴力団とつながっている。
英文:The ship is connected to the buoy. → That representative is connected to the gangsters.

メタファーに似たものにメトニミー(換喩)があります。メトニミーは素材に近いものに置き換えます。つまり、素材自体ではなく素材に関係のあるものに置き換えます。夏目漱石の「坊ちゃん」に出てくる教頭は「赤シャツ」ですよね。

メトニミーの例
日本文:やかんが沸いています。(沸いているのは「やかん」ではなくやかんの中の「水」)
英文: The kettle is boiling.

日本文:彼はBMWを運転しています。(運転しているのは「BMW」ではなくBMWの「車」)
英文:He drives a BMW.

このように、日本語原文でも英文でもメタファーやメトニミーは互いに似通っていたりします。また、英語のイディオムでも日本語としてもよく理解できるものもあります。たとえば、以下の例をご覧ください:

to come out of your shell 殻から出てくる → 社交的になる (← 殻に閉じこもる)
keep me posted 投稿し続けてね → 必ず連絡してね
hot off the press 印刷したばかり → 最新の (刷りたての)
すぐにわかるものばかりですね。

Rule 3. 和製英語や定着していないカタカナ用語は使用しない

日本語の中には、英語の原義から外れた和製英語があります。また、新たにカタカナ用語をつくりだすことを好む文化があります。和製英語を不用意に使うと誤訳が生じる原因になります。あるメーカーが自社の商品開発をオフショア化(海外の企業に委託開発)しようとして、開発仕様書に(良かれと思って)カタカナ用語を多用したところ、海外の委託先からほとんど理解してもらえなかったという笑えぬ笑い話があります。

実は、和製英語のような現象は日本語に限ったことではなく、ヨーロッパ言語などでも見られます。使用する際の注意を喚起する意図で、これらの用語はFalse friends(偽りの友)と呼ばれています。たとえば、スペイン語のrealizarは英語のrealizeではありません。realizarは英語ではcarry out(実行する)という意味になります。また、イタリア語のdisposizione(arrangement)は英語のdispositionとは完全には一致しません。

原文:部屋を畳からフローリングに替えた。
AI翻訳結果:I changed the room from tatami mats to flooring.

フローリングという言葉は和製英語です。翻訳結果では直訳になっています。英語で正しくはwooden floorと言います。
英語原文:I changed the room from tatami mats to wooden floor.
AI翻訳結果:部屋を畳からフローリングに変更しました。

英語から日本語への翻訳では、適切に和製英語に替えてくれています。以下にもう2例挙げます。
原文:社会からさまざまな財貨やサービスを受け入れて、それにプラスアルファを付けて社会に還元する。
AI翻訳結果:We accept various goods and services from society and give them back to society with a plus alpha.

プラスアルファは和製英語です。英語としてはsomething extraとかplus Xと言います。

英語原文:We accept various goods and services from society and give them back to society with something extra.
AI翻訳結果:さまざまな商品やサービスを社会から受け入れ、何か特別なものを社会に還元しています。

プラスアルファはsomething extraには置き換えられませんでしたし、英語のsomething extraはプラスアルファには置き換えられませんでした。このように、カタカナ用語を使うときは、注意が必要です。

原文:その会社は今年の春にハイビジョンテレビを売り出した。
AI翻訳結果:The company launched a high-definition television this spring.
AIリバース翻訳:同社は今春、高精細テレビを発売した。

「ハイビジョンテレビ」は和製英語です。日本語としては高精細度テレビと言います(しかし、この日本語はあまり使用されていないようですね)。翻訳結果ではhigh-definition televisionと英語として適切に翻訳されています。
このように新しい技術用語には和製英語が多く使われています。たとえば、リニアモーターカー=linear motor carは、英語圏ではmagrev trainと呼ばれています。

このように日本語には和製英語がたくさん使われているので注意が必要です。もちろん、NMTでもその違いは適切に置き換えてくれる場合もありますが、和製英語や定着していないカタカナ用語は、誤訳の原因となり得ますので、使用しないことが大事なポイントになります。
(終わり)

連載コラム第1弾
AI自動翻訳を活用するために
見落としがちなこと(3回シリーズ)

[2021.5]AI翻訳に誤訳があった場合の対処方法は? – 連載コラム3回目(3回シリーズ)

AI翻訳は、流暢に誤訳することがあります。従来のルールベース機械翻訳(RBMT)や統計的機械翻訳(SMT)の場合は、誤訳したところは不自然な表現となり一目瞭然でしたが、AI翻訳の場合は、翻訳された内容の確認が必要です。この確認作業もAI翻訳を活用して英日のリバース翻訳した日本語で確認できます。

誤訳の例
(原文)しかし、翻訳しやすい文とは、書き⼿が意図したとおりに⼈や機械が⽂構造を分析でき、⽤語や文を⼀義に解釈できる文章です。
(AI翻訳:JA→EN)However, sentences that are easy to translate are sentences in which people and machines can analyze sentence structure as intended by the writer, and the terms and sentences can be interpreted unilaterally.
(AI翻訳:EN→JA)しかし、翻訳しやすい文は、人や機械が意図する文章構造を筆者が分析できる文章であり、単語や文章を一方的に解釈することができます。
 

リバース英日翻訳の結果をみると、確かに流暢に翻訳されています。内容確認作業において、原文で記述している内容を知らない第三者の方がこの誤りに気づくには、原文も確認し記述内容を理解しなければなりません。しかし、原文を執筆された方や、記述内容を知る方が確認すれば、すぐに気づけることでしょう。 

原文の1つ目の太字の行為者が、リバース英日翻訳では入れ替わっています。AI翻訳では、このように流暢に誤訳することがあります。また、unilaterallyに翻訳されています。unilaterallyとはone-sidedlyという意味ですので誤訳が生じています。

原文を見ると、文章構造が複雑であること、使用する単語の意味が明確でなかったことが、誤訳につながったようです。対処方法としては、文章構造をシンプルにすることです。
以下は、原文を2文に分け、誤訳した一義にを意図が明確になるように修正した例を示します。

修正した例
(修正文)しかし、翻訳しやすい文とは、執筆者が意図したとおりに、⼈や機械が文の構造を分析できる文ですそして、⽤語や文が1つだけの意味になるように解釈できる文です
(AI翻訳:JA→EN)However, a sentence that is easy to translate is a sentence that allows humans and machines to analyze the sentence structure as the author intended. And it is a sentence that can be interpreted so that the word or sentence has only one meaning.
(AI翻訳:EN→JA)しかし、翻訳しやすい文は、作者が意図したとおり、人間や機械が文の構造を分析できる文です。 そして、それは単語や文がただ一つの意味を持つように解釈できる文です。

原文修正により、リバース英日翻訳をした日本文でも、原文の意図通りに翻訳されていることが確認できます。
その他、誤訳した結果をポストエディットして、再度AI学習させる方法もあります。ポストエディットし、修正された箇所も含めてAIに学習させることによって、AI翻訳の誤訳を減らします。

SYSTRAN からのAI翻訳活用ひとことメモ
 誤りに対するAI翻訳での基本的な対処方法は、ポストエディットしてTranslation Memoryに残し、それをAI学習することで、持続的に間違いが少なくなり、最終的にはポストエディットをなくしていくという方法になります。
 そこには言語学的な冠詞や不定冠詞、形容詞、名詞、係り受け云々という概念はなく、ただ「データ=経験」があるだけです。わからなければ例文で追加学習するということの繰り返しになります。これらは、RBMTやSMT時代の翻訳品質向上の世界観とは異なる、より実践的で、より人間に近いものと言えます。言語学的知識がなくても理解しやすいはずです。

(ご参考)自社のTranslation MemoryでAI学習が可能なAI翻訳エンジン(五十音順)

第3回 AI翻訳に誤訳があった場合の対処方法は?
<おわり>

[2021.3]「1文章中の主語」について考えます。- 連載コラム2回目(3回シリーズ)

 機械翻訳を使って翻訳していると、何の脈絡もなしに主語が入ってきたり、その主語がほかの人称の主語と入れ替わったりします。なぜこんなことが生じるのでしょうか?
 日本語では、主語が明快に示されてないことが多々あるため、主語を省略して書かれることがあるためです。逆に、主語が文の前後関係で容易に判断できるときに主語を入れると、日本文としてぎこちない文になったりします。それに対して論理的な言語である英語では主語は必要ですので、機械翻訳は、主語が明示されていない文に便宜的に主語が必要になり、主語が現れることになります。

 日本文では、なぜ主語が省略されるのでしょうか。日本語が他者と視点を共有する言語だからなのでしょうか。それはさておき、自分が読んで理解するためだけのものでしたら、別に気にしなくてもいいのですが、せっかく翻訳するわけですので、主語を統一したいですよね。

さて、今回の例題はこちらです。
例題:  わかりやすい⽂を書けば、翻訳しやすくなりますか︖
AI翻訳(JA→EN):
  Would it be easier to translate if I wrote understandable sentences?
AI翻訳(EN→JA):  わかりやすい文章を書くと翻訳しやすくなりますか?

 英文で主語がどうなるのかまったく意識していなかったのですが、この例のように唐突に「I」という主語が入ると、英語では主語が省略できないのだと改めて思い知らされます。この質問の内容からすると、この翻訳のように「I」という主語でもしっくりきます。それは、トラブルシューティングでの質問のように、質問者の視点で書かれていることを考えれば自然だからです。ただ、マニュアルなどの操作説明中心の文では「you」が中心になりますので、文脈的に近いところで「you」と「I」が混在していたら不自然になります。そういう場合は、原文である日本文を書き換えることで、「I」が翻訳されないようにします。

原文を以下のように書き換えてみました。
修正版:  内容がわかりやすい⽂であれば、翻訳しやすくなりますか︖
AI翻訳(JA→EN): Would it be easier to translate if the contents were easy to understand?
AI翻訳(EN→JA): 内容がわかりやすい方が翻訳しやすいでしょうか?

原文の変更で、「I」が翻訳されなくなったことが確認できます。いずれにしても、一貫して一つの主語を使い続けることが、機械翻訳での重要な課題になりますね。機械翻訳の機能で対応できることはないのでしょうか?

(参考)AI翻訳製品で試してみました

第2回 英訳された1文中の主語について
<終わり>

[2021.2]論理性固有名詞について考えます。- 連載コラム1回目(3回シリーズ)

 英文は、論理のつながりで表現しますので、日本文ではあまり気にならないような非論理的な文や論理が飛躍した文を、英語に翻訳すると文が行き詰ってしまいます。機械翻訳では、おかしな英文となって表れますし、固有名詞を誤訳すると、伝えたい内容の誤りが生じます。
 AI自動翻訳を活用するために心がけるべきことは、論理性固有名詞です。このポイントさえ押さえておけば、AI自動翻訳はあなたにとって便利なツールになります。固有名詞は用語集を作ってそれぞれの用語の対訳を準備しておくことで対応します。
 用語集がないことが引き起こしたと思われる事例をひとつ紹介します。以前、アメリカのFBIのトップページの「Most wanted (指名手配中)」が日本語では「募集中」になっていました。だいたい、自動翻訳の失敗の笑える原因は固有名詞の誤訳によるものです。ここでは固有名詞と書きましたが、一般名詞や特定の目的で使う動詞なども考慮に入れる必要があります。
 この論理性固有名詞の問題は、とても重要です。もちろん、この2種類の問題を生じないように対処しておけば、どういった分野であってもそれなりの翻訳は得られるものです。特に特定分野での翻訳であれば、良い結果が得られます。逆に対象を絞らない場合は、AI自動翻訳であっても良い翻訳結果は得られません。“Time flies like an arrow.”の例でおわかりのように、同綴異義語や品詞の文法的な解釈の可能性が広くなり過ぎるためです。

同綴異義語:「どうてついぎご」と読みます。同じつづりで、意味の異なる用語という意味です。たとえば、flyは蠅という名詞であったり、飛ぶという動詞であったりします。

 今後のコラムでは、「より一般的な」文章を使って、AI自動翻訳の問題点を実際にAI自動翻訳機で検証していきます。次回にご期待ください。

第1回 日本文の論理性と固有名詞
<おわり>

その疑問にお答えします

[2021.1] わかりやすい文を書けば、翻訳しやすくなりますか?

焦点が異なるので、わかりやすい文翻訳しやすい文になるとは限りません。わかりやすい文とは読み手が内容を容易に理解できる文です。しかし、翻訳しやすい文とは、書き手が意図したとおりに人や機械が文構造を分析でき、用語や文を一義に解釈できる文です。

[2021.1] 用語や文を一義にしか解釈できないようにするとは?

書き⼿の意図と読み⼿の理解が⼀致できるようにするために、原文を⼀つの意味にしか解釈できないようにすることです。人が翻訳するにしても機械が翻訳するにしても重要なことで、ライティングでよく言われる一文一義ということですね。

[2021.1] 文を短くすれば、翻訳しやすくなりますか?

短い文が翻訳しやすいとは限りません。
たとえば、以下の5語で書かれた英文を日本語に翻訳し、翻訳しやすいのか具体的に見ていきます。

[原文] Time flies like an arrow.

[翻訳例]

  1. 時間は矢のような速さで過ぎていきます。
    ことわざの「光陰矢の如し」です。
    この翻訳は、Timeを名詞、fliesを動詞、likeを前置詞として解釈した場合のことです。

たった5語で書かれた文ですが、以下のように少なくとも4つの異なる意味にも翻訳できます。

  1. 「時蠅」は矢印を好みます。
    これは、Timeを名詞(形容詞的用法)、fliesを名詞、likeを動詞として解釈した場合。
  2. 矢に似た蠅の速さを測ってください。
    これは、Timeを動詞、fliesを名詞、likeを前置詞として解釈した場合。
  3. 矢の速さを測るように蠅の速さを測ってください。
  4. 矢が蠅の速さを測るように蠅の速さを測ってください。
    上記の2つはTimeを動詞、fliesを名詞、likeを接続詞と解釈した場合。

短い文でも、さまざまな解釈が成り立ちます。英単語はそれぞれ異なる意味を持つ同義語が存在するというだけでなく、1つの単語が異なる品詞に使われたりします。一義的な解釈を確実に成立させるためには、 1つの単語を1つの意味だけに限定するだけではなく、品詞も1つに限定する必要があります。Time flies like an arrow. の例で見てみると、Timeを名詞に、fliesを動詞に限定すれば、1つの意味(1の例)に解釈できます。

[2021.1] 原文を翻訳しやすくするために注意することは?

英文ライティングのガイドラインであるASD-STE100シンプリファイドイングリッシュでは、単語に意味的、品詞的な制限を設けることで文の意味を一義に解釈できることを追求しています。原文を翻訳しやすくするために、ほかの言語でも同様の作業が必要となります。

日本語では、長文語順情報の並列明示係り受け助詞用語集といった点が挙げられます。書き手の意図が、読み手の理解と一致するように意識して日本文を書けば、読み手が独自にAI自動翻訳で翻訳した場合にも、適切に翻訳されることでしょう。

エレクトロスイスジャパン(ESJ)ができること

ESJでは以下のようなお手伝いをさせていただきます。

  • マニュアル原稿の評価と改善
  • 開発部門(技術者)に対する(簡単な)ライティング指導

AI学習データとして、既存TMを使うことは最適か?

AI 自動翻訳にTM データを再利用しようとしても、その翻訳元データの内容に問題が多ければ、適切な翻訳文は生成できません。原文がわかりにくければ、誤訳されたものになるか、翻訳文もわかりにくいものしか出力されません。

翻訳できると、人が理解しやすい翻訳ができるとは同じではありません。AI 自動翻訳を活用するために、原文をしっかりと分析して、翻訳しやすい文に書き換えることが重要です。

株式会社エレクトロスイスジャパン 中村 哲三

株式会社エレクトロスイスジャパン
中村 哲三

企画運営:株式会社 情報システムエンジニアリング  協力: 株式会社 エレクトロスイスジャパン

参考資料

  • Stylistic Guidelines in Localization (SGL) ISO/PWI 24620-4 中村が進める、ライティングの国際 共通規格
  • ASD-STE100 Simplified Technical English (AeroSpace and Defense: ヨーロッパ航空宇宙産業界)

関連情報

詳細資料ダウンロードdownload

以下のフォームにご入力いただいたメールアドレスへ、
TCシンポジウム記録集に掲載した記事ページ
AI自動翻訳の翻訳品質を考える前に見落としがちなこと 
資料のPDFをお送りします。

※資料の送付は、株式会社情報システムエンジニアリングよりご案内させていただきます。

個人情報の取り扱いについて

Copyright © 2021 Information System Engineering Inc. All rights reserved.