[2021.2] 日本文の論理性と固有名詞
英文は、論理のつながりで表現しますので、日本文ではあまり気にならないような非論理的な文や論理が飛躍した文を、英語に翻訳すると文が行き詰ってしまいます。機械翻訳では、おかしな英文となって表れますし、固有名詞を誤訳すると、伝えたい内容の誤りが生じます。
AI自動翻訳を活用するために心がけるべきことは、論理性と固有名詞です。このポイントさえ押さえておけば、AI自動翻訳はあなたにとって便利なツールになります。固有名詞は用語集を作ってそれぞれの用語の対訳を準備しておくことで対応します。
用語集がないことが引き起こしたと思われる事例をひとつ紹介します。以前、アメリカのFBIのトップページの「Most wanted (指名手配中)」が日本語では「募集中」になっていました。だいたい、自動翻訳の失敗の笑える原因は固有名詞の誤訳によるものです。ここでは固有名詞と書きましたが、一般名詞や特定の目的で使う動詞なども考慮に入れる必要があります。
この論理性と固有名詞の問題は、とても重要です。もちろん、この2種類の問題を生じないように対処しておけば、どういった分野であってもそれなりの翻訳は得られるものです。特に特定分野での翻訳であれば、良い結果が得られます。逆に対象を絞らない場合は、AI自動翻訳であっても良い翻訳結果は得られません。“Time flies like an arrow.”の例でおわかりのように、同綴異義語や品詞の文法的な解釈の可能性が広くなり過ぎるためです。
同綴異義語:「どうてついぎご」と読みます。同じつづりで、意味の異なる用語という意味です。たとえば、flyは蠅という名詞であったり、飛ぶという動詞であったりします。
[2021.3] 1文章中の主語について
機械翻訳を使って翻訳していると、何の脈絡もなしに主語が入ってきたり、その主語がほかの人称の主語と入れ替わったりします。なぜこんなことが生じるのでしょうか?
日本語では、主語が明快に示されてないことが多々あるため、主語を省略して書かれることがあるためです。逆に、主語が文の前後関係で容易に判断できるときに主語を入れると、日本文としてぎこちない文になったりします。それに対して論理的な言語である英語では主語は必要ですので、機械翻訳は、主語が明示されていない文に便宜的に主語が必要になり、主語が現れることになります。
日本文では、なぜ主語が省略されるのでしょうか。日本語が他者と視点を共有する言語だからなのでしょうか。それはさておき、自分が読んで理解するためだけのものでしたら、別に気にしなくてもいいのですが、せっかく翻訳するわけですので、主語を統一したいですよね。
さて、今回の例題はこちらです。
例題: わかりやすい⽂を書けば、翻訳しやすくなりますか︖
AI翻訳(JA→EN): Would it be easier to translate if I wrote understandable sentences?
AI翻訳(EN→JA): わかりやすい文章を書くと翻訳しやすくなりますか?
英文で主語がどうなるのかまったく意識していなかったのですが、この例のように唐突に「I」という主語が入ると、英語では主語が省略できないのだと改めて思い知らされます。この質問の内容からすると、この翻訳のように「I」という主語でもしっくりきます。それは、トラブルシューティングでの質問のように、質問者の視点で書かれていることを考えれば自然だからです。ただ、マニュアルなどの操作説明中心の文では「you」が中心になりますので、文脈的に近いところで「you」と「I」が混在していたら不自然になります。そういう場合は、原文である日本文を書き換えることで、「I」が翻訳されないようにします。
原文を以下のように書き換えてみました。
修正版: 内容がわかりやすい⽂であれば、翻訳しやすくなりますか︖
AI翻訳(JA→EN): Would it be easier to translate if the contents were easy to understand?
AI翻訳(EN→JA): 内容がわかりやすい方が翻訳しやすいでしょうか?
原文の変更で、「I」が翻訳されなくなったことが確認できます。いずれにしても、一貫して一つの主語を使い続けることが、機械翻訳での重要な課題になりますね。機械翻訳の機能で対応できることはないのでしょうか?
(参考)AI翻訳製品で試してみました
[2021.5] AI翻訳に誤訳があった場合の対処方法
AI翻訳は、流暢に誤訳することがあります。従来のルールベース機械翻訳(RBMT)や統計的機械翻訳(SMT)の場合は、誤訳したところは不自然な表現となり一目瞭然でしたが、AI翻訳の場合は、翻訳された内容の確認が必要です。この確認作業もAI翻訳を活用して英日のリバース翻訳した日本語で確認できます。
誤訳の例
(原文)しかし、翻訳しやすい文とは、書き⼿が意図したとおりに⼈や機械が⽂構造を分析でき、⽤語や文を⼀義に解釈できる文章です。
(AI翻訳:JA→EN)However, sentences that are easy to translate are sentences in which people and machines can analyze sentence structure as intended by the writer, and the terms and sentences can be interpreted unilaterally.
(AI翻訳:EN→JA)しかし、翻訳しやすい文は、人や機械が意図する文章構造を筆者が分析できる文章であり、単語や文章を一方的に解釈することができます。
リバース英日翻訳の結果をみると、確かに流暢に翻訳されています。内容確認作業において、原文で記述している内容を知らない第三者の方がこの誤りに気づくには、原文も確認し記述内容を理解しなければなりません。しかし、原文を執筆された方や、記述内容を知る方が確認すれば、すぐに気づけることでしょう。
原文の1つ目の太字の行為者が、リバース英日翻訳では入れ替わっています。AI翻訳では、このように流暢に誤訳することがあります。また、一義にがunilaterallyに翻訳されています。unilaterallyとはone-sidedlyという意味ですので誤訳が生じています。
原文を見ると、文章構造が複雑であること、使用する単語の意味が明確でなかったことが、誤訳につながったようです。対処方法としては、文章構造をシンプルにすることです。
以下は、原文を2文に分け、誤訳した一義にを意図が明確になるように修正した例を示します。
修正した例
(修正文)しかし、翻訳しやすい文とは、執筆者が意図したとおりに、⼈や機械が文の構造を分析できる文です。そして、⽤語や文が1つだけの意味になるように解釈できる文です。
(AI翻訳:JA→EN)However, a sentence that is easy to translate is a sentence that allows humans and machines to analyze the sentence structure as the author intended. And it is a sentence that can be interpreted so that the word or sentence has only one meaning.
(AI翻訳:EN→JA)しかし、翻訳しやすい文は、作者が意図したとおり、人間や機械が文の構造を分析できる文です。 そして、それは単語や文がただ一つの意味を持つように解釈できる文です。
原文修正により、リバース英日翻訳をした日本文でも、原文の意図通りに翻訳されていることが確認できます。
その他、誤訳した結果をポストエディットして、再度AI学習させる方法もあります。ポストエディットし、修正された箇所も含めてAIに学習させることによって、AI翻訳の誤訳を減らします。
SYSTRAN からのAI翻訳活用ひとことメモ
誤りに対するAI翻訳での基本的な対処方法は、ポストエディットしてTranslation Memoryに残し、それをAI学習することで、持続的に間違いが少なくなり、最終的にはポストエディットをなくしていくという方法になります。
そこには言語学的な冠詞や不定冠詞、形容詞、名詞、係り受け云々という概念はなく、ただ「データ=経験」があるだけです。わからなければ例文で追加学習するということの繰り返しになります。これらは、RBMTやSMT時代の翻訳品質向上の世界観とは異なる、より実践的で、より人間に近いものと言えます。言語学的知識がなくても理解しやすいはずです。
(ご参考)自社のTranslation MemoryでAI学習が可能なAI翻訳エンジン(五十音順)
- シストラン SYSTRAN Pure Neural Server オンプレミス環境で利用する自社の意図を学び続けるAI翻訳
- ロゼッタ T-3MT Translation Memoryを使用して学習した例