MENU

情報を「つかう」「つたえる」視点で考えるAI翻訳活⽤法

株式会社エレクトロスイスジャパン 中村 哲三

情報を「つかう」「つたえる」視点で考えるAI翻訳活⽤法

株式会社エレクトロスイスジャパン
中村 哲三

情報を「つかう」「つたえる」視点で考えるAI翻訳活⽤法

OfficeツールとAI機械翻訳2
[2022.6] え!この翻訳でいいの?「喫煙者を始めるときは」

~お知らせ~

 先月、Word、Excel、PowerPointなどのOfficeツールで、Microsoftの翻訳ツールが使用できるようになっていると申し上げましたが、これはデスクトップ版にかぎってのことでした。Microsoft社のビジネス向け最新版であるMicrosoft 365(サブスクリプション版)では、Word には翻訳ツールが付いているのですが、ExcelとPowerPointには翻訳ツールが付いていません(Outlookにはアドイン)。ExcelやPowerPointで翻訳ツールをよく使用される方は、この点をご確認ください。
 これからのビジネスツールにとってますます重要になってくるはずの翻訳機能が付いていないのはどうしても解せないので、この点、いろいろな方に確認しました(特に、MSのサポートセンターの方には、丁寧にご対応いただきました)。それでも、納得できないので、現在、この点について、シアトル本社のMicrosoft Translatorの責任者の方にメールで問い合わせております(我ながら、このしつこさと図々しさには呆れます)。確認できたところで、その結果を皆さま方にお伝えしたいと思います。

さて、本題に移ります。
Microsoft Officeが使用されている環境で、AI機械翻訳がどのように使われているか、またその翻訳精度はどれぐらいのレベルなのか、確認したい方はそれなりにいらっしゃるのではないでしょうか。
まず、小手試しに一つの例を用意しました。

英語原文:When you start your smoker, insert your digital meat probe(*) into the deepest part of your cut of meat.
(*) probe: 探針型の温度計
MS翻訳(*) 喫煙者を始めるときは、デジタルミートプローブを肉のカットの最も深い部分に挿入します。
(*) MS翻訳:Microsoft Translator
AI翻訳1: 喫煙者を始めるときは、デジタルミートプローブを肉の切り身の最も深い部分に挿入します。
AI翻訳2: 喫煙者がたばこを吸い始めたら、デジタルミートプローブを肉の切り口の最も深い部分に挿入します。

いずれも、同じところで大きな間違いをしています。まあ、これはご愛嬌ですね。smokerは多義語(polysemy)ですので、簡単に誤訳してしまいました。smokerには「喫煙者」と「燻製器」の意味があります。特に、「AI翻訳2」では、「喫煙者がたばこを吸い始めたら」というもっともらしい表現になっていますので、思わず笑ってしまいます。

 機械翻訳がまだ使い物ならないという人たちは、このような誤訳を見ると、それ見たことかと思われるでしょう。しかし、smoker、つまり「燻製器」の存在を知らない人であれば、ほとんどの人が(おかしいなと思いながらも)誤訳してしまうでしょう。それは、人でも機械でも同様です。機械翻訳を適切に使用するには、多義的な解釈を用語から失くしていくことが必要です(これは、人間が理解するためにも必要なことです)。

 それでは、smokerを「喫煙者」と誤訳させないためにはどうしたらいいのでしょうか。WebsterやOxfordなどのいわゆる「大辞典」であれば「燻製器」も掲載されているのでしょうが、一般的に私たちが使用している「要約版」の場合では、Webster やLongmanやCollinsやCobuildなどの一般的な辞書でsmokerを調べると、「喫煙」に関することが載っています。やっと、Oxfordで、2番目の意味としてA person or device that smokes fish or meat.(魚や肉を燻製にする人、または機器)が掲載されていました。それでは、日本語の一般的な英和辞典ではどうでしょうか。smokerはそのほとんどが「喫煙」に関することでした。「燻製器」が意味の一つとして掲載されていたのは、「ジーニアス英和辞典第5版」と「リーダーズ英和中辞典第2版」でした。基本的に、日本の英和辞典は、アメリカの英英辞典をベースにしてつくられていますので、英英辞典以上のものにはなりませんし、英和辞典の世界は、どうしても情報が少し古くなります。これが、英日対訳の部分で、なかなかsmoker=「燻製器」とならない理由だと思われます。

 ところが、ウェブの画像検索でsmokerを調べてみると、以下のとおり、そのほとんどが、「燻製器」でした。これが、日進月歩で情報が変化していくウェブと、早くても10年単位での変化の辞書の世界との違いです。

いずれにしても、辞書とウェブの温度差には納得させられるものがあります。辞書という紙媒体に比べて、ウェブは世相をダイレクトに反映しています。

3社とも同じぐらいのレベルでしたので、この勝負、引き分けとします。

ちなみに、どのようにすれば、このような誤訳を避けられたのでしょうか。smoke device /smoking deviceとすれば「喫煙器」となりますし、smoke machineとすればビジュアル効果を得るための「フォグマシーン」になってしまいます。苦肉の策としては、グーグル英語版で画像検索して得られるgrill smokerのように(上記イメージの赤線部分)、料理の分野の用語であるgrillを加えることで対応するしかありません。

英語原文:When you start your grill smoker, insert your digital meat probe into the deepest part of your cut of meat.
MS翻訳: グリルスモーカーを起動したら、デジタルミートプローブを肉のカットの最も深い部分に挿入します。
AI翻訳1: グリルスモーカーを開始するときは、デジタルミートプローブを肉の切り口の最も深い部分に挿入します。
AI翻訳2: グリルスモーカーを始めたら、肉の切り口の最も深い部分にデジタルミートプローブを差し込みます。

ちなみに、AI翻訳1はインターネット上で最も一般的に使用されているものでした。
次回は、このコーナーでもご紹介した例文を使って、検証していくことにします。

(終わり – え!この訳でいいの?「喫煙者を始めるときは」- OfficeツールとAI機械翻訳2 )

お問い合わせ

AI翻訳活用コラムシリーズ

AI翻訳活用コラム Vol.6】OfficeツールとAI機械翻訳

AI翻訳活用コラム Vol.5】AI翻訳や翻訳する人にやさしい文を書く

AI翻訳活用コラム Vol.2】AI翻訳を上⼿に活⽤するための3つの基本ルール

AI翻訳活用コラム Vol.1】翻訳品質を考える前に – 見落としがちなこと

事例研究発表】AI翻訳だからこそ、翻訳元の文に論理性が必要

記事アーカイブス

【コラム Vol.6】OfficeツールとAI機械翻訳

 これまで、AI機械翻訳についてその品質面について検討してきましたが、AI機械翻訳するテキストの整理で大きく関連してくるワープロなどのビジネスツールとの親和性については、検討が抜け落ちていました。この点については、皆さま関心がおありのところだと思います。
ということで、ビジネスツールの代表格であるMicrosoft社のOfficeツールでの機械翻訳についてお話をしたいと思います。Microsoft社は、BingというNMTツールを自社開発していますので、おそらく、OfficeツールにもAI機械翻訳の機能が備わっているでしょう。

  1. PC上のアプリについて確認したこと [2022.5]
  2. え!この翻訳でいいの?「喫煙者を始めるときは」 [2022.6]

[2022.5] PC上のアプリについて確認したこと

今回は、PC上のアプリ(クライアントアプリ、または、買い切り版のアプリ)について確認したことをお伝えします。

PC上のアプリの場合

 実際に確認したところ、Officeツールでは、Microsoftの翻訳ツールが使用できるようになっています。 Word、Excel、PowerPointいずれのツールでも、「校閲」タブを開けば、Microsoft Translatorの翻訳のコマンドが選べます。
これを使用すれば、別途、翻訳ツールを立ち上げたりする手間がかかりません。 つまりWord、Excel、PowerPoint のOfficeツールでは、 翻訳したいと思ったら、上記の2クリックをすればいいわけです。

Wordの場合は、以下のように、ポップアップメニューが表示され、「選択範囲の翻訳」なのか「ドキュメントの翻訳」(そのドキュメント全体の翻訳)なのかを選択できるようになっています。
ExcelやPowerPointでは、「選択範囲の翻訳」しかできません。「ドキュメントの翻訳」はできません。

Wordの場合(左)、ExcelとPowerPointの場合(右)

ここからは、Wordについての説明になります。

テキストで翻訳したい部分を選択すると、「翻訳元の言語」は自動検出(デフォルト)されます。 また、「翻訳先の言語」は、プルダウンメニューから選択します。

翻訳ペインで「ドキュメント」を選ぶと、このドキュメント全体を翻訳できます。

英日の翻訳品質確認

ところで、肝心の翻訳品質はどうだったのでしょうか。

英語原文
タイトル:English writing
Purpose of this English Writing Style Guide is to give you an idea and methods how to write an English document clearly and concisely (limited to written language, not including spoken language). It helps you to find the right direction including appropriate terms and correct expressions when you happen to go astray in a huge writing labyrinth. You are required to write in a clear, concise, and correct manner (3C) to communicate with your stakeholders including the customers in the global society and have them take responsive actions, if necessary.

Microsoft翻訳文
タイトル:英語ライティング
この英語ライティングスタイルガイドの目的は、英語の文書を明確かつ簡潔に書く
方法(書き言葉に限定され、話し言葉を含まない)のアイデアと方法を提供することです。それはあなたが巨大な文章の迷路で迷子になったときに適切な用語と正しい表現を含む正しい方向を見つけるのを助けます。グローバル社会の顧客を含むステークホルダーとコミュニケーションをとり、必要に応じて対応行動を起こすために、明確、簡潔、かつ正しい記述(3C)が求められます。

いかがでしょうか。1つ目の赤くマーカーした部分(方法)を「ため」と置き換えるだけで、それなりに使用できるものになります。

参考までにグーグル翻訳も試してみました。

グーグル翻訳
タイトル:英語の執筆
この英語ライティングスタイルガイドの目的は、英語のドキュメントを明確かつ簡潔に書く方法のアイデアと方法を提供することです(書き言葉に限定され、話し言葉は含まれません)。 巨大な文章の迷路に迷ったときに、適切な用語や正しい表現を含む正しい方向を見つけるのに役立ちます。グローバル社会のお客様をはじめとするステークホルダーとのコミュニケーションを図り、必要に応じて対応していただくために、明確・簡潔・正確な方法(3C)で書いていただく必要があります。

これも、Microsoftと同様で、1つ目の赤くマーカーした部分(方法)を「ため」と置き換えるだけで、それなりに使用できるものになります。これらの翻訳結果を見る限りでは、品質のレベルとしては、Microsoft社もグーグル社もほぼ同じと言えます。

他言語への翻訳品質確認

機械翻訳を使えることの大きなメリットとしては、多言語展開時の品質確認です。
日英ぐらいなら自身で翻訳品質を確認できますが、自分が理解できない言語への翻訳の品質確認も、「英語→他言語→日本語/英語」という手順で、ほぼ確実に確認できます。

[例]英語→オランダ語

オランダ語→日本語

オランダ語翻訳の場合も同様で、1つ目「方法」を「ため」と置き換えるだけで、それなりに使用できるものになります。

次回は、Web上Microsoft 365のアプリの場合について説明します。

【コラム Vol.5】AI翻訳や翻訳する人にやさしい文を書く

[2022.4] わかりやすく、翻訳しやすい文を書くことを心がける

「わかりやすく、翻訳しやすい文を書くことを心がける」— これは、ごくごく当たり前のことですが、なかなか「わかりやすく、翻訳しやすい文」を書けないので、理解や翻訳に問題が生じたりします。
 これからは、これまでの内容を広げて、AI翻訳だけではなく人にとっても翻訳しやすい文、つまり、わかりやすい文を書くことを検討していきます。この一年間、AI翻訳の翻訳品質を上げるために、GIGO (Garbage In, garbage out)として「翻訳しやすい日本語表現」を検討してきました。この「翻訳しやすい日本語表現」は、よく考えてみると、また同時に「わかりやすい、ライティングをするための表現」であることに気づきます。もちろん、「翻訳しやすさ」と「わかりやすさ」は部分的に異なります。しかし、共通しているところが多くの部分で見受けられます。たとえば、以下の文をご覧ください:

原文:今日は、イタメシでいいですか。
AI翻訳:Is it okay for me to do it today?

AI翻訳はまったく翻訳できていません。「イタメシ」が理解できていないのですね。
「イタメシ」とは「イタリア」+「めし」の「洋語+和語」、2単語の省略形であり、いわゆる「混種語」の合成語です。日本語では、カタカナ用語で、2単語の省略形を数多く造語してきました。たとえば、デジタルカメラをデジカメといったり、パーソナルコンピューターをパソコンと言ったりします。いずれも、日本人が好きな「2音+2音」の4音語です。これをカタカナ語以外にも広げて「混種語」(「洋語+和語」や「洋語+漢語」)で造語したのが「イタメシ」などです。
せめて、「イタメシ」が、食事のジャンルの「イタリアン」だったらどうでしょうか。

原文:今日は、イタリアンでいいですか。
AI翻訳:Is it okay to be Italian today?

これもだめでした。「イタリア料理」と明示したらどうでしょうか。

原文:今日は、イタリア料理にしませんか。
AI翻訳:Would you like to cook Italian food today?

「しませんか」というところ、これは「する」という動詞ですので、あまりにも意味が抽象的で広すぎます。当然のことながら、AI翻訳は「料理する」と解釈してしまいました。そこで、具体的な行為、つまり動詞の「食べる」に置き換えてみます。

原文:今日は、イタリア料理を食べませんか。
AI翻訳:Would you like to eat Italian food today?

ご確認いただきたいのは、ここまで手間がかかったのはAI翻訳のせいではないということです。原文に問題があったら、つまり、原文がわかりにくかったら、AI翻訳に限らず誰であっても誤解し、誤訳します。最初の原文の「イタメシ」は、AI翻訳にとって、または初期の日本語学習者にとっては、見慣れない言葉だったでしょう。また、2つ目の原文の「イタリアン」は、「イタリア人」や「イタリア語」という意味もある多義語でしたので、この文が書かれた背景を知らなければ、「イタリアン」が何を指しているのかわからなかったでしょう。そして、3つ目の原文の「する」という抽象的な動詞では、なにをしたいのかわからなかったでしょう。

これで適切に翻訳してほしいというのは、AI翻訳や翻訳する人にとって理不尽な要求です。せっかくのAI翻訳を活用したいのであれば、また、翻訳する人に適切に翻訳してほしいのであれば、わかりやすく、翻訳しやすくなるように原文を書く必要があります。

そういった意味では、ASD(ヨーロッパ航空宇宙産業会)の私が属しているグループのASD-STE100 Simplified Technical English、いわゆる「シンプリファイド イングリッシュ ルール」は、多義的な解釈ができないように、つまり「一文、一義」となるように、「一語、一義で一品詞」を心がけています。このシリーズの中でも、ASD-STE100によるライティングのご紹介ができたらと思っております。

(終わり:AI翻訳や翻訳する人にやさしい文を書く)

<お問い合わせ>
記事に関するコメント、お問い合わせをお待ちしております。
お気軽にこちらまでお問い合わせください。

【コラム Vol.4】原文が有する曖昧さを解消する

 今度こそはわかりやすい文が書けたとひとりで悦に入っていると、校正者から思わぬ指摘が入ったり、(悪くすると、ドキュメントを発行した後に)お客様相談窓口を通してお客様からライティングについての苦情が入ったりするものです。校正者からの指摘やお客様からの苦情をよく確認してみると、自分が書いた論理的でわかりやすいはずの文に曖昧なところが残っていたのだと、妙に感心させられたりします。
 皆さんも、そういう経験をされたことがあるのではないでしょうか。このようなときに役立つのが機械翻訳です。(人間の)校正者が社内の関係者であれば、その製品やシステムが生まれた背景や、その新機能が付加されたコンテキストを知っていたりするので、自分と同じようなミスをする可能性があります。しかし、機械翻訳であれば、翻訳時にそういった背景やコンテキストを反映することはできませんので、原文に曖昧なところがあれば、その曖昧さを「反映した」翻訳をしてくれるはずです。ということで、翻訳結果を見れば、自分が書いた文の曖昧さを確認することができます。

今回は、単語どうしの関係における曖昧さを確認し、その改善策を検討します。

  1. 係り受けの曖昧さをなくす
  2. 格助詞の 「の」を多用して名詞をつなげない
  3. 格助詞の「で」を多用しない(1)【場所、手段、材料】編
  4. 格助詞の「で」を多用しない(2)【時間、理由・原因、状態】編
  5. 格助詞「に」「へ」「と」について – ご投稿にお応えします

1.係り受けの曖昧さをなくす[2021.12]

係り受けが曖昧なので、どの語を修飾しているのかわからないということはよくあります。たとえば、以下のようなケースです。
原文:近未来的なABC Corporationのスーパーカー
原文を見ると、「近未来的な」という形容詞が、「ABC Corporation」と「スーパーカー」のどちらを修飾しているのかわかりません。

「近未来的な」はどちらを修飾?

まずは、AI翻訳してみます。
AI翻訳:A futuristic ABC Corporation supercar
結果として、原文の曖昧さが翻訳文にも残ってしまいました。
そこで、原文に正しい係り受けを明示します。

「近未来的な」が「ABC Corporation」にかかる場合:
原文:近未来的なABC Corporationが開発したスーパーカー
AI翻訳:A supercar developed by the futuristic ABC Corporation

「近未来的な」が「スーパーカー」にかかる場合:
原文:ABC Corporationの近未来的なスーパーカー
AI翻訳:ABC Corporation’s futuristic supercar

今度は、両方とも、適切に翻訳できました。

2つ目の文の翻訳は、アポストロフィをつけて所有格にしています。通常、アポストロフィをつけて所有格にできるのは、人か擬人化できる名詞です。この場合は会社ですが、法人(=juristic person)というぐらいですから擬人化できるので問題ありません。もちろん、以下のような前置詞のofを使った翻訳にしてくれると嬉しいのですが。
The futuristic supercar of ABC Corporation
それでは、擬人化できないケースでは、AI翻訳は前置詞のofを使った翻訳にしてくれるのでしょうか。この問題は次の項でお話しします。

(終わり:1. 係り受けの曖昧さをなくす)

2. 格助詞の 「の」を多用して名詞をつなげない[2021.12]

 名詞を重ねての係り受けと言えば、格助詞の「の」を使って文をつなげていくという、あまり好ましくない習慣があります。格助詞の「の」には単に所有を表すだけではなく、場所や状態や属性などいくつもの意味がある(AAMT Journal No. 48, Nov., 2010)そうですので、その「の」を使って文をつなげていくのは無謀だと言えます。たとえば、「中村の本」といった場合、「中村が所有している本」というだけではなく、「中村が執筆した本」や「中村についていろいろと説明している本」などといった意味が考えられます。
 まず、格助詞の「の」の代表的な機能である「所有」を表すだけの、簡単な例を見てみましょう。
原文:緑色のプロジェクターのアーム
これも上記の例と同様に「緑色の」という形容詞が、「プロジェクター」と「アーム」のどちらを修飾しているのかわかりません。

「緑色の」はどちらを修飾?

これをAI翻訳してみます。
AI翻訳:Green projector arm
結果として、これも原文の曖昧さが翻訳文にも残ってしまいました。そこで、上記同様に、原文で正しい係り受けを明示します。
「プロジェクター」が「緑色」の場合:
原文:緑色のプロジェクターに付いているアーム
AI翻訳:Arm attached to the green projector
「アーム」が「緑色」の場合:
原文:プロジェクターの緑色のアーム
AI翻訳:Projector green arm

なんとか適切に翻訳することができました。欲を言うなら、最後の例は、
Green arm of the projector
と翻訳してほしかったですね。


そこで、もう少しつながりを複雑にすることで、擬人化できないケースで前置詞ofを使って翻訳できるかどうかを確認してみます。以下の例は、4つの単語による係り受けの例です。
原文:自動車の後部座席のエアコンのUIの形状
これをAI翻訳すると、アポストロフィによる所有格ではなく、以下のように前置詞ofを使った所有格を表す適切な翻訳が出力されました。
AI翻訳:UI shape of the air conditioner in the back seat of a car
2つ目の「の」は、所有ではなく場所として表現されています。また、最後の「の」は属性を表しています。それぞれが適切に翻訳されています。このケースではうまく翻訳できましたが、通常、4語以上の複合語の場合は、係り受けを明示できるように書き換えるべきでしょう。以下の改善例をご覧ください。
原文:自動車の後部座席に取り付けてあるエアコンのUIの形状
AI翻訳:The shape of the UI of the air conditioner attached to the back seat of the car

最後に
 いろいろと原文を考えていたら、以下のような複合語を考えつきました。どうでしょうか。
原文:社内人材育成事業推進本部長
AI翻訳:General Manager of In-house Human Resources Development Business Promotion Headquarters
どうやら、適切に翻訳できているようです。いずれにしても、4語以上の複合語は使用しないほうがいいです。複合語は3語以内とすべきでしょう。
 海外のサイトを見ていたら、こんなものもありましたよ。
Antidisestablishmentarianism 国教廃止条例反対論
Disestablishmentarianism
Establishmentarianism
Disestablishmentarian
Establishmentarian
Disestablishment
Establishment
Disestablish
Establish

(終わり:2. 格助詞の 「の」を多用して名詞をつなげない / 原文が有する曖昧さを解消する 第1回)

3.格助詞の「で」を多用しない(1) – 【場所/手段/材料】編[2022.1]

●格助詞の「で」を多用しない【場所】

「所格」=「場所」というぐらいですから、これは問題ないですよね。「所格」も次の「具格」も名詞について、名詞とほかの文節との関係を示します(格助詞)。
原文:村境で堺の人に声をかけられました。
AI翻訳:I was approached by a Sakai person at the village border.

「で」は問題無かったのですが、先回ご説明した「の」の多様さに惑わされてしまいました。格助詞の「の」は便利なのでいろいろなところでつい使ってしまいがちです。しかし、このような「の」の「説明を省略して丸め込んでしまう(?)ような」使い方は控えなければいけません。
原文:村境で堺から来た人に声をかけられました。
AI翻訳:I was approached by a person from Sakai at the village border.

あるいは、「堺」が地元ということであれば、以下のように変更します。
原文:村境で地元の人に声をかけられました。
AI翻訳:I was approached by a local at the village border.

“a local”で地元の人という意味になりますが、心配なようでしたら、“a local person”とすると誤解がなくなりますね。

AI翻訳が場所の「で」だと勘違いしそうな例を、意地悪く考えてみました。
原文:今日は、名古屋メシでいいですか。
AI翻訳:Is it okay to go to Nagoya Meshi today?

ちょっと無理がある感が否めないのですが、AI翻訳は「名古屋メシ」を場所だと勘違いしてくれました。「名古屋メシ」とは、グルメ激戦区である名古屋市の名物料理です。味噌カツやあんかけスパ、味噌煮込みうどん、きしめん、小倉トーストなど挙げればきりがありません(ちなみに、私はあんかけスパ派です)。
ところで、上記の文で使われている「で」は、一見、助詞のようですが、そうではありません。断定の助動詞「だ」の連用形です(「だ」は終止形です)。そうですね、「今日は名古屋メシだ」というかたちの連用形変化ですよね。ちょっと注意が必要です。
このような場合は、以下のように言葉を補う必要があります。AI翻訳を活用するためには、原文で言葉を省略してしまうのではなく、だれにでも理解できるわかりやすい文にする必要があります。
原文:今日の夕食は、名古屋料理の中から選んでいいですか。
AI翻訳:Can I choose from Nagoya cuisine for today’s dinner?

●格助詞の「で」を多用しない【手段】

これも「具格」=「道具」というぐらいですから、問題ないですよね。と、思っていたら、早速つまづきました。
原文:数値はノギスで計測する。
AI翻訳:Numerical values are measured in nogis.

使用したAI翻訳MTは「ノギス*」がわかりませんでした。技術用語とはいっても割と一般的なもののはずなのですが、「ノギス」が辞書登録されていないAI翻訳もあようです。注意が必要です。
原文:数値はノギスを使って計測する。
AI翻訳:Numerical values are measured using calipers.

  • ノギス:この名称は和製洋語です。和製洋語は、英語以外の用語を日本語化したものです。和製英語と区別するためにつくられた用語であり、その代表的なものが「ノギス」です。「ノギス」は、諸説あるようですが、古くはポルトガルの数学者の名前に由来して、オランダ語の“Nonius”(ノニウス)になり、そこから日本語化されたと言われています。「ノギス」は英語では“caliper”と言います。
●格助詞の「で」を多用しない【材料】

これも「具格」と同様の考え方で、格助詞の「で」は、「材料」=「~を使って」という意味にもなります。
原文:カバーは強い鋼でつくられています。
AI翻訳:The cover is made of strong steel.

ここは正しく翻訳できるようです。

(終わり:3. 格助詞の「で」を多用しない(1) – 【場所/手段/材料】編)

4.格助詞の「で」を多用しない(2) – 【時間、理由・原因、状態】編[2022.2]

今回は、時間、理由・原因と、状態について考えます。

格助詞の「で」を多用しない – 【時間】

「で」を使って時間の区切りを表します。この使い方も一般的ですが、使い方によっては曖昧になってしまいます。
原文:その催しは午後で終わりになります。
AI翻訳:The event ends in the afternoon.

「午後」という表現は曖昧です。「午後」というのは、いつからいつまでなのでしょうか。このあたり、個人差がありそうです。「午前」であれば「正午」までだと考えればよいのでしょうが、「午後」というと、自信がなくなります。正確さを信条とする気象庁では以下のように細かく分類されています。「午後」というと、お昼の12時から夜中の24時までだそうです。たしかに、そのとおりなのでしょうが、「今日の午後は何か予定がありますか」というと、まさか夜の9時以降だとはだれも思いません。そのほか、「未明」や「夕方」、「夜のはじめ頃」といったところは、皆さん方の感覚からは少し外れているのではないでしょうか。

参考:1日の時間細分図(府県天気予報の場合)
https://www.jma.go.jp/jma/kishou/know/yougo_hp/saibun.html

適切に翻訳するためには、時間を正確に表現する必要があります。
原文:その催しは夜になる前に終わります。
AI翻訳:The event ends before night.

時間を明示すると、誤解なく、適切に表現できます。
原文:その催しは夕方の6時ごろに終わります。
AI翻訳:The event ends around 6 o’clock in the evening.

格助詞の「で」を多用しない – 【理由・原因】

述語となる文節について、主節の理由/原因を表します(接続助詞)。理由や原因を表す「で」は少し無理のある表現だといえます。このような使い方は控えるべきです。
原文:そのPCはウイルスで使用できない。
翻訳:The PC cannot be used by a virus.

状況を具体的に説明する必要があります。
原文:そのPCはウイルスに感染しているので使用できない。
AI翻訳:The PC is infected with a virus and cannot be used.

格助詞の「で」を多用しない – 【状態】

述語となる文節について、主節の状態を表します(接続助詞)。
「で」は、状態も表します。状態の働きを表すのは接続助詞の「で」です。
原文:朝食は取らないで来ました。 =取らない状態で
AI翻訳:I did not have breakfast.

翻訳文からは、「ここに(来ました)」という意味が抜けています。原文の「取らないで来た」ということを伝えるために、原文に「ここに」を付け加えます。
原文:朝食は取らないで、ここに来ました。
AI翻訳:I came here without having breakfast.

原文:ドレスコード:正装でお越しください。 =正装の状態で
AI翻訳:Dress code: Please come in full dress.

原文:寒さと緊張で、大学受験に失敗してしまいました。=寒さと緊張の状態で
AI翻訳:I failed to take the university entrance exam because of the cold and nervousness.

翻訳文では、受験しなかったと誤解されてしまいます。そこで、「合格しなかった」ことを明示します。
原文:寒さと緊張のため、入学試験に合格できませんでした。
AI翻訳:I could not pass the entrance exam because of the cold and tension.

原文:ビジネスで海外に出張する人も、帰国後は14日間の自宅待機となります。
AI翻訳:Even those who travel abroad for business will have to wait at home for 14 days after returning to Japan.

この場合の「で」は接続助詞ではありませんね。また、翻訳文の文頭が「Even those who…」とおかしくなったのは、「も」を使ったので、MTが「強調」だと解釈してしまったからです。この「で」と「も」はどういう助詞なのでしょうか。形態素解析のツールであるMeCabを使って品詞の役割を調べてみましょう。

MeCabの実行結果

MeCabとは:日本文を品詞ごとに書き分けることができます。英語(屈折語)などのように単語間にスペースが入る言語や、中国語(孤立語)のようにそれぞれの言葉が互いに独立している言語と異なり、日本文は、品詞が互いにくっついている膠着語です。MeCabを使うことで、日本文を品詞ごとに確認することができます。

MeCabによると、「で」は格助詞であり、「も」は係助詞(または副助詞ともいう)となっています。格助詞は、このトピックで最初に説明しました。係助詞(副助詞)は、別名「取り立て助詞」として知られています。「取り立て」という意味は、これから「○○のことについて説明します」というように、これから話すことを文中で示すときに使われます。
この係助詞(副助詞)「も」は、一般的な取り立て助詞である「は」に置き換えます。
原文:ビジネスで海外に出張する人は、帰国後は14日間の自宅待機となります。
AI翻訳:Those who travel abroad for business will have to wait at home for 14 days after returning to Japan.

こうすれば、自然な表現になります。
取り立て助詞である「は」は、当然のことながら、係助詞(副助詞)です。「は」は主語につく格助詞だと思われていた方も、いらっしゃると思います。このところは、外国人の日本語学習者を悩ませるポイントにもなっているようです。

(終わり:4. 格助詞の「で」を多用しない(2) – 【時間、理由・原因、状態】編)

5.格助詞「に」「へ」「と」について – ご投稿にお応えします[2022.3]

格助詞、「に」「へ」「と」についてのご投稿をいただきました。今回は、「に」「へ」「と」の役割について皆さまと情報を共有したいと思います。

投稿の概要(内容を加工してあります)

「に」は「へ」や「と」と使い分けがむずかしいです。

  1. ベルギー行く
  2. 2.1 ノイハウスヴィタメールレオニダス
    2.2 ベルギーチョコ明け暮れた2020年

1.は「ベルギー『へ』行く」と言い換えられます。2.は「ノイハウス『と』ヴィタメール『と』レオニダス!」に言い換えられます。しかし、ニュアンスが違うような気がします。2.については、
2.1 ノイハウスヴィタメールレオニダス
とは言いづらいような気がします。それに、
2.2 ベルギーチョコ明け暮れた2020年
とは言えません。助詞「に」の翻訳に関連した話題がありましたらお願いしたいところです。

「に」は「へ」や「と」と使い分けがむずかしいというお話は、じゅうぶん納得できます。特に、「に」と「へ」は、どちらを使うべきか大きく迷ったりします。

■「に」と「へ」
ご指摘のとおり、方向を表す格助詞の「に」と「へ」は言い換えることができます。ただし、ちょっとニュアンスが違ってくることを意識すべきです。「に」と「へ」の違いは、以下のとおりです。
「に」: 特定の目的地→動作の到達点を表す
「へ」: (だいたいの)方向を表す
「に」が到達点や特定の場所を示すのに対して、「へ」は、元々、「あたり」を意味する名詞の「辺」(=中心から離れたところ)から、転じて付属語(助詞)になったものです。したがって、両者ではニュアンスが異なることがあります。
[例] 
遠くに行きたい → 遠くの特定の場所。ある場所がイメージされていることが多いようです。
遠くへ行きたい → 遠いところ。極端に言えば、遠ければどこでもいいという感じです。テレビのバラエティ長寿番組のタイトルにもなっていますね。その番組は、日本全国どこにでも出かける旅番組なので、「へ」のほうがしっくりきますね。
[例]
おじいさんは山へ柴刈りに、おばあさんは川へ洗濯に行きました。
→ 「山に/川に」であれば、日常的に行っている特定の場所(山/川)が想起されます。
このことを英語に置き換えると、以下のとおりになります:
山へ/川へ = a mountain / a river
山に/川に = the mountain / the river
この点を峻別できるAI翻訳には、さすがに、お目にかかったことはありません。
原文:おじいさんは山へ柴刈りに、おばあさんは川へ洗濯に行きました。
AI翻訳1:The grandfather went to the mountains to mow the grass, and the grandmother went to the river to do the laundry.
AI翻訳2:The old man went to the mountain to cut the grass, and the old woman to the river to wash the clothes.

■「に」と「と」
両者ともに項目を列挙するときに使用します。したがって、「並列」のときは、たがいに言い換えることができます。
2.1 ノイハウスヴィタメールレオニダス
2.1’ ノイハウスヴィタメールレオニダス
このケースの「と」に違和感を持たれるかもしれませんが、このような言い方もよく使われます。
ところが、
2.2 ベルギーチョコ明け暮れた2020年
おっしゃるように、このような言い方はできません。このケースの「に」は、「並列」ではなくほかの意味で使われているからです。
格助詞、「に」と「と」は以下のようなことを表すときに使用します。
「に」:到達点、場所、時、結果、対象、行為の対象(人)、適用の範囲
「と」:相手、一緒に、比較、変化、引用、内容
「2.2 ベルギーチョコ明け暮れた2020年」の「に」は、「対象」や「適用の範囲」を示します。
「ベルギーチョコ明け暮れた2020年」という表現は論外ですが、「ベルギーチョコ明け暮れた2020年」という「に」を使った表現も、翻訳者やMTにとっては、あまり適切なものであるとは言えません。もちろん、翻訳者であれば、その意味を理解できますので、問題なく翻訳できるでしょう。しかし、一瞬でも「どのように言い換えようか」と翻訳者に考えさせるのではいけません。
原文:ベルギーチョコに明け暮れた2020年
AI翻訳:2020 after the Belgian chocolate ???
このように、AI翻訳は「に」の役割を理解できていません。そこで、AI翻訳に適切に翻訳してもらうために、言い換えを考える必要があります。
原文:ベルギーチョコを食べ歩き、堪能しきった2020年
AI翻訳:2020 when I enjoyed eating Belgian chocolate

ビジネスに使用される翻訳の原文は、翻訳者がそのまますぐに翻訳できるものにすべきです。翻訳者に言い換えを考えさせて、翻訳者の時間を無駄に費やさせるものは良くありません。ここが、文学作品の翻訳との大きな違いです。文学作品は、複数の解釈を許容するものもあります。それに対して、ビジネス文は一文一義であり、直ちに他言語に置き換えられるべきものです。ビジネス文を書くときは、「国際共通語」ということを意識すべきです。
「並列」の「と」が出たついでに、副(並立)助詞の 「と」「や」「か」についてもご説明を加えておきます。

■ 副(並立)助詞の 「と」「や」「か」を使い分ける
「と」クローズド付加 それ以外に無い場合
「や」オープン付加 それ以外にもある場合
「か」選択
原文:ネジとスペーサーを使って、器具を取り付けます。
AI翻訳:Use the screws and spacers to attach the instrument.
原文:ネジやスペーサーを使って、器具を取り付けます。
AI翻訳:Use screws and spacers to attach the fixture.

原文の格助詞が「と」のほうでは、定冠詞が使われています。それに対して、「や」のほうでは、冠詞が使用されていません。このAI翻訳では、副(並立)助詞の「と」と「や」を識別できています。このように、AI翻訳でも副(並立)助詞の「と」と「や」を識別するものもあります。これは、少々驚きです。ほかのAI翻訳では、こういった細かな違いには気づけませんでした。

■「AとBかC」=A and B or Cの表現に注意する
曖昧になりやすい並立の端的な例として、「と」と「か」を使用する文、「AとBかC」=A and B or Cという表現があります。この表現をすると、以下のように複数の解釈ができるようになります。
・AとB
・AとC
・(AとB)かC
これは、日本文でも英文でも同様です。どうやら、これは言語を問わず、翻訳のときに曖昧になりやすい問題のようです。翻訳時には注意が必要です。私が現在ISOで進めている世界中の言語共通のライティングルールにもこの点の注意を喚起しています。
(終わり – 格助詞「に」「へ」「と」について)

【コラム Vol.3】日本語固有の助数詞は適切に翻訳できるか

 今回は、日本語固有の助数詞を取り上げます。助数詞は、「豚3匹」などのように、ものの数を数えるときに数字の後に着けるもので、「個」、「枚」、「回」、「組」などです。助数詞は、外国人の日本語学習者を戸惑わせたり、日本人も戸惑ったりするものもありますが、日本語の文章表現を豊かにする一要素であり、日本語と切っても切り離せないものです。
 AI翻訳が助数詞にどこまで対応できるかを調べます。日英でAI翻訳にかけた後、それを英日のAI翻訳で日本語に戻してみます。英日のリバース翻訳のプロセスで、適切に日本語の助数詞が翻訳されるかを確認していきます。

注)例文で「原文」等の明記がないものは全てAI翻訳の結果です。

評価のレジェンド
◎ 問題なく翻訳できている
〇 なんとかクリアした
△ 助数詞が適切に翻訳できていない
× 翻訳できていない

  1. 日英、英日共に良い結果(◎)を得られたもの[2021.9]
     例文:大空に飛行機が三機飛んでいる。
  2. 日英は良い結果(◎)だったが、英日は駄目(✗)だったもの[2021.10]
     例文:一筆啓上いたします。
  3. 日英、英日共に結果が駄目(✗)だったもの[2021.10]
     例文:彼女は一抱えの薪を重そうに運んできました。
  4. 日英は良い結果(◎)で、英日で助数詞が翻訳できなかったもの(△)[2021.11]
     例文:缶詰を一缶開けた。缶詰を一缶空けた。
  5. 日英は良い結果(◎)で、英日もまあまあの結果(○)だったもの[2021.11]
     例文:回数も重なって、4回、5回目になってくると、スムーズに手続きできるようになります。

【番外編】英語の助数詞的表現

1. 英、英日共に良い結果(◎)を得られたもの[2021.9]

助数詞が適切に英語に翻訳され、さらにその英語から日本語にリバース翻訳して助数詞が再現されたものです。

原文:大空に飛行機が三機飛んでいる。
◎ Three planes are flying in the sky.
◎ 3機の飛行機が空を飛んでいます。

原文:古城の城壁には、三門の大砲が置かれていました。
◎ On the wall of the old castle, there were three cannons.
◎ 古い城の壁には3門の大砲がありました。

原文:競技会のために、靴を三足買いました。
◎ I bought three pairs of shoes for the competition. 
◎ 大会用に靴を3足購入しました。

今回の助数詞は、よく使われるものなので、どの言語でも理解できそうです。

【番外編】ご参考までに、英語の助数詞的表現を挙げます。
a sheet of paper: 紙1枚
a piece of chalk: チョーク1本
a glass of water: グラス1杯の水
a bottle of water: ボトル1本の水
a cup of coffee: 1杯のコーヒー
a bunch of green onions: 1束のネギ
a bundle of pasta: パスタ1束
two pairs of pants: ズボン2着
four head of cattle: 牛4頭
a crowd of spectators: 観客の群れ
a school of little fish: 小魚の群れ
a pride of lions: ライオンの群れ
a troop of schoolchildren: 学童の一団

2. 日英は良い結果(◎)だったが、英日は駄目(✗)だったもの[2021.10]

英日のリバース翻訳が良くなかったものです。翻訳結果はいずれもAI翻訳によるものです。

原文: 各自の演奏は5曲までとする。
◎ Each person can play up to 5 songs.
× お一人様5曲まで再生できます。

助数詞はクリアできたが、翻訳自体がまちがっていました。「play」には「演奏する」と「再生する」という意味があります。

原文: 桜の花が一枝添えられていた。
◎ A branch of cherry blossoms was attached.
× 桜の枝がついていました。

原文: 一筆啓上いたします。
◎ I will give you a brief message.
× 簡単なメッセージを差し上げます。

こういった漢語的表現も理解できましたが、英日リバース翻訳で「一筆」というわけにはいきませんでした。

原文: その負傷した兵士の腕には、七重八重に包帯が巻かれていました。
◎ The injured soldier’s arm was bandaged seven-fold and eight-fold.
× 負傷した兵士の腕は7倍と8倍に包帯を巻かれていました。

原文: 寄付は10口まででお願いします。
◎ Please donate up to 10 units.
× 10台まで寄付してください。

3. 日英、英日共に結果駄目(✗)だったもの[2021.10]


日本語の助数詞が特殊すぎて、日英での翻訳から助数詞が適切に翻訳できなかったものです。結果として、英日のリバース翻訳にまで影響しました。原文を書くときに翻訳しやすくなるように言い換えることが必要です。原文修正にもチャレンジします。

評価のレジェンド
◎ 問題なく翻訳できている
〇 なんとかクリアした
△ 助数詞が適切に翻訳できていない
× 翻訳できていない

原文: 彼女は一抱えの薪を重そうに運んできました。
× She carried a handful of firewood heavy.
× 彼女は一握りの重い薪を運んだ。

原文: 母は、子供たちの学習用にと鉛筆を5打購入しました。
× My mother bought five pencils for her children’s learning. 
これはさすがに無理でした。

原文: その家の床の間には、一幅の掛け軸がかかっていたが、聞くところによるとその掛け軸は盗難にあったということだ。
× There was a wide hanging scroll between the floors of the house, but I heard that the hanging scroll was stolen. 

ついに、ここで力尽きた感じです。「床の間」= alcoveも適切に翻訳できていません。

原文: そうめんは、いつもだいたい3把は食べられます。
× You can always eat about 3 pieces of somen.
 
これもだめでした。

原文修正により、ある程度は翻訳を改善できました。
少し特殊な助数詞は英語に翻訳しやすい表現に言い換える必要がありますね。

(終わり)
記事に関するコメント等、 お気軽にこちらまでお問い合わせください。

4. 日英は良い結果(◎)で、英日で助数詞が翻訳できなかったもの(△)

日英は問題ないのですが、英日のリバース翻訳で助数詞を表現できませんでした。

原文:椅子をあと5脚準備すること。
◎ Prepare 5 more chairs.
△ さらに5つの椅子を準備します。

原文:缶詰を一缶開けた。缶詰を一缶空けた。
◎ I opened a can. I emptied a can.
△ 缶を開けました。 缶を空にしました。

このあたり、ちょっと混乱しそうですが、なんとかだいじょうぶです。

原文:テーブルの上には、茶器が3組置かれている。
◎ Three sets of tea utensils are placed on the table.
△ テーブルの上に3セットの茶器が置かれています。

原文:マジックショーのためにトランプを4組用意してください。
◎ Please prepare 4 sets of playing cards for the magic show.
△ マジックショー用のトランプを4セット用意してください。

5. 日英は良い結果(◎)で、英日もまあまあの結果(○)だったもの

第1回のグループと比べて、日英、英日共にまあまあの翻訳結果だったものです。いずれも、助数詞は再現されています。

原文:回数も重なって、4回、5回目になってくると、スムーズに手続きできるようになります。
◎ The number of times will overlap, and when it comes to the 4th and 5th times, you will be able to complete the procedure smoothly.
〇 回数が重なって4回目と5回目になるとスムーズに手続きが完了します。

原文:その機関車は、最大で30両の貨車を連結して走ることができる。
◎ The locomotive can run by connecting up to 30 freight cars.
〇 機関車は最大30両の貨車を接続して走ることができます。

助数詞とは関係ないので残念なのですが、定冠詞が抜けると意味が変わってきます。

【事例研究発表】AI翻訳だからこそ、翻訳元の文に論理性が必要

[2021.8] AI翻訳は、どんな文でも翻訳できるのでしょうか?

TCシンポジウム2021 on the Webで事例研究発表いたしました。その概要をお伝えします。

AI翻訳であれば、分野を限定することで「どんな文でも翻訳できる」と聞くこともありますが、実現可能なことなのでしょうか?主語と述語が対応していない、目的語が存在しないなどの文は論理的でありませんが、翻訳結果は得られるので嘘ではなさそうです。しかし、その翻訳結果が「このレベルではAI翻訳はまだ使えたものではない」といった評価につながり、AI翻訳の導入をためらうという例をよく耳にします。今日のAI翻訳は、ニューラルネットワークに基づくディープラーニングを重ねることで翻訳性能が向上すると言われていますが、翻訳性能が向上するのをただ待つだけしかないのでしょうか?
これらの疑問が今回の事例研究発表に繋がりました。

翻訳元の⽂に論理的で簡潔でわかりやすいものを使⽤することで、AI翻訳の品質を向上させることができ、そして、それが結果として⼈による翻訳作業においても正確性向上や効率化に寄与できるのではないか?といった点を検証していきます。論理的な問題点を含む翻訳元の例文とその翻訳結果を見ながら検証し、注意すべきポイントと具体的な対応策の検討を行います。この事例発表に参加することで、翻訳元のどこを修正すればAI翻訳の品質向上に繋げられるかを確認できます。

[2021.10] 発表資料ダウンロードのご案内

TCシンポジウム2021で発表したセッション資料をご案内いたします。以下のURLに発表資料を掲載しております。
AI翻訳だからこそ、翻訳元の文に論理性が必要
~ツール特性を整理し、1次著作物制作でのAI翻訳活用を考える~
注)2021年12月現在、リンク先のページは、TC協会会員様向けページとなっており、IDとパスワードが必要です。
資料をご希望の場合は、お問い合わせいただけましたらお送りします。
資料掲載ページ:https://jtca-web.com/sessions/2021/4611/

記事に関するコメント等、 お気軽にこちらまでお問い合わせください。

【コラム Vol.2】AI翻訳を上手に活用するための3つの基本ルール

このシリーズでは、情報を「つかう」、「つたえる」という利⽤者の視点で、AI翻訳の活⽤を考えていきます。
これまでのAI翻訳に関する議論では、まず原⽂が存在し、翻訳担当者が原文を翻訳するという視点で論じられてきました。これは情報を提供する側の視点です。
多くの⼈がスマートフォンを利⽤する時代になりました。情報利⽤者が⾃⾝でスマートフォンに搭載されている翻訳機能を用いて、原文の言語を問わずに自在に情報を得ることを想定する必要がでてきました。情報は利⽤者が内容を理解して初めて⽬的を達成します。利⽤者が情報を必要に応じて理解可能な言語に変換し、適切に情報活⽤できるようにすることは、情報の価値を高めることに繋がります。そのためには、誤訳や訳抜けが発⽣しないように原⽂を書くことが必要になります。

これは決して難しいことではありません。以下の3つの基本的なルールを押さえることで対応できます。
AI翻訳を上⼿に活⽤するための3つの基本ルール
Rule 1. 論理的に、簡潔に、また正確に書く
Rule 2. ⾔語に固有のメタファー(⽐喩)を避ける
Rule 3. 和製英語や定着していないカタカナ⽤語は使⽤しない

この3つのルールはライティングでも基本的な決まりごとであり、⼈が翻訳するかNMTで翻訳するかに関わらず必要なものです。

■Rule 1.  論理的に、簡潔に、また正確に書く

普通にライティングするときも、翻訳するために原⽂を書くときも、まずこのルールを順守することが必要です。このルールを具体的に説明するために、「グライスの協調の原理」を紹介します。「グライスの協調の原理」とは、コミュニケーションを効率的に進めるために必要な要素(公理)を説明したものです。「グライスの協調の原理」は「量、質、関連性、⼿法の4つの公理」から成り⽴っています。

量: テキストの量が少なすぎれば、理解しにくくなります。かといってテキストの量が多すぎると、伝えたいことがテキストの中に隠されてしまいます。少なすぎず、多すぎず、伝えるために必要な適切な量のテキストが必要です。
質: テキストの内容が間違っていたり、その論理がでたらめであれば、適切に伝わりません。主語と述語を明快に書き、 ”who does what to whom” (誰が誰に何をするのか)などがすぐにわかるように簡潔に書きます。
関連性(コンテキスト): ⽂を書くときに、突然、それまでと関係のないことを書くと読者は⼾惑ってしまいます。論理にしてもストーリーにしても、前の⽂と関係のあることを書くことが重要です。
⼿法: 情報の種類によってそれぞれ効果的な伝達⽅法を使⽤します。

いずれの公理も当たり前の内容なので簡単なことのようですが、この公理を守れていない⽂をよく⾒かけます。守れていないと、翻訳するときも適切に翻訳されなくなります。どんな⽂でも翻訳できると強弁する⽅もいらっしゃるかもしれませんが、それは実際には不可能です。間違って翻訳されれば、なんとか翻訳できたとしても、相⼿には適切に伝わらなくなります。
上記の⼿法の3つについては、皆さんご納得いただけたと思います。もちろん、関連性(コンテキスト)についても誰も関係のない話はしないよとご理解いただけていることと思いますが、ところが、実際には必ずしも守られていないことがあります。読者の経験や知識のバックグラウンドを調べないままにライティングしたりしていませんか。または、そこまで⼤胆なことはしないにせよ、ちょっとした気配りが足りなかったりします。
以下の例をご覧ください。

■関連性(コンテキスト)を補完する
⼈間翻訳とAI翻訳の違いは、細かなコンテキストの流れに対応できるかどうかというところにあります。⼈間は⽂と⽂のつながりや⽂章全体の流れやトーン、つまりコンテキストや背景を把握し、それを各⽂の翻訳に反映させることができます(優秀な翻訳者の場合ですが)。しかし、AI翻訳はこれまでの機械翻訳(MT)と異なってAIなのだからとはいうものの、⽂単位での翻訳になりますので、⽂と⽂のつながりまでなかなか反映してくれることは難しいのです。たとえば、以下の⽂を見てください。

原⽂: You may be infected with Ebola hemorrhagic fever, no matter how cold the weather is.
Countries in the polar zone have reported cases of Ebola hemorrhagic fever.
AI翻訳結果: どんなに寒くても、エボラ出⾎熱に感染する可能性があります。 極地の国々は、エボラ出⾎熱の症例を報告しています。


翻訳結果の2つ⽬の⽂のつながりが少しぎこちなくなっています。1つ⽬の⽂で「どんなに寒くても」と⾔っておきながら、2つ⽬の⽂では当然のことのように寒冷地でのエボラ出⾎熱の症例について語っています。このように、AI翻訳はコンテキストを読めないので、⽂単位での翻訳になることを意識して原⽂を書くべきだということが確認できます。原⽂のCountries in the polar zoneというところは、Even with countries in the polar zone (極地の国々でさえも)としてあげる必要があります。

原⽂: You may be infected with Ebola hemorrhagic fever, no matter how cold the weather is. Even with countries in the polar zone have reported cases of Ebola hemorrhagic fever.
AI翻訳結果: どんなに寒くても、エボラ出⾎熱に感染する可能性があります。 極地の国々でも、エボラ出⾎熱の症例が報告されています。


こういったちょっとした気遣いをすることで、翻訳性能は向上します。こういった気遣いをpre-edit (プリエディット)と⾔います。翻訳したりNMTにかけたりする前に、⼈間の翻訳者でもNMTでも翻訳しにくそうなところを事前に修正しておくわけですね。
(終わり)
記事に関するコメント等、 お気軽にこちらまでお問い合わせください。

Rule 2. 言語に固有のメタファー(比喩)を避ける

基本ルールの2つ目は、「言語に固有のメタファー(比喩)を避ける」です。
2つの言語間でスムーズにコミュニケーションするためには、日本語/英語それぞれのネイティブにしかわからないメタファーを避ける必要があります。たとえば、以下の例文を見てみましょう。

原文:あの政治家は腹が黒い。
AI翻訳結果:That politician has a dark stomach.

原文の「腹が黒い」というメタファーは理解されず、日本語原文のままに直訳されています。日本語の原文を書き起こすときや翻訳する前に、日本語に固有なメタファーを言語間で共通で一般的な表現に置き換えておく必要があります。このことを、ローカリゼーションの世界では「Internationalization (I18n)」と呼びます。「Localization (L10n)」する前に、テキストをまず「一般化」するわけです。

修正原文:あの政治家は誠実ではない。
AI翻訳結果:That politician is not sincere.(政治家の場合はThat politician is not honest.のほうがしっくりするような気がしますが、これでもだいじょうぶだと思います。)

「一般化」した表現で文を書くことで、翻訳における不要な間違いを避けることができます。ところが、以下の例を見てください。以下の例文ではメタファーが適切に翻訳されています。なかなかやるな、NMTというところでしょうか。

原文:You can catch flu, no matter how you take care about your health.
AI翻訳結果:どんなに健康に気を付けても、インフルエンザにかかる。

この場合のcanは「能力」ではなく「その可能性がある」という意味を表します。catchはインフルエンザ菌を運悪くつかんでしまう→つまり、罹患してしまうというメタファーです。can catchで「罹患する可能性がある」ということになります。インフルエンザは病気としても一般的なので、このNMTツールは、すでにこのメタファーを学習しているものと思われます。ところが、特殊で難解な病名の場合は、NMTはそれを病名として認識しないので、以下のような珍訳が生じることになります。

原文:You can catch Ebola hemorrhagic fever, no matter how you take care about your health.
AI翻訳結果:どのように健康に気を配っていても、エボラ出血熱をキャッチすることができます。

このような珍訳を避けるためには、原文を、メタファーを含まないより一般的な表現に変える必要があります。can catchをmay be infected(感染する)と具体的にします。

修正原文:You may be infected with Ebola hemorrhagic fever, no matter how you take care about your health.
AI翻訳結果:どのように健康に気を配っていても、エボラ出血熱に感染する可能性があります。

これでNMTでも適切に翻訳できるようになります。言語に固有のメタファーを避けて、原文を「一般化」するよう心がけます。

<参考>すべてのメタファーがだめだというわけではない。
翻訳するときにメタファーを避けると申しあげましたが、避けるのは日本語/英語それぞれのネイティブにしかわからないものの場合だけです。日本語/英語で共通のメタファーも数多くあります。共通メタファーの多くは、幕末から明治にかけて英語などの文献から日本語に翻訳されたものです。
 幕末から明治にかけて多くの概念が日本語に翻訳されました。「科学」や「文化」、「論理」や「倫理」、「資本」や「左翼」といったそれまでの日本に存在しなかった概念や「一石二鳥」や「豚に真珠」などのことわざが日本語に翻訳されました。その中には「何が彼女をそうさせたか」といった、いわゆる無生物主語を使った文章表現技法などもありました。これは日本語に逐語翻訳されたものですが、同様に逐語的に翻訳されたメタファーもありました。

メタファーの例
日本文:我が道を行く。(人生を道に見立てる)
英文: I’m going my way.
日本文:人の海で自分を見失ってしまいました。(大勢の人を海に見立てる)
英文: I was lost in a sea of nameless faces.

メタファー生成の流れ — 素材から目標へ
素材[物理的につながれた関係] → 目標[近しい関係]

日本文:船がブイにつながれている。 → あの代議士は暴力団とつながっている。
英文:The ship is connected to the buoy. → That representative is connected to the gangsters.

メタファーに似たものにメトニミー(換喩)があります。メトニミーは素材に近いものに置き換えます。つまり、素材自体ではなく素材に関係のあるものに置き換えます。夏目漱石の「坊ちゃん」に出てくる教頭は「赤シャツ」ですよね。

メトニミーの例
日本文:やかんが沸いています。(沸いているのは「やかん」ではなくやかんの中の「水」)
英文: The kettle is boiling.

日本文:彼はBMWを運転しています。(運転しているのは「BMW」ではなくBMWの「車」)
英文:He drives a BMW.

このように、日本語原文でも英文でもメタファーやメトニミーは互いに似通っていたりします。また、英語のイディオムでも日本語としてもよく理解できるものもあります。たとえば、以下の例をご覧ください:

to come out of your shell 殻から出てくる → 社交的になる (← 殻に閉じこもる)
keep me posted 投稿し続けてね → 必ず連絡してね
hot off the press 印刷したばかり → 最新の (刷りたての)
すぐにわかるものばかりですね。

(終わり)
記事に関するコメント等、 お気軽にこちらまでお問い合わせください。

Rule 3. 和製英語や定着していないカタカナ用語は使用しない

日本語の中には、英語の原義から外れた和製英語があります。また、新たにカタカナ用語をつくりだすことを好む文化があります。和製英語を不用意に使うと誤訳が生じる原因になります。あるメーカーが自社の商品開発をオフショア化(海外の企業に委託開発)しようとして、開発仕様書に(良かれと思って)カタカナ用語を多用したところ、海外の委託先からほとんど理解してもらえなかったという笑えぬ笑い話があります。

実は、和製英語のような現象は日本語に限ったことではなく、ヨーロッパ言語などでも見られます。使用する際の注意を喚起する意図で、これらの用語はFalse friends(偽りの友)と呼ばれています。たとえば、スペイン語のrealizarは英語のrealizeではありません。realizarは英語ではcarry out(実行する)という意味になります。また、イタリア語のdisposizione(arrangement)は英語のdispositionとは完全には一致しません。

原文:部屋を畳からフローリングに替えた。
AI翻訳結果:I changed the room from tatami mats to flooring.

フローリングという言葉は和製英語です。翻訳結果では直訳になっています。英語で正しくはwooden floorと言います。
英語原文:I changed the room from tatami mats to wooden floor.
AI翻訳結果:部屋を畳からフローリングに変更しました。

英語から日本語への翻訳では、適切に和製英語に替えてくれています。以下にもう2例挙げます。
原文:社会からさまざまな財貨やサービスを受け入れて、それにプラスアルファを付けて社会に還元する。
AI翻訳結果:We accept various goods and services from society and give them back to society with a plus alpha.

プラスアルファは和製英語です。英語としてはsomething extraとかplus Xと言います。

英語原文:We accept various goods and services from society and give them back to society with something extra.
AI翻訳結果:さまざまな商品やサービスを社会から受け入れ、何か特別なものを社会に還元しています。

プラスアルファはsomething extraには置き換えられませんでしたし、英語のsomething extraはプラスアルファには置き換えられませんでした。このように、カタカナ用語を使うときは、注意が必要です。

原文:その会社は今年の春にハイビジョンテレビを売り出した。
AI翻訳結果:The company launched a high-definition television this spring.
AIリバース翻訳:同社は今春、高精細テレビを発売した。

「ハイビジョンテレビ」は和製英語です。日本語としては高精細度テレビと言います(しかし、この日本語はあまり使用されていないようですね)。翻訳結果ではhigh-definition televisionと英語として適切に翻訳されています。
このように新しい技術用語には和製英語が多く使われています。たとえば、リニアモーターカー=linear motor carは、英語圏ではmagrev trainと呼ばれています。

このように日本語には和製英語がたくさん使われているので注意が必要です。もちろん、NMTでもその違いは適切に置き換えてくれる場合もありますが、和製英語や定着していないカタカナ用語は、誤訳の原因となり得ますので、使用しないことが大事なポイントになります。
(終わり)
記事に関するコメント等、 お気軽にこちらまでお問い合わせください。

【コラム Vol.1】 翻訳品質を考える前に – 見落としがちなこと

[2021.2] 日本文の論理性と固有名詞

 英文は、論理のつながりで表現しますので、日本文ではあまり気にならないような非論理的な文や論理が飛躍した文を、英語に翻訳すると文が行き詰ってしまいます。機械翻訳では、おかしな英文となって表れますし、固有名詞を誤訳すると、伝えたい内容の誤りが生じます。
 AI自動翻訳を活用するために心がけるべきことは、論理性固有名詞です。このポイントさえ押さえておけば、AI自動翻訳はあなたにとって便利なツールになります。固有名詞は用語集を作ってそれぞれの用語の対訳を準備しておくことで対応します。
 用語集がないことが引き起こしたと思われる事例をひとつ紹介します。以前、アメリカのFBIのトップページの「Most wanted (指名手配中)」が日本語では「募集中」になっていました。だいたい、自動翻訳の失敗の笑える原因は固有名詞の誤訳によるものです。ここでは固有名詞と書きましたが、一般名詞や特定の目的で使う動詞なども考慮に入れる必要があります。
 この論理性固有名詞の問題は、とても重要です。もちろん、この2種類の問題を生じないように対処しておけば、どういった分野であってもそれなりの翻訳は得られるものです。特に特定分野での翻訳であれば、良い結果が得られます。逆に対象を絞らない場合は、AI自動翻訳であっても良い翻訳結果は得られません。“Time flies like an arrow.”の例でおわかりのように、同綴異義語や品詞の文法的な解釈の可能性が広くなり過ぎるためです。

同綴異義語:「どうてついぎご」と読みます。同じつづりで、意味の異なる用語という意味です。たとえば、flyは蠅という名詞であったり、飛ぶという動詞であったりします。

 今後のコラムでは、「より一般的な」文章を使って、AI自動翻訳の問題点を実際にAI自動翻訳機で検証していきます。次回にご期待ください。

(終わり)
記事に関するコメント等、お気軽にこちらまでお問い合わせください。

[2021.3] 1文章中の主語について

 機械翻訳を使って翻訳していると、何の脈絡もなしに主語が入ってきたり、その主語がほかの人称の主語と入れ替わったりします。なぜこんなことが生じるのでしょうか?
 日本語では、主語が明快に示されてないことが多々あるため、主語を省略して書かれることがあるためです。逆に、主語が文の前後関係で容易に判断できるときに主語を入れると、日本文としてぎこちない文になったりします。それに対して論理的な言語である英語では主語は必要ですので、機械翻訳は、主語が明示されていない文に便宜的に主語が必要になり、主語が現れることになります。

 日本文では、なぜ主語が省略されるのでしょうか。日本語が他者と視点を共有する言語だからなのでしょうか。それはさておき、自分が読んで理解するためだけのものでしたら、別に気にしなくてもいいのですが、せっかく翻訳するわけですので、主語を統一したいですよね。

さて、今回の例題はこちらです。
例題:  わかりやすい⽂を書けば、翻訳しやすくなりますか︖
AI翻訳(JA→EN):
  Would it be easier to translate if I wrote understandable sentences?
AI翻訳(EN→JA):  わかりやすい文章を書くと翻訳しやすくなりますか?

 英文で主語がどうなるのかまったく意識していなかったのですが、この例のように唐突に「I」という主語が入ると、英語では主語が省略できないのだと改めて思い知らされます。この質問の内容からすると、この翻訳のように「I」という主語でもしっくりきます。それは、トラブルシューティングでの質問のように、質問者の視点で書かれていることを考えれば自然だからです。ただ、マニュアルなどの操作説明中心の文では「you」が中心になりますので、文脈的に近いところで「you」と「I」が混在していたら不自然になります。そういう場合は、原文である日本文を書き換えることで、「I」が翻訳されないようにします。

原文を以下のように書き換えてみました。
修正版:  内容がわかりやすい⽂であれば、翻訳しやすくなりますか︖
AI翻訳(JA→EN): Would it be easier to translate if the contents were easy to understand?
AI翻訳(EN→JA): 内容がわかりやすい方が翻訳しやすいでしょうか?

原文の変更で、「I」が翻訳されなくなったことが確認できます。いずれにしても、一貫して一つの主語を使い続けることが、機械翻訳での重要な課題になりますね。機械翻訳の機能で対応できることはないのでしょうか?

(参考)AI翻訳製品で試してみました

(終わり)
記事に関するコメント等、 お気軽にこちらまでお問い合わせください。

[2021.5] AI翻訳に誤訳があった場合の対処方法

AI翻訳は、流暢に誤訳することがあります。従来のルールベース機械翻訳(RBMT)や統計的機械翻訳(SMT)の場合は、誤訳したところは不自然な表現となり一目瞭然でしたが、AI翻訳の場合は、翻訳された内容の確認が必要です。この確認作業もAI翻訳を活用して英日のリバース翻訳した日本語で確認できます。

誤訳の例
(原文)しかし、翻訳しやすい文とは、書き⼿が意図したとおりに⼈や機械が⽂構造を分析でき、⽤語や文を⼀義に解釈できる文章です。
(AI翻訳:JA→EN)However, sentences that are easy to translate are sentences in which people and machines can analyze sentence structure as intended by the writer, and the terms and sentences can be interpreted unilaterally.
(AI翻訳:EN→JA)しかし、翻訳しやすい文は、人や機械が意図する文章構造を筆者が分析できる文章であり、単語や文章を一方的に解釈することができます。
 

リバース英日翻訳の結果をみると、確かに流暢に翻訳されています。内容確認作業において、原文で記述している内容を知らない第三者の方がこの誤りに気づくには、原文も確認し記述内容を理解しなければなりません。しかし、原文を執筆された方や、記述内容を知る方が確認すれば、すぐに気づけることでしょう。 

原文の1つ目の太字の行為者が、リバース英日翻訳では入れ替わっています。AI翻訳では、このように流暢に誤訳することがあります。また、unilaterallyに翻訳されています。unilaterallyとはone-sidedlyという意味ですので誤訳が生じています。

原文を見ると、文章構造が複雑であること、使用する単語の意味が明確でなかったことが、誤訳につながったようです。対処方法としては、文章構造をシンプルにすることです。
以下は、原文を2文に分け、誤訳した一義にを意図が明確になるように修正した例を示します。

修正した例
(修正文)しかし、翻訳しやすい文とは、執筆者が意図したとおりに、⼈や機械が文の構造を分析できる文ですそして、⽤語や文が1つだけの意味になるように解釈できる文です
(AI翻訳:JA→EN)However, a sentence that is easy to translate is a sentence that allows humans and machines to analyze the sentence structure as the author intended. And it is a sentence that can be interpreted so that the word or sentence has only one meaning.
(AI翻訳:EN→JA)しかし、翻訳しやすい文は、作者が意図したとおり、人間や機械が文の構造を分析できる文です。 そして、それは単語や文がただ一つの意味を持つように解釈できる文です。

原文修正により、リバース英日翻訳をした日本文でも、原文の意図通りに翻訳されていることが確認できます。
その他、誤訳した結果をポストエディットして、再度AI学習させる方法もあります。ポストエディットし、修正された箇所も含めてAIに学習させることによって、AI翻訳の誤訳を減らします。

SYSTRAN からのAI翻訳活用ひとことメモ
 誤りに対するAI翻訳での基本的な対処方法は、ポストエディットしてTranslation Memoryに残し、それをAI学習することで、持続的に間違いが少なくなり、最終的にはポストエディットをなくしていくという方法になります。
 そこには言語学的な冠詞や不定冠詞、形容詞、名詞、係り受け云々という概念はなく、ただ「データ=経験」があるだけです。わからなければ例文で追加学習するということの繰り返しになります。これらは、RBMTやSMT時代の翻訳品質向上の世界観とは異なる、より実践的で、より人間に近いものと言えます。言語学的知識がなくても理解しやすいはずです。

(ご参考)自社のTranslation MemoryでAI学習が可能なAI翻訳エンジン(五十音順)

(終わり)
記事に関するコメント等、 お気軽にこちらまでお問い合わせください。

その疑問にお答えします

[2021.1] わかりやすい文を書けば、翻訳しやすくなりますか?

焦点が異なるので、わかりやすい文翻訳しやすい文になるとは限りません。わかりやすい文とは読み手が内容を容易に理解できる文です。しかし、翻訳しやすい文とは、書き手が意図したとおりに人や機械が文構造を分析でき、用語や文を一義に解釈できる文です。

[2021.1] 用語や文を一義にしか解釈できないようにするとは?

書き⼿の意図と読み⼿の理解が⼀致できるようにするために、原文を⼀つの意味にしか解釈できないようにすることです。人が翻訳するにしても機械が翻訳するにしても重要なことで、ライティングでよく言われる一文一義ということですね。

[2021.1] 文を短くすれば、翻訳しやすくなりますか?

短い文が翻訳しやすいとは限りません。
たとえば、以下の5語で書かれた英文を日本語に翻訳し、翻訳しやすいのか具体的に見ていきます。

[原文] Time flies like an arrow.

[翻訳例]

  1. 時間は矢のような速さで過ぎていきます。
    ことわざの「光陰矢の如し」です。
    この翻訳は、Timeを名詞、fliesを動詞、likeを前置詞として解釈した場合のことです。

たった5語で書かれた文ですが、以下のように少なくとも4つの異なる意味にも翻訳できます。

  1. 「時蠅」は矢印を好みます。
    これは、Timeを名詞(形容詞的用法)、fliesを名詞、likeを動詞として解釈した場合。
  2. 矢に似た蠅の速さを測ってください。
    これは、Timeを動詞、fliesを名詞、likeを前置詞として解釈した場合。
  3. 矢の速さを測るように蠅の速さを測ってください。
  4. 矢が蠅の速さを測るように蠅の速さを測ってください。
    上記の2つはTimeを動詞、fliesを名詞、likeを接続詞と解釈した場合。

短い文でも、さまざまな解釈が成り立ちます。英単語はそれぞれ異なる意味を持つ同義語が存在するというだけでなく、1つの単語が異なる品詞に使われたりします。一義的な解釈を確実に成立させるためには、 1つの単語を1つの意味だけに限定するだけではなく、品詞も1つに限定する必要があります。Time flies like an arrow. の例で見てみると、Timeを名詞に、fliesを動詞に限定すれば、1つの意味(1の例)に解釈できます。

[2021.1] 原文を翻訳しやすくするために注意することは?

英文ライティングのガイドラインであるASD-STE100シンプリファイドイングリッシュでは、単語に意味的、品詞的な制限を設けることで文の意味を一義に解釈できることを追求しています。原文を翻訳しやすくするために、ほかの言語でも同様の作業が必要となります。

日本語では、長文語順情報の並列明示係り受け助詞用語集といった点が挙げられます。書き手の意図が、読み手の理解と一致するように意識して日本文を書けば、読み手が独自にAI自動翻訳で翻訳した場合にも、適切に翻訳されることでしょう。

エレクトロスイスジャパン(ESJ)ができること

ESJでは以下のようなお手伝いをさせていただきます。

  • マニュアル原稿の評価と改善
  • 開発部門(技術者)に対する(簡単な)ライティング指導

AI学習データとして、既存TMを使うことは最適か?

AI 自動翻訳にTM データを再利用しようとしても、その翻訳元データの内容に問題が多ければ、適切な翻訳文は生成できません。原文がわかりにくければ、誤訳されたものになるか、翻訳文もわかりにくいものしか出力されません。

翻訳できると、人が理解しやすい翻訳ができるとは同じではありません。AI 自動翻訳を活用するために、原文をしっかりと分析して、翻訳しやすい文に書き換えることが重要です。

株式会社エレクトロスイスジャパン 中村 哲三

株式会社エレクトロスイスジャパン
中村 哲三

企画運営:株式会社 情報システムエンジニアリング  協力: 株式会社 エレクトロスイスジャパン

参考資料

  • Stylistic Guidelines in Localization (SGL) ISO/PWI 24620-4 中村が進める、ライティングの国際 共通規格
  • ASD-STE100 Simplified Technical English (AeroSpace and Defense: ヨーロッパ航空宇宙産業界)

関連情報

お問い合わせ

お気軽にお問い合わせください。
※株式会社情報システムエンジニアリングよりご案内させていただきます。

*)セールスに関してご返信はいたしませんので、あらかじめご了承ください。

個人情報の取り扱いについて

Copyright © 2021-2022 Information System Engineering Inc. All rights reserved.