AI翻訳でリバース翻訳して、翻訳しやすい日本語を作成するための勘所(第3回)~ AI翻訳のチューニングのポイント ~

 AI翻訳のリバース翻訳を活用して、翻訳しやすい日本文を作成するための勘所を探ります。これまでに、AI翻訳でリバース翻訳して、翻訳しやすい日本語を作成するための勘所を探るために検証を進めてきました。第3回では、これまでの検証で、確認された課題に対してAI翻訳のチューニングでどこまで対応できそうか、検証を進めます。

AI翻訳でリバース翻訳して、翻訳しやすい日本語を作成するための勘所

第1回 AI翻訳を活用した日本語原文の修正作業
 日本語原文を日英翻訳し、次に、日英翻訳で生成された英文を見ることなく、英日のリバース翻訳で生成された日本文を確認し、必要に応じて日本語原文を修正します。実際の作業の進め方の例と、どのくらい修正することになったか等、ご紹介。

第2回:修正日本語原文で生成された英文の評価
 日本語原文の修正では、生成された英文を見ることなく作業を進めてきました。リーバス翻訳して確認した日本文は、意図した内容の日本文となってはいますが、英文としての精度はどうなったのでしょうか。検証します。

第3回:AI翻訳のチューニングのポイント(今回)
 英文として意図した英文にするために、AI翻訳エンジンのチューニングについて検討します。

目次

これまでに確認された課題

日本語原文に関わる課題
 1)定型文やキャッチフレーズ
 2)長い文
 3)原文があいまい

翻訳時の課題
 4)用語
 5)主語
 6)言い回し
 7)定冠詞、単複

対策検討

日本語原文に関わる課題の対策については、こちらを参照ください。
今回は残る課題の対策、「翻訳時の課題」の対策について検討を進めます。

 AI翻訳のチューニングのポイントとしては、辞書活用か、TM活用になりますが、それぞれの課題での対策を見ていきます。なお、AI翻訳をチューニングできる要素や仕様は、AI翻訳エンジンによって異なりますので、詳細はご利用のAI翻訳エンジンのマニュアルをご参照ください。以下ではSYSTRANを例に紹介いたします。

対策検討1 – 用語

辞書の種類

翻訳前、翻訳時、翻訳後の辞書活用ができます。

 翻訳前:日英翻訳の場合であれば、日日の辞書になります。原文の表記ゆれを、翻訳前に統一して翻訳することで、翻訳結果のゆれをなくします。原文を修正しなくても、この正規化辞書を適用することで、統一された翻訳結果を得られるようになります。
 翻訳時:日英翻訳の場合であれば、日英の対訳辞書になります。専門用語等、正確な訳を得るためにこの辞書を活用します。
 翻訳後:日英翻訳の場合であれば、英英の辞書になります。ターゲット言語での決まった表現に修正したい場合には、この辞書を活用します。翻訳後の編集作業を軽減することができます。

<参考>
SYSTRANの正規化辞書は、翻訳処理のどの段階で適用できますか?
辞書登録 – 単語の活用形はどのように登録すればよいか

辞書活用例

「翻訳前」の辞書活用例:
日本語原文の表記ゆれを翻訳前に統一し、翻訳のゆれをなくしたい

  • ケース:原文に本来同じ事を指しているのに、エキスパートやベテラン、スペシャリストなど、表記ゆれがあり、これを熟練技術者等、統一してして訳せるようにしたい
  • 対策:翻訳前の正規化辞書活用
    翻訳前に統一したい用語に変換してから、翻訳を行うようにするため、翻訳前正規化辞書に以下のように登録します。
    ・ベテラン → 熟練技術者
    ・エキスパート → 熟練技術者
    ・スペシャリスト→熟練技術者

「翻訳時」の辞書活用例:
ベテランの訳を、veteranではなく、experienced professionalsとしたい

  • 例文:ベテランの潜在ノウハウを可視化します。
  • AI翻訳:
    Visualize the potential know-how of the veteran.
  • ポストエディット指摘:
    Visualizes the potential know-how of the experienced professionals.
  • 対策1:日英の対訳辞書活用
    翻訳時の対訳ユーザー辞書に「ベテラン → experienced professionals」を登録
  • 辞書登録後のAI翻訳の結果:
    Visualize the potential know-how of the experienced professionals.

「翻訳後」の辞書活用例:
翻訳結果のpinpointは、specificとしたい。

  • 例文:起きている状況に対処するために必要な最小限の情報がピンポイントで表示されます。
  • AI翻訳:
    It provides a pinpoint view of the minimum information required to address a situation that is happening
  • ポストエディット指摘:
    It provides a specific view of the minimum information required to address a situation that is happening
  • 対策2:翻訳後の正規化辞書活用
    正規化辞書に、「pinpoint → specific」 を登録
  • 辞書登録後のAI翻訳の結果:
    It provides a specific view of the minimum information required to address a situation that is happening

対策検討2 – 主語

 日本文では、原文に主語がないこともあり、英訳時の課題の一つです。取扱説明書等、主語をドキュメント全体で、Youに統一したいということであれば、以下のような対策を講じることも可能です。

対策検討3 – 言い回し、定冠詞、単複

 言い回し、定冠詞/不定冠詞、単数/複数のかき分けは、最終的に人による確認を無くせない領域のひとつと捉えていますが、過去翻訳の翻訳メモリ(TM:Translation Memory)がある場合には、これを活用することが有効です。

TMの活用方法は主に2つあります。
 TM登録:AI翻訳に登録します。翻訳時に登録されたTMが参照されます。
 TM学習:AI学習の学習用データに使用して、専用のカスタムモデルを生成します。

汎用型の翻訳エンジンにはない、登録や学習したTMに沿った翻訳結果を得ることができるようになります。得られた翻訳結果が意図したものでない場合には、強化学習を繰り返し実施することで、翻訳精度が改善し、翻訳後の編集作業の軽減していくことができます。

<参考>
Q. AI翻訳時に、翻訳メモリ(TM)をファジーマッチさせ、TM活用度を上げられませんか?
Q. 翻訳対象物の分野毎に、専⾨⽤語や翻訳メモリ(TM)が異なる場合には、訳し分けはできますか?

辞書登録に関する留意点

AI翻訳の辞書活用は非常に有効な手段ですが、用語辞書に登録したことが原因で、AI翻訳結果が意味不明な文になることがあります。登録する用語は厳選する必要があります。なぜ、そのようなことが発生するのか、詳細は以下のページを参照ください。

Q. 用語辞書に登録すればするほど、意図した翻訳になりますか? 

<終わり- AI翻訳でリバース翻訳して、翻訳しやすい日本語を作成するための勘所(第3回)~ AI翻訳のチューニングのポイント ~>

この記事に関するご質問等、こちらまでお気軽にお問い合わせください。 

関連記事のご案内

お問い合わせ

お気軽にお問い合わせください。
※株式会社情報システムエンジニアリングよりご案内させていただきます。

*)セールスに関してご返信はいたしませんので、あらかじめご了承ください。

個人情報の取り扱いについて

  • URLをコピーしました!
目次