AI翻訳でリバース翻訳して、翻訳しやすい日本語を作成するための勘所(第2回)~ 修正日本語原文で生成された英文の評価 ~

 AI翻訳のリバース翻訳を活用して、翻訳しやすい日本文を作成するための勘所を探ります。今回は、リバース翻訳で確認しながら修正した日本文を翻訳し、生成された英文を、第三者の方にチェックしてもらった評価から見えてきた課題を洗い出します。

 日本語原文の修正では、生成された英文を見ることなく作業を進めました。リーバス翻訳しながら修正した日本文は、ほぼ意図した内容の日本文とはなってはいますが、英文としての精度はどうなったのでしょうか。また修正しなかった日本文は、リバース翻訳を試みて、修正しなくても大丈夫だろうと判断に至りましたが、こちらの英文もどうなったのか、合わせて検証します。

目次

日本語原文の修正作業のふりかえり

 題材は、ISEの以下のWebサイトページから60文を抽出し作業を進めました。
https://lp.ise.co.jp/worktransform/
対象とした60文のうち、可能な限り修正作業を抑えるようにし、13文を修正しました。主な修正内容は以下の通りです。
・ 主語の明確化
・ 句読点の追加
・ 略語の言い換え
・ 冗長さの排除 など

AI翻訳で生成された英文の評価

 記事固有の用語や、日英、リバース英日翻訳で、用語が不適切だったところは、用語登録も行ったので、それなりにできているはずと期待をかけ、評価を依頼しました。
 しかし、残念ながら期待に反して、修正した13文のうち、評価者からの修正指摘は、8文について指摘を受けました。指摘無しは、僅か5文という結果です。英文評価にあたっては、日本文のうち、どの文を修正して、どれを修正しなかったのかを明らかにせずに評価依頼したので、検証対象全60文についての評価を得ています。修正をかけなかった日本文から生成された英訳に対する指摘も加わり、修正指摘の総数としては、60文のうち、33文について修正指摘がつきました。いったい何が問題だったのでしょうか。探っていくことにします。

修正指摘ポイントから見えてくる課題

33文の修正指摘ポイントの課題を整理すると以下のように分類できそうです。

1)定型文やキャッチフレーズ等
 文として成立していないなど、単純に翻訳されただけでは、意図が伝わらないもの
 文例)「適切な情報を、適切なタイミングと、適切な量と、適切な言語で」

2)長い文:
 原文が長過ぎ、短文にすべきもの
 例)1文が100文字近くある文など

3)原文があいまい:
 係り受けや、慣用表現、日本文では暗黙的に理解してしまっていた点に対する指摘など
 例)高齢化でベテランが引退し、人がいない(The veteran has retired due to aging, and there are no people

4)用語:
 適切な英単語があたっていない
 例)ベテラン、ピンポイント、介助 など

5)主語:
主語は2人称に
 例)I don’t know … → You don’t know
    We will make… → You will make

6)言い回し:
 例)can be used → allows you to use

7)定冠詞、単複
 定冠詞/不定冠詞の指摘、単服の書き分け

対策の検討

 翻訳しやすい日本文作成にAI翻訳ツールを活用するための対策を検討します。課題を見ると日本語原文に関わる課題と、翻訳時の課題に分類できそうです。それぞれについてどんな対策ができそうか検討します。

日本語原文に関わる課題
 1)定型文やキャッチフレーズ
 2) 長い文
 3)原文があいまい

翻訳時の課題
 4)用語
 5)主語
 6)言い回し
 7)定冠詞、単複

日本語原文課題への対策検討

1)定型文やキャッチフレーズ
 固定的に訳文が決まっているもの等は、適切に訳文が適用されるように、あらかじめ翻訳メモリに登録することで翻訳時に翻訳メモリが適用できるようにする。
 →対策:TM登録。ただ、どの文をTM登録するかは、人による判断が必要。
これまでに自社で翻訳した対訳データがあれば、そのデータを教師データにし、AI学習させる方法も対策の一つと期待。
 →対策:自社専用のAI翻訳モデルの構築

2)長い文
 昨今のAI翻訳は、長い文でも難なく翻訳できるようですが、長い文は複雑であったりするので、なるべく簡潔に記述するようにしたいところ。
 →対策:原文修正作業にかかる前に、文の長さをチェック。
文の長さや、句読点間の長さのチェックをかけ、一定数以上であれば、文を分割することを検討する。文の長さチェックは、Just Right!を使用すれば簡単に対象となる文の検出は可能。

3)原文があいまい
 人に依存する部分が大きい課題と捉える。ツールを使って極力省力化を図りたいところではあるものの、これさえ実施すれば大丈夫というものはないのが現状。
 →対策:以下の記事で指摘されているようなことを踏まえ、ライティングを進めていきたい。
 ・MT翻訳の実検証から見えた日本語原文の問題点
 ・長文も難なくMT翻訳できるが… 日本語原文の問題点2

翻訳時課題への対策検討

 用語課題、主語課題、言い回し、定冠詞、単複の書き分けを翻訳時課題と分類。これらの課題は、AI翻訳の機能を活用し、何が対処できそうなのかの検討が必要。用語登録やTM登録を行い、また、AI学習することで、これまでの翻訳結果を踏まえた意図する翻訳結果が得られるようにすることで、極力人による作業の軽減化を図りたいところ。どのようなチューニングができそうか、次回に向けて検討を進めます。

AI翻訳でリバース翻訳して、翻訳しやすい日本語を作成するための勘所

第1回 AI翻訳を活用した日本語原文の修正作業
 日本語原文を日英翻訳し、次に、日英翻訳で生成された英文を見ることなく、英日のリバース翻訳で生成された日本文を確認し、必要に応じて日本語原文を修正します。実際の作業の進め方の例と、どのくらい修正することになったか等、ご紹介。続きはこちら

第2回:修正日本語原文で生成された英文の評価(今回)
 日本語原文の修正では、生成された英文を見ることなく作業を進めてきました。リーバス翻訳して確認した日本文は、意図した内容の日本文となってはいますが、英文としての精度はどうなったのでしょうか。検証します。

第3回:AI翻訳のチューニングのポイント(3月公開予定)
 英文として意図した英文にするために、AI翻訳エンジンのチューニングについて検討します。


この記事に関するご質問等、お気軽にお問い合わせください。 

関連記事のご案内

お問い合わせ

お気軽にお問い合わせください。
※株式会社情報システムエンジニアリングよりご案内させていただきます。

*)セールスに関してご返信はいたしませんので、あらかじめご了承ください。

個人情報の取り扱いについて

  • URLをコピーしました!
目次