A. 正規化辞書によるアプローチと、AI学習データによるアプローチがあります。
マニュアルの翻訳業務等では一貫して一つの主語を使い続けたいことがあるかと思いますが、方法としては、正規化辞書によるアプローチと、AI学習データによるアプローチがあります。正規化辞書によるアプローチをご紹介します。
正規化辞書によるアプローチ
マニュアル関連の業務に限定した形の翻訳では、一人称単数、三人称単数が使われることが希であるとするならば正規化辞書で下記のように処理します。(参考:日本語と英語の代名詞の扱いについて)
■正規化辞書への登録1:
一人称単数→二人称単数
I → you
my → your
me → you
■正規化辞書への登録2:
一人称複数は、マニュアルのガイドラインによって、そのままシンプルに登録できないこともあるかと思いますが、使用しないのであれば、以下のように登録します。
we → you
our → your
us → you
上記の例の正規化によって生じる限られたAgreementの問題をさらに正規化で細かく合わせて一人称⇒二人称にすることができます。
◆適用例1
I am → you am → you are
I was → you was → you were
他は正規化してもagreementの問題なしなのでOKですね。
my parts → your parts
me → you
we are/were → you are/were
our parts → your parts
us → you
■正規化辞書への登録3:
三人称単数はit/theにします。
he/she/him/her → it
his/her → the
◆適用例2
She says OK.
→
It says OK.
I will find him when we encounter his error next time.
→
You will find it when you encounter the error next time.
三人称複数they/their/them はそのままで問題なしですね。
このように正規化辞書を使って、一人称単複・三人称単数⇒二人称という特定のマニュアル翻訳ガイドラインの要件を満たすことができます。
AI学習データによるアプローチ
もう一つは、上記の正規化辞書をAI学習データに適用して、マニュアルの翻訳ガイドラインの要件に合うようにデータを学習前に上記のように書き換え、それをAIに学ばせる方法があります。
こちらのほうが、どんな状況下でも、より広く忠実に翻訳要件を反映します。基本的にAIが学べない事象はありません。上記のような要件を上手に教えれば、AIは素直に学び、正しく翻訳します。文をまたいだ正しい代名詞の選択なども、現在の文単位ではなく、パラグラフ単位でAI学習を行えば、よりスマートに正しく翻訳してくれます。かなり使い方を絞った目的別の学習モデルも数多く構築し、成功を収めています。AIは教え方次第です。
SYSTRAN FAQ集
SYSTRAN(シストラン)を試してみませんか
SYSTRAN(シストラン)のセキュアな翻訳ソフトウェア環境は、迅速で正確で専門的な翻訳を提供し、翻訳業務を効率的に進められることに寄与します。シストランの詳細については、今すぐお問い合わせください。