A. 不用意に用語辞書に登録すると、AI翻訳が混乱し翻訳結果が意味不明な文になることがあります。登録する用語は厳選する必要があります。
なぜそのようなことが発生するのか、AI翻訳のしくみから紐解いていきます。
AI翻訳は、教師データを用いてニューラルネットワークでAI学習(ディープラーニング)する過程において、本来その言葉が持つ、他の全ての言葉との関係性を構築していきます。ところが、ユーザーが用語を辞書登録することによって、登録用語が意味のないトークンに置き換えられ、言葉同士の関係性を持たないものとなります。つまり、用語辞書に登録した用語は翻訳過程で、UD1、UD2、UD3といった言葉として意味のないトークンに置き換えられるイメージです。
例文で具体的に見ていきます。
例文:Taro was explaining about how NMT uses dictionary for customization.
AI翻訳結果:太郎は、NMTがどのように辞書を使用してカスタマイズするかについて説明していました。
意味が解釈できるように正しく翻訳されていることが確認できます。
この文のうち、以下の言葉を辞書登録します。
UD1:Taro
UD2:NMT
UD3:dictionary
UD4:customization
すると、上記例文は以下のような文となります。
辞書登録後の例文:UD1 was explaining about how UD2 uses UD3 for UD4.
AI翻訳結果:UD1は、UD2がUD4にUD3をどのように使用するかについて説明していました。
(Taroは、NMTがcustomaizationにdictionaryをどのように使用するかについて説明していました。)
10語中4語の関係性が失われることになり、AI翻訳が混乱していることが確認できます。辞書登録した箇所は、AI学習した内容を活かせず、残された情報だけで文を作成するため意味不明な文が生成されます。
このようなことにならないように、辞書を適切に使用することが重要です。用語辞書に登録することは、意図した翻訳を得るために重要なことですが、AI翻訳のしくみを考えると、辞書登録する際には、以下の条件を満たす必要があります。
■辞書登録の条件
「その言葉の翻訳結果が自分の望むものでないとき」に限り、
「その言葉の品詞が一つしか存在しない」かつ
「その言葉の意味が一つに固定できるとき」に辞書に登録してください。
用語辞書は固定的な解釈のみに使用できる場合に使用し、登録する言葉は通常、個人名や商品名など固有名詞、または複数の言葉からなる長い名詞句や固有名詞句になります。用語辞書を有効に活用するために、上記の辞書登録の条件を満たすことを確認して使用することで、意図した結果を得ることができます。
SYSTRAN FAQ集
SYSTRAN(シストラン)を試してみませんか
SYSTRAN(シストラン)のセキュアな翻訳ソフトウェア環境は、迅速で正確で専門的な翻訳を提供し、翻訳業務を効率的に進められることに寄与します。シストランの詳細については、今すぐお問い合わせください。