2021年8月27日に開催しましたTCシンポジウムでのSYSTRANxISEセッションでのQ&Aコーナーのご質問をフォローアップします。その他、ご質問がありましたらいつでもお問合せください。
目次
2021年8月27日に開催しましたTCシンポジウムでのSYSTRANxISEセッションでのQ&Aコーナーのご質問をフォローアップします。その他、ご質問がありましたらいつでもお問合せください。
日英翻訳であれば、日英の対訳データがあれば、AI学習ができます。SYSTRANにそのまま取り込むためのデータ形式は、tmx,xls等ありますが、テキストファイルなど、形式が異なってもデータ変換すれば対応できます。
言語方向毎にモデル学習させると意図する翻訳結果を得やすくなります。自社固有の表現や専門用語を各言語においても指定したい場合や、米国/英国英語のような同じ言語間での違いがある場合に効果を発揮します。
AI学習時、ベースとするモデルに、モデルカタログに掲載されているAI翻訳モデルを選択して、自社データを使用して追加学習できます。自社の目的に沿う専用エンジンがモデルカタログに見つかれば、自社固有の分だけの追加学習で自社専用のAI翻訳モデルの構築ができます。追加学習は、SYSTRANの汎用モデルをベースに自社データでAI学習させるのと同じ要領でできます。
翻訳対象物の記述内容の更新頻度を応じてAI翻訳モデルを更新できると、意図した翻訳結果を得やすくなります。1年ごとに記述内容が更新されるのであるならば、AI翻訳モデルも1年ごとに更新すればよいでしょうし、情報更新が半年に1回なのか、不定期なのか?によって更新頻度を変えるという方法もあります。また、翻訳結果を見ながら、修正する度合いが増えてきたタイミングで、AI翻訳モデルの更新をかけていくという方法もできます。
既存の対訳データ資産があれば、SYSTRANのファジーマッチ技術を適用することで、AI学習なしでも自社意図した専門化した翻訳結果を得ることができます。登録した対訳データがテンプレートのように使われ、ファジーマッチ(部分的にマッチ)した箇所は対訳データの翻訳を活用し、マッチしていない箇所を対訳データの文脈を考慮した上で最適にAI翻訳します。