既存ドキュメントがあれば、自社に特化したAI翻訳を構築できます。AI翻訳を構築するための学習用データは、ソース言語とターゲット言語が対になった対訳データですので、この対訳データを既存ドキュメントから作成します。既存のドキュメントには、自社固有の言い回しや、自社が使用する製品名や部品名など、自社固有の表現が含まれますので、自社に特化した意図する翻訳結果が得られるAI翻訳を構築できます。既存ドキュメントであれば作成時期も特定できるので、教師データに含まれるデータ内容など品質も管理できます。
Translation Memory(TM)は、対訳データでAI教師データに活用しやすいデータですが、公開前の作業中データが混在していることがありますので、AI教師データに活用するには注意が必要です。未確認データや不採用だったデータが含まれると、公開後のデータに比較して品質が劣りますし、TMに保持しているデータの作成時期を特定できない場合には、昔のデータが存在するかもしれません。AI教師データに不確かな情報が含まれることで、意図しない翻訳結果がもたらされる原因になりかねませんので、AI教師データの品質は重要です。
ISEでは、AI翻訳用の学習データ作成を承ります。同一の製品等を対象とするソース言語とターゲット言語のドキュメントをご準備ください。既存ドキュメントやご指定の用語情報に基づいて、用語抽出するための確認ステップを行った上で、AI翻訳学習用の対訳データを作成します。必要な場合には、実際にAI翻訳の構築を行い、その品質を維持管理していくサービスも提供いたします。対象とするデータ量やご希望に応じて個別にご提案いたします。お気軽にご相談いただけましたら幸いです。
<関連記事のご案内>
- 執筆時のAI活用で翻訳しやすい日本語をつくる(サイトトップへ)
- 他言語のWordやPowerPointファイルも、T-4OOですぐに翻訳して、円滑な情報共有を
- 【翻訳品質を考える前に】1文章中の主語について
- 【翻訳品質を考える前に】日本文の論理性と固有名詞
- 【米国発】 セキュアなオンプレミスのAI翻訳を活用する5つの利点