自社に特化したAI翻訳を構築するために必要なもの

2023年1月5日2024年2月6日

　既存ドキュメントがあれば、自社に特化したAI翻訳を構築できます。AI翻訳を構築するための学習用データは、ソース言語とターゲット言語が対になった対訳データですので、この対訳データを既存ドキュメントから作成します。既存のドキュメントには、自社固有の言い回しや、自社が使用する製品名や部品名など、自社固有の表現が含まれますので、自社に特化した意図する翻訳結果が得られるAI翻訳を構築できます。既存ドキュメントであれば作成時期も特定できるので、教師データに含まれるデータ内容など品質も管理できます。

　Translation Memory(TM)は、対訳データでAI教師データに活用しやすいデータですが、公開前の作業中データが混在していることがありますので、AI教師データに活用するには注意が必要です。未確認データや不採用だったデータが含まれると、公開後のデータに比較して品質が劣りますし、TMに保持しているデータの作成時期を特定できない場合には、昔のデータが存在するかもしれません。AI教師データに不確かな情報が含まれることで、意図しない翻訳結果がもたらされる原因になりかねませんので、AI教師データの品質は重要です。

　ISEでは、AI翻訳用の学習データ作成を承ります。同一の製品等を対象とするソース言語とターゲット言語のドキュメントをご準備ください。既存ドキュメントやご指定の用語情報に基づいて、用語抽出するための確認ステップを行った上で、AI翻訳学習用の対訳データを作成します。必要な場合には、実際にAI翻訳の構築を行い、その品質を維持管理していくサービスも提供いたします。対象とするデータ量やご希望に応じて個別にご提案いたします。お気軽にご相談いただけましたら幸いです。

<関連記事のご案内>

執筆時のAI活用で翻訳しやすい日本語をつくる（サイトトップへ）
他言語のWordやPowerPointファイルも、T-4OOですぐに翻訳して、円滑な情報共有を
【翻訳品質を考える前に】１文章中の主語について
【翻訳品質を考える前に】日本文の論理性と固有名詞
【米国発】セキュアなオンプレミスのAI翻訳を活用する５つの利点

お問い合わせ

お気軽にお問い合わせください。
※株式会社情報システムエンジニアリングよりご案内させていただきます。

個人情報の取り扱いについて

URLをコピーしました！