MENU

意図通りに翻訳するための⾃社専⽤のAI⾃動翻訳

意図通りに翻訳するための
⾃社専⽤のAI⾃動翻訳

株式会社ロゼッタ MT事業部 営業統括部長
古谷 祐一

意図通りに翻訳するための⾃社専⽤のAI⾃動翻訳

[2021.10] T-3MTと翻訳支援ツール「Memsource」を連携させて使用する利点は何ですか?

 AI翻訳エンジンT-3MTと翻訳支援ツールMemsourceを連携させることの利点を3つ挙げます。

  1. T-3MTの学習データとなる対訳データの管理を行い、カスタムエンジンを生成できます。
  2. 翻訳作業は、対訳データとT-3MTを使用して翻訳作業を進められます。
  3. 修正した訳文は対訳データに登録して、次のプロジェクトに備えることができます。
AI翻訳「T-3MT」と翻訳支援ツール「Memsource」の連携

TCシンポジウム 10月のセッションでは、翻訳ワークフロー観点からT-3MT活用のポイントをご提案いたします。ぜひ、本セッションにご参加ください。

【ご案内】TCシンポジウム2021 on the Web 10月で発表します。

[KS07N] 1次著作物制作でAI翻訳「T-3MT」を活用するワークフローのご提案
~AI教師データ品質維持機構の原文改善プロセスへの導入~

日時:10月7日(木) 11:15 ~ 11:55(40分)[聴講無料]
詳細情報:https://jtca-web.com/sessions/2021/4645/
於:TCシンポジウム 2021 on the Web (Zoom形式)
発表者:
ロゼッタ 佐藤 弦
情報システムエンジニアリング 林 和成

 AI翻訳エンジンT-3MTは、翻訳メモリなどの対訳データを利用して、自由にカスタマイズして翻訳エンジンを作成できます。少量の対訳データから、プロジェクトごとのカスタムモデル(翻訳エンジン)を生成し、プロジェクト特有の用語や言い回しに対応することで、ポストエディットの手間を削減します。

翻訳支援ツールMemsouceを活用することで、翻訳全行程の流れをほぼ自動化し、クラウドを通じて支持を共有化できます。クラウドでファイルを共有化できるためローカルコピーが不要になり、翻訳メモリや用語集も共有化できます。クラウド環境が関係者の共通作業プラットフォームとなり、コミュニケーションの共有化を図ります。

[2021.9]T-3MTが翻訳できる対応言語数はいくつですか? また、多言語でのカスタムモデルの生成はできますか?

日英、日中の他、英語を起点とした22言語に対応しております。それぞれカスタムモデルを生成できますので、専門用語や自社固有の表現も、自社の対訳データを教師データとしてAI学習させることで、意図した翻訳結果を得ることができます。なお、T-3MTは全てロゼッタ内のサーバーで運用されており、他社サーバーにデータが転送されることはありません。

対応言語の詳細は以下の通りです。
T-3MTの多言語対応状況
2020年11月: 日英に追加して、日中、英⇔8言語
2020年12月: 上記に追加して、英⇔14言語
現在、日英、日中、英⇔22言語に対応済み

【T-3MT対応言語】
日⇔英、日⇔中、
英⇔中国語・韓国語・アラビア語・イタリア語・インドネシア語・ギリシャ語・スウェーデン語・スペイン語・タイ語・タガログ語・ドイツ語・トルコ語・ヒンディー語・フィンランド語・フランス語・ベトナム語・ペルシア語・ベンガル語・ポーランド語・ポルトガル語・マレー語・ロシア語

自社専用のAI翻訳を構築するロゼッタ「T-3MT」のFAQ集

Adobe製品との連携

自社専用のAI翻訳を構築する「T-3MT」- FAQ集

[2021.8] ポストエディット作業や、チェック作業を削減する方法はありますか?

TCシンポジウム2021 ソリューション紹介セッションで詳細をお伝えします。

[TS-09] 翻訳精度の向上によるポストエディット作業削減と、
差分翻訳によるチェック作業の短縮化を実現

~自社専用にカスタムできるAI翻訳「T-3MT」とAdobe製品との連携~

日時:8月26日(水) 14:45 ~ 15:25(40分)[聴講無料]
詳細情報:https://jtca-web.com/sessions/2021/3894/
於:TCシンポジウム 2021 on the Web (Zoom形式)
発表者:
ロゼッタ 佐藤 弦
情報システムエンジニアリング 林 和成

ロゼッタT-3MTは、少量の対訳データ(TM)から、プロジェクトごとのカスタムモデル(翻訳エンジン)を生成し、それを使って翻訳することで、ポストエディットの手間を削減していくことができます。インターネットで公開されている一般的な汎用エンジンにはない、目的に特化したAI翻訳のカスタムモデルを作成することで、意図した翻訳を得ることができます。

これまでの汎用型AI翻訳エンジンの出力は、翻訳結果をポストエディットすることで意図した翻訳に修正していましたが、T-3MTでは、ポストエディットを施した対訳データや、自社の対訳データを使ってAI学習することで、意図する翻訳結果をT-3MTの出力から得ることができるようにします。

さらに、マニュアル制作現場で使用することが多いXML、DITAやDITAMAPに対応していますので、制作データをそのまま翻訳することも可能です。
本セッションでは、T-3MTの最新情報をお届けします。

そして、情報システムエンジニアリングより、InDesignやFrameMakerからT-3MTを活用するソリューションを紹介します。T-3MTのファイル翻訳機能やリアルタイム翻訳機能を活用し、制作・翻訳業務の効率化を進めながら品質向上を図ります。

セッションの詳細情報はこちらをご覧ください。
https://jtca-web.com/sessions/2021/3894/
皆さまのご参加をお待ちしております。

[2021.7]自社のシステムにT-4OOやT-3MTを連携させることはできますか?

Rozetta APIを使用することで、自社のシステムにT-4OOやT-3MTと連携する機能を実装できます。自社システムのアプリケーション操作だけで、T-4OOやT-3MTに翻訳リクエストを投げ、結果を得られるようにすることもできるので、翻訳するために別アプリケーションを起動する必要がなく、シームレスに連携できます。

T-3MTでは、内製の英-多翻訳エンジンに対応するため、セキュリティが維持される環境下で、リクエストに応じて必要な時に必要な分だけ高性能の翻訳エンジンを活用することができます。

Rozetta APIの主な機能は次の通りです。
テキスト翻訳API:テキストの原文を指定した言語に翻訳します。
音声翻訳:音声ファイルを、テキスト又は合成音声に翻訳します。
ファイル翻訳API:大量のファイルを一括アップロードし、翻訳完了後、一括でダウンロード可能なAPI
分野指定機能:翻訳の分野を指定し(法律・金融など)、専門用語を自動で反映することができます。
ユーザー辞書機能:専門用語に特別な翻訳を指定できる機能

Rozetta APIのドキュメントは、<https://translate.classiii.io/doc/ja/>を参照ください。

Rozetta APIを利用したアプリケーションをご紹介します。
T-4OO Desktop – Windowsデスクトップでの操作だけで、翻訳することができます。
Rozetta Translator – Slackへの翻訳プラグインで、チャンネル内の会話を翻訳します。

サードパーティ製品としては、CATツールのMemsourceやTradosからT-4OOやT-3MTを利用できます。
ISEからは、FrameMakerの画面上の操作だけで、T-4OOやT-3MTを利用できプラグインが提供されています。執筆中の指定する日本文の日英翻訳と、生成された英文を日本文へリバースする英日翻訳ができます。執筆する日本文がAI翻訳によって意図した翻訳となるか、必要な時に必要な箇所だけ日本文で確認します。詳細は<こちら>を参照ください。

Rozetta APIを使用したカスタマイズや詳細について、情報システムエンジニアリングまでお問い合わせください。
お問い合わせ:https://www.ise.co.jp/contact/

[2021.6]T-3MTのトライアルはどのような手順で翻訳結果を確認できますか?

T-3MTのトライアルは、1.データの準備、2.翻訳モデルの構築、3.検証 の順番で進めます。流れを追って説明します。

  1. まず、データの準備です。
    T-3MTは、AI教師データを学習データとして使用し、AI翻訳モデル(カスタムモデル)を構築します。対訳データを準備してください。対訳データの量としては、200~1000行程度、最大でも1万行までです。
    対訳データをお預かりさせていただければ、お預かりした対訳データから、AI翻訳モデル用の教師データを作成し、ご提供することも可能です。
  2. 次に翻訳モデルの構築です。
    T-3MTのメニューからの操作でAI翻訳モデルの構築ができます。教師データをアップロードしてください。アップロードした教師データは、サーバー側でGPUを使用してAI翻訳モデルが構築されます。
  3. モデルが完成したら、実際に翻訳を行い、翻訳結果を確認ください。
    実際に翻訳性能を確認するために、翻訳用データの注意点を2点挙げます。
    1) 教師データには含まれない文での確認
    教師データに使用した対訳データが、検証用データに含まれていると、その文については、すでに、答えを知っていることになりますので、本来の翻訳性能の確認ができない可能性があります。教師データには含まれない文を使用して翻訳結果をご確認ください。
    2) すでに対訳のあるデータでの検証
    すでにリリースされている文章など、翻訳した結果があると、それと比較することができますので、まずは、翻訳済みの文章で検証することをお勧めします。その後、他の文章も翻訳して翻訳精度をご確認ください。
トライアルに必要となるデータのまとめ

事前にご準備いただくデータは、以下の3点です。
1.AI翻訳モデル(カスタムモデル)生成用「対訳データ」
2.実際に翻訳検証したい文章
3.実際に翻訳検証したい文章の、見本訳となる翻訳文

費用とスケジュール
  • 費用
    AI翻訳モデルの構築については費用はかかりません。T-3MTを使用して翻訳した場合は、翻訳量に応じて費用がかかります。検証を行いたい文章に応じてお見積りいたします。
  • スケジュール
    対訳データをお預かりした場合のAI教師データ作成に2週間ほどお時間をいただきます。完成後、教師データをご提供しますので、お客さまでの検証期間を1週間程度とさせていただきます。
トライアルのお申込み

トライアルの受付は、情報システムエンジニアリングにて承ります。
その他、ご不明点等、いつでもお気軽にお問い合わせください。
お問い合わせ先: https://www.ise.co.jp/contact/

[2021.5]T-3MTでAI学習するための教師データは何を用意すればよいですか?

日英の対訳データを、Excel形式でご用意ください。
A列とB列で1:1となるようにセットします。データ量は最大で1万行。推奨は、200~1000行(10-50ページ)程度です。翻訳原稿と対訳データの内容の類似性が高いほど、わずかな参考訳でAI学習できます。

すでにお持ちのTranslation Memoryの活用もできますが、意図した結果を導くために、重複対訳や類似対訳をクリーナップすることをオススメします。すでにリリースしたドキュメントを活用する方法もあります。確認済みのデータのはずですし、ここから対訳データを作成すれば、教師データとしての精度も確かなものとなります。

AI教師データの例
[2021.3]T-3MTを使用して、対訳データを使用して学習したときの翻訳結果はありますか?

翻訳結果をご紹介する前に、学習する内容をご紹介します。
用語統一のQ&Aで紹介した例の他、以下2例を含む計300行の対訳データをT-3MTに学習させます。

学習例1:”XXX Research Lab”という固有名詞に対応する翻訳が、地名に関係無く「当社研究所」とする。

“XXX Research Lab” →「当社研究所」

学習例2:”XXXX Data”という単語に対応する翻訳が「XXXX 性」となり、”Data”要素が「XXXX データ」と翻訳されない。

”XXXX Data” →「XXXX 性」

さて、翻訳結果です。まず、学習した対訳とは完全に一致しない文を翻訳させた結果を見てみます。

翻訳結果1

翻訳結果1

学習した対訳データにより、意図通りの翻訳を得られたことが確認できます。
次に、学習した対訳データとは、異なる文脈で翻訳された例を示します。

翻訳結果2

翻訳結果2

学習対訳とは異なる文脈には影響が及んでおらず、ディープラーニングの精度が高いことがわかります。T-3MTは、300行程度の参考訳例から、用途に合わせた翻訳カスタムモデルを生成できることが特徴のひとつです。

ぜひ、御社の対訳データを使って翻訳を試してみませんか? 詳しくはこちらへ

[2021.2]用語の統一はどのようなアプローチになりますか?

以下のように、ご希望の用語を含んだ対訳データを使ってAIに学習させることで、カスタムモデルの生成を行い意図通りの翻訳結果を得ます。

”announceという動詞に対する翻訳に「レクチャーします」を学習させます。
[2021.1] カスタムモデルを生成するメリットは何ですか?

お客さまがお持ちの対訳データを用いて、ロゼッタが開発した汎用モデルをベースに、お客さま専用の新たな翻訳モデルを作成する機能です。お客さまの対訳データを使うことで、お客さまがふだん取り扱っている文書等(原稿)の翻訳に、より適した翻訳モデルを生成し、意図通りの翻訳結果を得ることができます。

[2021.1]ロゼッタの汎用モデルは、分野を選択できますか?

9分野から選択できます。具体的には、機械、IT、電気、医薬、化学、特許、法務、金融・IR・会計、会話・メールから選択できます。

[2021.1] 複数のカスタムモデルを構築することは可能ですか?

翻訳分野や対象によって、翻訳の仕方は変わるものです。目的別にAI学習させるTranslation Memoryを分けて、複数の翻訳モデルを構築することで、ポストエディット作業を削減化します。用途を特化させることで、より目的に沿った翻訳結果を得ることができます。

図:カスタムモデルの生成
[2021.1] T-4OOとT-3MTの違いは何ですか?

T-4OOは、2,000の専門分野からロゼッタ社が構築したモデルを選択して翻訳します。一方、T-3MTは自社のTranslation Memory(対訳データ)を使用して独自の翻訳モデルを構築して翻訳します。対訳データの取り扱いが異なり、T-4OOは、完全一致準完全一致で利用しますが、T-3MTでは、ディープラーニングの学習データとして利用します。

T-4OOとT-3MTの違い

Adobe製品との連携

[2021.4]Adobe InDesignファイルの翻訳はできますか?

ロゼッタのAI自動翻訳 T-4OOは、Adobe InDesignのファイルをそのまま翻訳することができます。
Adobe InDesignの他、Adobe illustratorのファイル翻訳にも対応しています。(Adobe FrameMakerファイルについては、こちらをご覧ください。)

■機能概要
・Adobe illustrator / InDesign ファイルを翻訳し、同じファイル形式でダウンロード
・ZIPファイルでアップロード、リンクファイルもまとめて翻訳可能
・「訳文編集画面」で訳文の編集が可能
・対応言語:日/英/中/韓/タイ
・対応バージョン: [InDesign] CC12, CC13, CC14, CC15 [Illustrator] CC21, CC22, CC23, CC24

■T-4OOオプション料金
オプション機能のため、T-4OOのご契約の他、別途ご契約手続きが必要となります。
ご契約ユーザー数が1~5の場合で 年間36,000円(税込39,600円)となります。

■トライアルのご案内
スタイルやテンプレート等、ご利用環境に影響される部分もあるため、トライアルで確認できるよう環境をご用意いたします。最大2週間、3万ワードまで無料にてトライアル利用いただけます。

■お問い合わせ
情報システムエンジニアリングよりご案内させていただきます。
お問い合わせは、https://www.ise.co.jp/contact/ までお願いします。
データの作成や改善に関するご相談も承ります。お気軽にお問い合わせください。

[2021.4]Adobe FrameMakerファイルの翻訳はできますか?

情報システムエンジニアリングより、T-4OO/T-3MTとの連携ソリューションが提供されています。詳しくは、以下をご覧ください。

超絶カスタマイズAI自動翻訳 T-3MT
(Translation Memory Meet Machine Translation)

T-3MTは、30ページ程度の参考訳・過去訳をAI教師データとしてAI学習(ディープラーニング)させるだけで、用途に合わせた翻訳カスタムモデルをAIが生成し、微妙な表現や言い回しまで深く再現できるAI自動翻訳です。

取扱説明書、カタログやIR開示文書など、過去の対訳データの内容を引き継いで反映させる必要がある定型的な文書の翻訳に威力を発揮します。

古谷 祐一

株式会社ロゼッタ
MT事業部 営業統括部長
古谷 祐一

ロゼッタロゴ

企画運営:株式会社 情報システムエンジニアリング  協力:株式会社 ロゼッタ

T-4OO/T-3MTトライアルのご案内

T-4OO、T-3MTのトライアルはいかがですか?

  • 2,000分野から選択して翻訳するなら、T-4OO
  • 自社のTranslation Memoryを学習させてトライアルするなら、T-3MT

お気軽にお問い合わせください。
トライアルは、株式会社情報システムエンジニアリングよりご案内いたします。
こちらよりお問合せお待ちしております。 http://www.ise.co.jp/contact/

関連情報

詳細資料ダウンロードDOWNLOAD

以下のフォームにご入力いただいたメールアドレスへ、
TCシンポジウム記録集に掲載した記事ページ
意図通りに翻訳するための自社専用のAI自動翻訳
の資料PDFをお送りします。

※資料の送付は、株式会社情報システムエンジニアリングよりご案内させていただきます。

個人情報の取り扱いについて

Copyright © 2021 Information System Engineering Inc. All rights reserved.