自社専用のAI翻訳を構築する「T-3MT」- FAQ集

[2022.05] 翻訳資産を有効に活用するにはどうしたらよいですか?

AI翻訳で既存の翻訳資産を活用する方法は、2つあります。翻訳資産を流用する方法と、AI翻訳のAI学習データに活用する方法です。

 まず、これまでよく行われてきた、翻訳しようとする文書に類似した翻訳資産を流用する方法です。原文データと対訳データが対となる翻訳メモリから、原文が一致したり、類似する場合、翻訳メモリから訳文を流用します。同じ文を何度も翻訳せず、実績のある翻訳結果を流用することで品質を維持し、流用しなかった文だけをAI翻訳することで、新規翻訳量を押さえます。必要に応じて、AI翻訳した結果を確認して修正し、翻訳メモリに登録・蓄積することで、次回翻訳に活用します。

 次に、AI翻訳時代にオススメのAI学習データに活用する方法です。ロゼッタのT-3MTを使用して、翻訳資産を元にAI学習データを作成し、自社特化型のAI翻訳エンジンを生成します。自社の用語や言い回しなど、これまでの翻訳実績をAI学習の学習データに活用するので、新規の翻訳でも意図したとおりの翻訳結果が得られようになります。

<お問い合わせ>
記事に関するコメント、お問い合わせをお待ちしております。
お気軽にこちらまでお問い合わせください。

 

[2022.4] 翻訳作業は時間がかかるものと思ってませんか?

 例えば、100ページ程の実用文の英文資料の記述内容を急いで知りたいとき、AI翻訳を使用すれば、仮に1ページ2分かかったとしても200分ですので、約3.3時間。だいたい半日もあれば翻訳が完了することになります。
 これを人で対応すると、翻訳する方の作業時間確保やデータの受け渡し方法の確認など、翻訳作業以外の作業も加わることになります。翻訳結果も人に依存する部分が大きく、長時間作業ともなれば疲労もでてきます。記述内容を理解するためだけに人に翻訳作業を依頼するのは高価過ぎるのかもしれません。ロゼッタのT-4OOであれば、短時間で高精度に翻訳できます。
 T-4OOを活用して、すぐに内容を確認できることで、内容に応じた次のアクションもすぐに取れるようになります。Word・Excel・PowerPoint・PDFファイルに対応しており、ファイルをそのままアップロードし、翻訳結果をダウンロード*するだけです。レイアウトもほぼ維持されますので、そのまま会議の配布資料として活用することもできます。
 スピード重視で、まずは翻訳結果を入手し活用した上で、重要箇所は後で修正することもできます。訳文を修正したい場合には、Webの画面上で人の作業で原文と訳文を比較しながら修正できます。修正した結果は、元ファイル形式でダウンロードもできます。人の確認作業も施された正確性がより向上した翻訳済ファイルが入手できます。

*ダウンロード:PDFファイルはWord形式でのダウンロードになります

レイアウトがほぼ維持されるので、翻訳結果をそのまま活用

 少しの時間さえあれば、自分でファイルをアップロードして翻訳結果をダウンロード。英文資料も短時間で内容を理解でき、そのまま会議資料に活用することも簡単です。大幅な時間短縮を図れるのがAI翻訳を活用することのメリットの一つです。

[2022.3] 専門文書を高精度に翻訳し、スピーディに内容把握するためのAI翻訳は?

 2,000以上の専門分野に対応するロゼッタのT-4OOがオススメです。T-4OOは、法務・医薬・金融・化学・IT・機械・電気電子など、2,000以上の専門分野から、翻訳対象に合う分野を選択するだけで、専門分野に特化した翻訳が可能です。ニューラルネットワークを活用したロゼッタ独自のAI翻訳で、プロ翻訳者に匹敵する正確さで翻訳します。

2000以上の専門分野から選択可能

 ロゼッタには、過去翻訳を反映しながら翻訳できるT-3MTというAI翻訳もあります。マニュアルやカタログなど、自社の過去翻訳データを使用してディープラーニングすることで、自社専用のカスタムモデルを作成し、意図どおりの翻訳結果を得られるようにします。名詞や名詞句だけでなく、表現や書きぶりまで再現する翻訳結果を得ることができます。

翻訳用途に応じて、適材適所で使い分けてご利用いただくことをお勧めしています。

T-4OO と T-3MT

専門分野に特化した様々な文書をまずは翻訳して急いで内容を把握lしたい場合には、T-4OO。自社固有の表現などに準じた翻訳をしたい場合には、T-3MT。目的に合わせてご利用ください。

[2022.2] T-3MTとT-4OOの比較で、対訳データの活用で異なるポイントは何ですか?

まず、T-4OOでの対訳データや用語の扱いに関する主な特長を挙げます。

  • T-4OOでは、用語を登録して訳語を翻訳結果に反映させられます。
  • T-4OOでは、対訳を登録して翻訳結果に反映させられます。ただ、翻訳したい文章と登録した対訳が、完全に一致している場合か、数字だけが異なる場合のみとなります。
  • T-4OOでは、対訳集の中でよく使われている名詞及び名詞句を学習して翻訳結果に反映します。

翻訳対象に、過去に翻訳したことがある文や、もしくは数値情報だけが異なるような文が存在し、忠実に過去翻訳を反映させたい場合には、T-4OOの特長が活きます。逆に見ると、既存対訳データを登録した時の翻訳結果への反映方法を絞っているため、特に用語のみが異なる場合等は、T-4OOでは既存対訳データを活用しません。

次に、T-3MTの対訳データの活用に関する特長を挙げます。

  • T-3MTであれば、上記に限らず、動詞、副詞、関係代名詞、能動態・受動態等の学習も可能です。対訳データの活用量が大幅に増加します。
  • T-3MTであれば、学習データの文体を維持しつつ、正解訳を出せる可能性が高まります。

翻訳したい文章に応じて、T-4OOが向いているか、T-3MTが向いているかを選択できます。ご相談はいつでも承ります。トライアルを実施して実際に翻訳結果をご確認いただくこともできますので、お気軽にお問い合わせください。

[2022.1] 教師データの管理にRozetta MEMSOURCEを活用できますか?

 AI翻訳を活用して意図通りの翻訳結果を得るためには、AI翻訳モデルを作成するためのAI教師データの維持・管理が重要です。Rozetta MEMSOURCEを活用することで、取説制作データの管理と次回翻訳用のAI教師データ管理を一元的に行えます。共通に管理できる作業プラットフォームがあることで、管理負荷を軽減できます。

<Rozetta MEMSOURCE>

[2021.12] T-3MTの特徴は何ですか?

T-3MTの特徴を3点挙げます。

1.必要な時に自身でできるカスタマイズ
2.最適な対訳データを抽出する対訳選抜
3.ロゼッタサーバー内で完結するセキュリティ

  1. 必要な時に自身でできるカスタマイズ
    必要に応じてユーザー自身で、自社が保有する対訳データ(翻訳メモリ、エクセル)から、AI翻訳エンジンをカスタマイズできます。30ページ程度の参考訳や過去訳から、微妙な表現や言い回しなど文体や用語を学び、意図した翻訳が得られます。
  2. 最適なデータを抽出する対訳選抜
    対訳選抜機能は、翻訳対象に合わせて保有する対訳データの中から最適のデータを自動的に抽出します。類似度の高い対訳データを使用してカスタマイズすることで、翻訳精度が向上します。
  3. ロゼッタサーバー内で完結するセキュリティ
    T-3MTはロゼッタ内のサーバーで運用されています。他社サーバーにデータが転送されることはありません。

[2021.11] T-3MTではどのように翻訳精度を向上できますか?

 T-3MTは、対訳データ(翻訳メモリ)を教師データとしてAI翻訳をカスタマイズできますので、AI翻訳の結果が意図通りの翻訳になっていなければ翻訳結果を修正し、その修正した対訳データを使用して再度カスタマイズし、繰り返すことで翻訳精度を向上させていくことができます。データの再利用フローとしては、まずは既存の対訳データを使用してAI翻訳をカスタマイズします。カスタマイズしたAI翻訳で翻訳を行いその結果を人間の翻訳者がレビューします。レビューした翻訳を対訳データとして保存し、再度カスタマイズする時の教師データとして活用します。

データの再利用フロー

 翻訳者のレビュー作業時に、翻訳支援ツールを活用することでレビューの作業対象を絞り込みます。原文に対する訳文が、AI翻訳の結果なのか翻訳メモリに登録されたいたものなのか、原文毎に表示されるのでAI翻訳の結果に絞ってレビューを行えます。AI翻訳の翻訳精度は、教師データに依存しますので、意図通りでない翻訳は修正し繰り返していくことで、翻訳精度を向上させることができます。

翻訳支援ツールとの連携イメージ
[2021.10] T-3MTと翻訳支援ツール「Memsource」を連携させて使用する利点は何ですか?

 AI翻訳エンジンT-3MTと翻訳支援ツールMemsourceを連携させることの利点を3つ挙げます。

  1. T-3MTの学習データとなる対訳データの管理を行い、カスタムエンジンを生成できます。
  2. 翻訳作業は、対訳データとT-3MTを使用して翻訳作業を進められます。
  3. 修正した訳文は対訳データに登録して、次のプロジェクトに備えることができます。
AI翻訳「T-3MT」と翻訳支援ツール「Memsource」の連携

 AI翻訳エンジンT-3MTは、翻訳メモリなどの対訳データを利用して、自由にカスタマイズして翻訳エンジンを作成できます。少量の対訳データから、プロジェクトごとのカスタムモデル(翻訳エンジン)を生成し、プロジェクト特有の用語や言い回しに対応することで、ポストエディットの手間を削減します。

翻訳支援ツールMemsouceを活用することで、翻訳全行程の流れをほぼ自動化し、クラウドを通じて支持を共有化できます。クラウドでファイルを共有化できるためローカルコピーが不要になり、翻訳メモリや用語集も共有化できます。クラウド環境が関係者の共通作業プラットフォームとなり、コミュニケーションの共有化を図ります。

[2021.9]T-3MTが翻訳できる対応言語数はいくつですか? また、多言語でのカスタムモデルの生成はできますか?

日英、日中の他、英語を起点とした22言語に対応しております。それぞれカスタムモデルを生成できますので、専門用語や自社固有の表現も、自社の対訳データを教師データとしてAI学習させることで、意図した翻訳結果を得ることができます。なお、T-3MTは全てロゼッタ内のサーバーで運用されており、他社サーバーにデータが転送されることはありません。

対応言語の詳細は以下の通りです。
T-3MTの多言語対応状況
2020年11月: 日英に追加して、日中、英⇔8言語
2020年12月: 上記に追加して、英⇔14言語
現在、日英、日中、英⇔22言語に対応済み

【T-3MT対応言語】
日⇔英、日⇔中、
英⇔中国語・韓国語・アラビア語・イタリア語・インドネシア語・ギリシャ語・スウェーデン語・スペイン語・タイ語・タガログ語・ドイツ語・トルコ語・ヒンディー語・フィンランド語・フランス語・ベトナム語・ペルシア語・ベンガル語・ポーランド語・ポルトガル語・マレー語・ロシア語

[2021.8] ポストエディット作業や、チェック作業を削減する方法はありますか?

ロゼッタT-3MTは、自社の対訳データ(TM)からカスタムモデル(翻訳エンジン)を生成し、翻訳精度を向上させることで、ポストエディットの手間を削減できます。目的に特化したAI翻訳のカスタムモデルにより、意図した翻訳を得られるようにしていきます。これまでの汎用型AI翻訳エンジンの出力は、翻訳結果をポストエディットすることで意図した翻訳に修正していましたが、T-3MTでは、ポストエディットを施した対訳データや、自社の対訳データを使ってAI学習することで、意図する翻訳結果をT-3MTの出力から得ることができるようにします。

T-3MTは、マニュアル制作現場で使用することが多いXML、DITAやDITAMAPに対応していますので、制作データをそのまま翻訳することも可能です。
本セッションでは、T-3MTの最新情報をお届けします。

[2021.7]自社のシステムにT-4OOやT-3MTを連携させることはできますか?

Rozetta APIを使用することで、自社のシステムにT-4OOやT-3MTと連携する機能を実装できます。自社システムのアプリケーション操作だけで、T-4OOやT-3MTに翻訳リクエストを投げ、結果を得られるようにすることもできるので、翻訳するために別アプリケーションを起動する必要がなく、シームレスに連携できます。

T-3MTでは、内製の英-多翻訳エンジンに対応するため、セキュリティが維持される環境下で、リクエストに応じて必要な時に必要な分だけ高性能の翻訳エンジンを活用することができます。

Rozetta APIの主な機能は次の通りです。
テキスト翻訳API:テキストの原文を指定した言語に翻訳します。
音声翻訳:音声ファイルを、テキスト又は合成音声に翻訳します。
ファイル翻訳API:大量のファイルを一括アップロードし、翻訳完了後、一括でダウンロード可能なAPI
分野指定機能:翻訳の分野を指定し(法律・金融など)、専門用語を自動で反映することができます。
ユーザー辞書機能:専門用語に特別な翻訳を指定できる機能

Rozetta APIのドキュメントは、<https://translate.classiii.io/doc/ja/>を参照ください。

Rozetta APIを利用したアプリケーションをご紹介します。
T-4OO Desktop – Windowsデスクトップでの操作だけで、翻訳することができます。
Rozetta Translator – Slackへの翻訳プラグインで、チャンネル内の会話を翻訳します。

サードパーティ製品としては、CATツールのMemsourceやTradosからT-4OOやT-3MTを利用できます。
ISEからは、FrameMakerの画面上の操作だけで、T-4OOやT-3MTを利用できプラグインが提供されています。執筆中の指定する日本文の日英翻訳と、生成された英文を日本文へリバースする英日翻訳ができます。執筆する日本文がAI翻訳によって意図した翻訳となるか、必要な時に必要な箇所だけ日本文で確認します。詳細は<こちら>を参照ください。

Rozetta APIを使用したカスタマイズや詳細について、情報システムエンジニアリングまでお問い合わせください。
お問い合わせ:https://www.ise.co.jp/contact/

[2021.6]T-3MTのトライアルはどのような手順で翻訳結果を確認できますか?

T-3MTのトライアルは、1.データの準備、2.翻訳モデルの構築、3.検証 の順番で進めます。流れを追って説明します。

  1. まず、データの準備です。
    T-3MTは、AI教師データを学習データとして使用し、AI翻訳モデル(カスタムモデル)を構築します。対訳データを準備してください。対訳データの量としては、200~1000行程度、最大でも1万行までです。
    対訳データをお預かりさせていただければ、お預かりした対訳データから、AI翻訳モデル用の教師データを作成し、ご提供することも可能です。
  2. 次に翻訳モデルの構築です。
    T-3MTのメニューからの操作でAI翻訳モデルの構築ができます。教師データをアップロードしてください。アップロードした教師データは、サーバー側でGPUを使用してAI翻訳モデルが構築されます。
  3. モデルが完成したら、実際に翻訳を行い、翻訳結果を確認ください。
    実際に翻訳性能を確認するために、翻訳用データの注意点を2点挙げます。
    1) 教師データには含まれない文での確認
    教師データに使用した対訳データが、検証用データに含まれていると、その文については、すでに、答えを知っていることになりますので、本来の翻訳性能の確認ができない可能性があります。教師データには含まれない文を使用して翻訳結果をご確認ください。
    2) すでに対訳のあるデータでの検証
    すでにリリースされている文章など、翻訳した結果があると、それと比較することができますので、まずは、翻訳済みの文章で検証することをお勧めします。その後、他の文章も翻訳して翻訳精度をご確認ください。
トライアルに必要となるデータのまとめ

事前にご準備いただくデータは、以下の3点です。
1.AI翻訳モデル(カスタムモデル)生成用「対訳データ」
2.実際に翻訳検証したい文章
3.実際に翻訳検証したい文章の、見本訳となる翻訳文

費用とスケジュール
  • 費用
    AI翻訳モデルの構築については費用はかかりません。T-3MTを使用して翻訳した場合は、翻訳量に応じて費用がかかります。検証を行いたい文章に応じてお見積りいたします。
  • スケジュール
    対訳データをお預かりした場合のAI教師データ作成に2週間ほどお時間をいただきます。完成後、教師データをご提供しますので、お客さまでの検証期間を1週間程度とさせていただきます。
トライアルのお申込み

トライアルの受付は、情報システムエンジニアリングにて承ります。
その他、ご不明点等、いつでもお気軽にお問い合わせください。
お問い合わせはこちらまで

[2021.5]T-3MTでAI学習するための教師データは何を用意すればよいですか?

日英の対訳データを、Excel形式でご用意ください。
A列とB列で1:1となるようにセットします。データ量は最大で1万行。推奨は、200~1000行(10-50ページ)程度です。翻訳原稿と対訳データの内容の類似性が高いほど、わずかな参考訳でAI学習できます。

すでにお持ちのTranslation Memoryの活用もできますが、意図した結果を導くために、重複対訳や類似対訳をクリーナップすることをオススメします。すでにリリースしたドキュメントを活用する方法もあります。確認済みのデータのはずですし、ここから対訳データを作成すれば、教師データとしての精度も確かなものとなります。

AI教師データの例
[2021.3]T-3MTを使用して、対訳データを使用して学習したときの翻訳結果はありますか?

翻訳結果をご紹介する前に、学習する内容をご紹介します。
用語統一のQ&Aで紹介した例の他、以下2例を含む計300行の対訳データをT-3MTに学習させます。

学習例1:”XXX Research Lab”という固有名詞に対応する翻訳が、地名に関係無く「当社研究所」とする。

“XXX Research Lab” →「当社研究所」

学習例2:”XXXX Data”という単語に対応する翻訳が「XXXX 性」となり、”Data”要素が「XXXX データ」と翻訳されない。

”XXXX Data” →「XXXX 性」

さて、翻訳結果です。まず、学習した対訳とは完全に一致しない文を翻訳させた結果を見てみます。

翻訳結果1

翻訳結果1

学習した対訳データにより、意図通りの翻訳を得られたことが確認できます。
次に、学習した対訳データとは、異なる文脈で翻訳された例を示します。

翻訳結果2

翻訳結果2

学習対訳とは異なる文脈には影響が及んでおらず、ディープラーニングの精度が高いことがわかります。T-3MTは、300行程度の参考訳例から、用途に合わせた翻訳カスタムモデルを生成できることが特徴のひとつです。

ぜひ、御社の対訳データを使って翻訳を試してみませんか? 詳しくはこちらへ

[2021.2]用語の統一はどのようなアプローチになりますか?

以下のように、ご希望の用語を含んだ対訳データを使ってAIに学習させることで、カスタムモデルの生成を行い意図通りの翻訳結果を得ます。

”announceという動詞に対する翻訳に「レクチャーします」を学習させます。
[2021.1] カスタムモデルを生成するメリットは何ですか?

お客さまがお持ちの対訳データを用いて、ロゼッタが開発した汎用モデルをベースに、お客さま専用の新たな翻訳モデルを作成する機能です。お客さまの対訳データを使うことで、お客さまがふだん取り扱っている文書等(原稿)の翻訳に、より適した翻訳モデルを生成し、意図通りの翻訳結果を得ることができます。

[2021.1]ロゼッタの汎用モデルは、分野を選択できますか?

9分野から選択できます。具体的には、機械、IT、電気、医薬、化学、特許、法務、金融・IR・会計、会話・メールから選択できます。

[2021.1] 複数のカスタムモデルを構築することは可能ですか?

翻訳分野や対象によって、翻訳の仕方は変わるものです。目的別にAI学習させるTranslation Memoryを分けて、複数の翻訳モデルを構築することで、ポストエディット作業を削減化します。用途を特化させることで、より目的に沿った翻訳結果を得ることができます。

図:カスタムモデルの生成
[2021.1] T-4OOとT-3MTの違いは何ですか?

T-4OOは、2,000の専門分野からロゼッタ社が構築したモデルを選択して翻訳します。一方、T-3MTは自社のTranslation Memory(対訳データ)を使用して独自の翻訳モデルを構築して翻訳します。対訳データの取り扱いが異なり、T-4OOは、完全一致準完全一致で利用しますが、T-3MTでは、ディープラーニングの学習データとして利用します。

T-4OOとT-3MTの違い

お問い合わせ

記事に関するコメント、お問い合わせをお待ちしております。
お気軽にお問い合わせください。
※株式会社情報システムエンジニアリングよりご案内させていただきます。

*)セールスに関してご返信はいたしませんので、あらかじめご了承ください。

個人情報の取り扱いについて

  • URLをコピーしました!
目次