人工知能の翻訳システム

Googleが提供している「Google翻訳」は2016年で本格提供開始から10周年を迎えています。膨大な量の対訳データからなるコーパスをもとに翻訳を行ってきたのですが、2016年9月からは一部の言語で翻訳アルゴリズムを変更し、人工知能「ニューラルネットワーク」を用いることで、より人間に近い自然言語処理が行える「Google Neural Machine Translation (GNMT)」を導入しています。
グーグルは文法には多くの例外があり機械的には翻訳はできないと言っています。
基本的には膨大な対訳ファイルを使い、統計的なマッチングして類似の対訳ファイルから最適な翻訳を選びます。膨大な事例から類似性でマッチングをしております。
利点の一つは既に翻訳された文章なので自然な訳を得る事ができます。
しかし、対訳ファイルがない場合は翻訳できません。統計的機械翻訳システムであれば、データがない場合は良い翻訳になりません。
このシステムはディープラーニングで学習できますから、データが増えるとどんどん翻訳の質が向上します。
従来の方法は文法的に置き換える文法解析でした。辞書さえ対応できればどんな英語や日本語でも訳す事ができます。しかし、機械的に文法基盤に訳すため不自然でおかしな訳が多くなります。
そして文法的なルールと、語彙を改善してしまうともう翻訳の質を良くする方法はありません。翻訳の質は文法をどれだけ組み込むかと言う事であります。無限に文法が存在する訳ではありません。

英会話を話す場合我々も翻訳とは無縁ではいられません。それでは脳ではどのように翻訳しているのでしょうか。人工知能の学習の方法は脳を真似たディープラーニングです。つまり人工知能は脳と同じような仕組みで学習しています。

すると脳は人工知能と同じ方法で翻訳していると考えるのは自然な事です。実際には文法を基盤に日本語を英語に訳す場合が多いと思います。

この方法では文法的であっても不自然な表現をどんどん作り上げてしまう傾向にあります。

私も以前は文法を基盤の通訳をしておりました。しかし、2010年以降は教材作りや、ディープラーニングの普及のためにネイティブを真似る方法でどんどん英語表現をおぼえました。

そして通訳をすると使えそうな事例を活用するので、通訳をしている時に負荷が軽減され、非常に楽な通訳が可能であり、多分通訳の質も上がっていると思っています。

通訳を希望する場合でもディープラーニングでどんどん表現事例を覚える方が効果な学習ができます。

一緒に英語を学びませんか

ディープラーニングで一緒に英語を勉強しませんか。次のサイトにメソッドと教材があります。

の方が会員として参加しています。

for-member/memberlist/

現在、無料モニターを募集しております。下記リンクから無料で登録できます。

for-member/register/

シェアする

  • このエントリーをはてなブックマークに追加

フォローする