ビジネスパーソン向け人気連載|ビジネスジャーナル/Business Journal

現在の第3次AI(人工知能)ブームは2012年頃に立ち上がりました。間もなく10年になります。過去半世紀、さまざまなIT系のbuzz word (皆が口にする目標のようなスローガン)が各々のブームを牽引してきましたが、10年もの間、ブーム、熱狂が続くのは異例のことです。
1980年代末から92年頃にかけての第2次AIブームは急激に盛り上がったものの、妥当なコストで本格的に実用になるシステムができずに急速に凋(しぼ)んだといえます。今回は毎日のように新たなAIのブレークスルーや活用事例が報道され、実際にスマホ内部やクラウド上の何百種類ものAIに皆がお世話になっているため、単なるブームで終わらないことは確実です。
第3次AIブームの前半数年は、猫を見分ける画像認識が起爆剤となり、画像認識・文字認識、音声認識、そして強化学習、転移学習の併用で実用化が進みました。2017年頃から急発達をはじめ、ブームの後半を牽引してるのが自然言語処理です。2段ロケットだから10年続いたとみることもできるでしょう。自然言語処理のブレイクで、翻訳はもちろん、要約、対話、絵の読み解きなどが高性能化してくると、その仕事(ホワイトカラー業務)、生活(コミュニケーション全般)へのインパクトは画像認識の比ではありません。
機械翻訳は当たり前に使えるようになっている
深層学習というのは、入力と出力の間を数十億本とかの線で結んでさまざまな特徴を変換する仕組み(関数)です。そこで、理屈(文法)は返上して、だんだん長い単語列と、別の外国語の単語列を入出力に大量に並べて学習させれば、それっぽい対訳を生成できるんじゃない? とやってみたらできちゃった、というのが最近の機械翻訳(ちょっと乱暴な表現ですが)。文法よりも膨大な量の知識になるコロケーション、すなわち、自然な語の選び方やつながりを深層学習が覚える。Google翻訳も数年前に突然、精度が飛躍的に向上しました。
しかし、明らかにそれを超える、何か常に自然な文脈を生成してくれるのが、 DeepL という十数か国語間の翻訳システムです。必ずしも正解とは限りませんが、ほとんどの場合に明らかにGoogle翻訳より自然で、精度も高いです。DeepL に比べると、Google翻訳の翻訳結果は、まるで外国人が書いたような不自然さを感じる頻度が桁違いに多いです。
とはいえ、自分がある程度以上できる外国語の場合は、DeepL で1回訳しただけで若干の手直しで使ってもいいですが、心もとないとき、そして、知らない外国語の時は必ず、逆方向に翻訳したり、日本語だけでなく知っている外国語、英語などに翻訳して、決定的に意味が違っていないかのチェックは必要です。逆方向翻訳にGoogle翻訳や、中国語なら百度(Baidu)翻訳など、別の翻訳を使うのもいいでしょう。いずれにせよ、一昔前には想像すらできなかった高精度で、桁外れに実用的になったのは深層学習のおかげです。
読解力をある程度備えたAIの台頭
しかし、これらの翻訳システムは、ほぼまったく文章を理解していない、といっても過言ではありません。それなのに、なぜ外国語の初学者を凌駕する翻訳ができるかといえば、過去の翻訳、すなわち入力単語列と出力単語列の対応関係のベストプラクティスを大量に覚えているからです。量は力。ただ、いきなり入力単語列と出力単語列を(複雑に)対応させているので、途中の「理解」「意味を把握」というところをすっとばしているのがミソ。