
前回、今日の道具としてのAI(人工知能)、別名「弱いAI」の本質、深層学習が自動的に対象の特徴を抽出する仕組みを追いました。そして、AIが万能の打ち出の小槌ではないことを示しました。一つひとつの「弱いAI」は、大量の正解データの入出力の対応関係をキャプチャーすることで、その目的専用の道具として優れた性能を発揮するようになります。とはいえ、今日の「弱いAI」が実に強力なことは、十二分に強調に値します。これまで目や耳がないとできなかったから人間が担当してきた単純作業を、機械に置き換えられるようになっただけでも画期的です。
人類史上初、「暗黙知」(なぜどのようにそれが猫なのかなど、言葉や数式で説明できない知識)をキャプチャーできる機械(AI)の出現により、画像や音声のパターン認識、それから、文字列、単語列からなる文章のパターンを機械翻訳するなどの性能は画期的に向上しました。2011年以前の画像認識は、エラー率約30%以上(前方車両の認識率70%の自動運転車に命を預ける人などいないでしょう。99.9%でも「死に急ぐな!」ですが) と使い物になりませんでした。それが、意味を読み取れない一部の人間よりはよほど正確で気の利いた認識や翻訳ができるように、ここ数年だけでも劇的に精度向上しています。
下図1は、ImageNetという世界最大級の画像データベースを用いた画像認識競技会、ILSVRCの優勝チームの誤認識率 (エラー率)の変遷を示しています。競技会では、森羅万象の約1400万枚の正解ラベル(写っているものの名前)入り写真から、1000枚抜き出した画像に写っているものを当てる正解率を競います。2012年の深層学習登場から数年間、エラー率が劇的低下、すなわち認識精度が向上しています。

2015年、米マイクロソフト社のチームが、エラー率3.56%、すなわち、正解率96.44%で優勝しました。動物のテンとミンクを取り違えるなど、この課題は人間も間違えることがあります。当時人間の平均精度が 95.9%と評価されていたため、2015年暮れに、トップAIの精度が人間を超えた、と話題になりました。その後も、少しずつ精度が向上しています。