NEW
野村直之「AIなんか怖くない!」

「AIは自ら学習し考える」という大いなる誤解…AIへの不安解消!エッセンスを解説

文=野村直之/AI開発・研究者、メタデータ株式会社社長、東京大学大学院医学系研究科研究員
【この記事のキーワード】

, ,

 というわけで、まず「AIの中身、中核部分」を早速、次の「図1 深層学習で猫の特徴が自動的に抽出される仕組み」で理解してしまいましょう!

 上記、拙著の引用箇所の直後に、「深層学習とは何か ―深層学習が実際に機械的に行っていること」という説明ページが続きます。数式を使わずに、CNNというタイプの深層学習の動きのエッセンスを紹介しています。今回は「敵(AI)を知り」(本当は敵じゃないけど)、入力データ(画像など)から特徴を自動的に抽出し、出力データ(写っているモノの名前など)との間の対応関係を次第に高い精度にしていく様子を説明しています。

「AIは自ら学習し考える」という大いなる誤解…AIへの不安解消!エッセンスを解説の画像2
図1 深層学習で猫の特徴が自動的に抽出される仕組み

 図1で、左上にある入力画像は猫の写真で、右上の出力はその猫の名前です。アラビアンマウという名の、とても大きな耳の猫について、同種猫の多数の違った画像に共通する特徴、すなわち、およその耳の位置、長さ、形などを残すフィルターの重みを学習時に増していきます。

 図では、異なるフィルター群を何回か通って耳の辺りの特徴が残っている縮小画像を赤枠で囲い、目の辺りの特徴が残っている縮小画像を緑枠で囲っています。両方の特徴が残っているのもあれば、どちらも判別できず、青くつぶれている画像もいくつもあります。この「つぶれている」という情報(状態)も機械的に判定し、次のステップに受け渡される(右方向へ出力に近づく)際に捨てられます。これは、多数の画像の間で共通性のみられない無意味な特徴を抽出するフィルターを通ってきたためといえます。学習を繰り返すと、対象の本質を現わさない手がかりを残すフィルターの重みが小さくなっていきます。

 これらのフィルターは機械的にはたらきます。フィルターを通った結果、特徴が残っているか否かも機械的に判定されます。いろんな特徴が残ったもの(画素数が大きく間引かれた小さな画像)について、さらにそれらが両立しているかなどが、さらなる特徴(抽象化した特徴)として抽出されていき、最後は6×8=48(「ろくはしじゅうはち」)個のカラーの点の集まりにまで抽象化されます。これが、入力の猫画像の「特徴の塊」となります。複数の猫種ごとに、この「特徴の塊」の小さな、小さな画像があり、そのどれに似ているか、RGBすなわち赤緑青の256段階の明るさの近さを機械的に計算。そして、一番近かった猫種の名前 ――ここではアラビアンマウ――)を出力するのです。

 いかがでしょうか? 上記の、重みを増したり減じたりする仕組みのおかげで、自動的に特徴が学習されること。そのためには、何千、何万枚の猫写真に「(正解は)アラビアンマウ」などのラベルを人間が付けて丹念にAI(深層学習)をトレーニングしなければならないこと。そして、出来上がったAIは、猫の種類を当てるだけの専門の道具となることが、上記の説明により、すっきり明確になったと思います。もちろん、この猫種識別という専門能力は優れたもので、67種類もの猫種を95%以上の精度で認識。これほど正確に猫種を言い当てられる人間など1万人に1人いるかというところでしょう。

関連記事

プレスリリース入稿はこちら サイゾーパブリシティ