藤井聡太の強さ、アルファ碁と共通の仕組みか…AIがプロ棋士に勝つのは当たり前
アルファ碁に「直感」はあるのか
次に、アルファ碁に直感があるかどうかの話に移ろう。
アルファ碁がイ・セドルに勝利を収めたとき、AIが直感を獲得したかどうかが話題になった。問題になったのは、第二局の黒の37手だ。イ・セドルだけではなく、AIと対決して負けた囲碁や将棋の名人の多くは、「(AIは)人間が気がつかない手を打つ」とコメントする。あるいは、また、「囲碁と違う競技を見ているようだ」というコメントもあった。黒の37手もそのひとつで、常識からかけ離れた手だったらしい。実際、最初に学習させた3000万種の手のなかには存在していないものだった。
アルファ碁の開発責任者で強化学習の専門家のデビッド・シルバーは、黒の37手は、明らかにAIが人間でいうところの直感を発揮したと考えている。試合のあと、シルバーが調べてみると、アルファ碁は、この手をプロ棋士が打つ確率は1万分の1だという計算をしていた。その手を確率が非常に低いにもかかわらず打ったということは、アルファ碁の直感が働いたからだとシルバーはいう。
シルバーは、「アルファ碁はプロの棋士が使う確率は1万分の1と非常に低いことを打つ前に知っていたが、同時に報酬が多いことも知っていた」と語る。「アルファ碁は内省(introspection)と分析の結果、自分でそれを発見したんです」と分析している。
・AIと将棋や囲碁をして負けた名人の幾人かが、「人間が打たない手を打つ」とコメントしている。これは、人間の認知バイアスで説明がつくのではないだろうか。プロは、従来プロが打ってきたパターンを勉強する。それが代々続いているわけだ。時々、まったく新しい手が発見されることがあるようだが、それでも、各名人の脳の中の記憶にあるのは、ある程度似通った内容だろう。だが、ゲームに特化したAIのなかには数千万件のデータがあり、そのデータをつかってAI同士で数百万回の試合をしている。新しい手を発見する確率はより高くなる。
・最終的勝利の確率をするモンテカルロ木探索手法は、モンテカルロ木探索ヒューリスティクスとも呼ばれる。なぜなら、すべての枝を最後まで追跡することは天文学的時間が必要になるので、コンピュータでも無理。ほとんど無作為に最終的勝利をもたらすような枝だけを追跡するようにする。「ほとんど無作為に」という言葉に、直感が含まれているかもしれない。完全な無作為ではなくて、過去に勝利に導いた手とか、今の試合で良かった手といったデータに基づいて重みを変えて選択している。これを直感と呼べるのかもしれない。この場合、「無作為/random」という言葉を人間的に「無意識」に変えてもよいかもしれない。
以上のような推測はできるが、その真偽のほどは不明だ。なぜなら、人間の直感や勘についての仕組みもわかっておらず、どちらも“ブラックボックス”だからだ。