機械学習と読書の世界

「AIは囲碁のルールも知らずになぜプロ棋士に勝てたか」 2016年3月

canstockphoto343532612016年3月にDeepMindが開発したAI(人工知能)『AlphaGo』と、囲碁の世界最強プロ棋士との五番勝負は、4勝1敗でAlphaGoの圧勝に終わった。

僕はここ数ヵ月、「機械学習」のプログラムを利用した実用化実験をしている最中なので、このAlphaGoに組み込まれているDeep Leaening(深層学習)も勉強中だ。だからこそ、予想より10年早いと言われるAIの勝利について、その圧倒的進化に驚いている。

この世界的な話題については、既に様々な記事が溢れているが、AIの社会的意味や動静などは、昨年書いた僕のコラム、「進化する人工知能の衝撃」に書いたので、今回はなぜAIがトッププロに囲碁で勝てたか、その原理の説明を試みてみたい。

一般的にAIとか言われているプログラムは、実用化が著しい「機械学習」の発展形だ。そしてこの機械学習も、原理は統計学にある。2013年に書いた僕のコラムで、ビジネス書「統計学が最強の学問である」を紹介したが、この本を読んでいれば理解がしやすい。この本にはAIに関する記述は一切ないのだが、読めば世の中の事象の大半を統計学で説明できることが分かる。つまり、社会現象の予測は統計学を応用すれば可能であり、この技術の延長線上に「画像認識」だの「顔認証」、さらに「音声認識」、「機械翻訳」などがあるのだ。

「教師あり機械学習」の場合、教師データとして入力されたデータを、統計処理してモデル化し、対象データが統計的にみてどの教師データに、『統計的に近いか』を計算して判断をしている。

例えば、英語や日本語の文章など、自然言語を処理する場合、コンピュータは数値しか扱えないので、まず文章の「特徴量」だけを抽出するが、この「特徴量」というのがAIでもキーワードなのだ。ある文章の特徴とは、『他の文章と比較してユニークな言葉がある』とも言い換えることができる。つまり、この言葉(特徴)は統計学を利用すれば、抽出可能なことは理解できると思う。この特徴量は数値なので、コンピュータは言語を直接扱わなくても処理できるようになる。

こうして、対象となるすべての文章の特徴を抽出しておけば、他の文章と比較可能となり、「あいまい検索」、「機械翻訳」などに応用しているのだ。非常に単純化して説明したが、なぜ機械学習が統計学の応用なのかを理解していただけただろうか。

ま~、ここから「深層学習」や「強化学習」までもっていくのは難しいな。あまり長すぎるのもナンナンで、人間の認識方法を模した概念だけでやってみよう。

人間の赤ちゃんは、生まれた直後に目に写った「画像」は、まだなんだか分かっていない。しかし何度も何度も見ているうちに、人の顔とか手とかの「共通パターン」を抽出できるようになってくることが、研究で分かっている。つまり最初は「画像」の細かな部分ばかり見てしまい、横顔と正面の顔では違う「物体」と認識している。しかし学習するにつれて共通パターンを抽出できるので、同一の顔と認識ができるようになる。つまり画像認識するとは、対象物を様々な角度で観察しても、同一物体と判定できる事なのだ。

これが、先ほど説明した「特徴量の抽出」のことだ。言い換えれば、認識とはある事象の共通パターンを保てること、一般的には「抽象化する」という言葉が当てはまるはずだ。

統計学がAIを通り越して哲学にまで飛躍してしまったが、人間の認識方法の原理は、統計学の延長上にあるのかもしれない。深層学習で使用されているアルゴリズム「ニューラルネット」も、もともと脳のシナプスを模した仕組みだ。生物は、自然現象を巧みに利用して進化してきているので、この解釈はそれほど間違ったものではないと、僕は思っている。

で、話を最初に戻そう。このAlphaGo研究チームは、まず高段者の棋譜データベースを元に、3000万件の打ち手データの情報を抽出し、これを教師データとして、ニューラルネットにひたすら「教師あり学習」をさせた。次に深層学習を応用し、異なるバージョンのAlphaGo同士を対戦させ、勝つことを報酬とする「強化学習」をさせた。これにより3000万局分の棋譜データを新たに生成し、ニューラルネットを鍛えたのだ。したがって、AlphaGoには、特に囲碁のルールは教える必要もなく、膨大な棋譜から勝つための「共通パターン」すなわち「特徴量」を抽出できたのだ。

AlphaGoは人間に1回だけ負けたのだが、問題は研究チームでさえAlphaGoが、あの局面であのような手を打ったのかが、解明できないところにある。デバックのしようがないのだ。したがってAIが人間社会に進出した場合、判断ミスをしても原因究明は困難を極めるだろうな・・・

とま~長々と書いてしまったが、AIと言われるプログラムの原理は、統計学にあったのだと分かってもらえたでしょうか。

メッセンジャーで遊べる無料のチャットボット

Amazonで「ディープラーニング入門書」を発売中

Amazonで「機械学習の入門書」を発売中

面白い本を探している本好きの人にお薦めします

Amazonから紙の本でも発売中

ミステリィやエンターテイメント、恋愛小説に文芸小説など、確実に面白い本100冊を紹介するブックレビューです

PAGETOP
Copyright © TickTack World All Rights Reserved.
Powered by WordPress & BizVektor Theme by Vektor,Inc. technology.