東京大学へ合格することを目指し、センター試験の模試を毎年受けてきた人工知能の「東ロボくん」が、東大合格を諦めたそうである。
毎年、着実に模試の成績を向上させ、今年は有名私立大学に合格したほどの成績だったのに残念なことだ。理由としては、問題文を読み解く「読解力」がなかなか向上せず、国語や英語などの科目で、現在の技術では今後の成績向上が望めないとのこと。
教科書に必ず解答がある歴史や、数式を知っていれば解ける数学などは、AIは得意とするところだ。しかし英語や国語だと、設問に対する直接的な回答が教科書にはないので、正解にたどり着くのは非常に難しいことは容易に想像がつく。しかし、そんなことは2011年に「東ロボくん」というプロジェクトを立ち上げた時点で、判っていたはずだ。
人工知能の分野で、昔から難問と言われている問題に「フレーム問題」と「シンボルグラウンディング問題」がある。「フレーム問題」とは、人間なら誰でも知っている「一般常識」を、どこまで人工知能に学習させなければならないか、という問題。例えば、水が満杯のコップを移動しようとする場合、人間なら水がこぼれないようにそっと持ち上げるだろう。しかしロボットにやらせる場合だと、空のコップと水の入っているコップ、内容物がアイスクリームなら多少傾けても大丈夫だの、ありとあらゆるケースを想定しないといけない。単純な動作でも、その背景に膨大な知識「常識」を用意しなければいけないことが「フレーム問題」である。
「シンボルグラウンディング問題」とは、言葉の持つ意味を理解できるか、という問題だ。つまり、「水」という単語には「液体」とか「透明」とかのような定義がされてはいるだろう。しかし「水」の概念を把握するためには、「飲める」とか「蒸発する」のような外界との相互作用まで把握していないと「理解」したとは言えない、という問題だ。体を持たない人工知能には「意味」を獲得できない、という身体性アプローチの考え方である。
「東ロボくん」のスタート時点では、ディープラーニングはまだ登場していなかった。したがって、あくまで想像だが「東ロボくん」のアプローチは、従来からある自然言語処理と検索手法、コーパスなどを地道に改良していく手法と思われる。ディープラーニングの最大の成果は今のところ画像認識にあり、入試問題には直接利用できないし、LSTMを応用して作文ができるほど日本語レベルが高いとも思えない。
とにかく、言葉の持つ意味を理解していない限り解けない「読解」の問題は、「シンボルグラウンディング問題」そのものだ。機械翻訳が構文から文章を作成する方式から、統計学を応用した方式に転換したように、「読解」には何らかのパラダイムシフトが必要なのは確かだ。意味を内包する「概念」にラベリングしたものが言葉なのだから、その概念を何らかの表現形式、コンピュータ内部にメモリ出来るフォーマットに落とし込めれば可能のはず。少なくとも人間の頭脳では実現できているので、ニューラルネットワークの延長線上で実現できそうな気もするのだが・・・。
ま~だから当然、この「東ロボくん」プロジェクトメンバーは、この大問題に真正面から取り組んでいるものだと思っていた。それがわずか5年程度で投げ出してしまったとは情けない。
DeepMind社は10月、ディープラーニングの大きな欠点「破滅的忘却」を、次世代ニューラルネットワーク(Differentiable Neural Computers:DNC)で解決できたのだ。やはり日本もここはあきらめずに、日本の英知を結集して、AIの進化に貢献してもらいたいものだ。