最近、名前をよく聞くようになってきた「スパースモデリング」だが、ディープラーニングの欠点を補える技術として、既に実用化が始まっている。
ディープラーニングは、画像認識において人の眼をも凌駕することができる。しかしその精度を出すためには、大量の教師データが必要だ。教師データが少ないと、「過学習」となり、上手く学習ができない。この過学習は非常に厄介な状態で、教師データにだけしか正解が出せない状態だ。言わば学生が一夜漬けで教科書を「丸暗記」したようなもので、ちょっと捻った応用問題を出されると、手も足も出せないのと同じ状態なのだ。
学生が真面目に応用問題まで勉強するように、教師データが大量にあれば、この状態から抜け出せる。しかし現実には、教師データを数十万や数百万も準備できないことがよくあり、そうなると、せっかくのディープラーニングも使えない。
しかし、このスパースモデリングという新しいAIテクノロジーは、このディープラーニングと異なり、大量のデータがなくても学習可能なのだ。詳しい原理はここでは避けるが、たとえ話で説明しよう。
英語は2000種類の単語を知っていれば、基本的には話せるそうだ。しかし2000単語だけで文章を作成すると、どうしても表現が回りくどくなり、長い文章になってしまう。しかしこれが専門用語など数十万単語を知っていれば、簡潔に表現できるようになるだろう。これと同じように、スパースモデリングは、自動的に「適切な特徴量」を選ぶので、データ量が少なくても学習できるのだ。
それではスパースモデリングの方が、すべてにおいてディープラーニングより優れているかというと、そうではない。ディープラーニングが大量のデータから自動的に特徴量を抽出するのとは逆に、スパースモデリングでは「たくさんの特徴量のあるデータ」を準備する必要がある。つまり各々データ種によって、得手不得手があるのだ。
スパースモデリングの応用例には、医療画像解析がある。MRIから鮮明な画像を取得しようとすると、大量の画像データ取得のために、どうしても検査時間が長くなる。そうなると検査中は体を動かせない患者に、大きな負担を強いることになる。しかしスパースモデリングを使うことで、短時間で取得した少ない画像データからでも、鮮明な画像が得られるようになるのだ。
このスパースモデリングは、まだ実用化が始まったばかりなので、今後は大きく発展していくと期待されている。