AIブームが起きてから数年経ち、「ディープラーニング」という言葉もやっと一般に認知されるようになってきた。しかし話題先行ばかりで、なかなか現実のビジネスには役に立っていない。それどころか、2017年頃から生じた「POC祭り」のおかげで、AI技術は役立たずという評判まで立ちそうな雰囲気にさえなってきている。
ところが2018年12月に開催された「国際画像機器展2018」を見学して驚いた。なんとディープラーニングを、誰でも使えるパッケージソフトにした画像処理ソフトがあったのだ。ソフトウェアのコードをまったく書けない一般ユーザーでも、わずか100枚程度の教師画像データを入力して数分間トレーニングするだけで、製品の外観検査ツールができてしまうという。アメリカの「COGNEX社VisionPro ViDi」というソフトウェアだ。デモを見ている限りでは、実際に誰でも簡単に使えそうなパッケージソフトに見える。
ディープラーニングの機能として画像認識機能を、APIで提供しているIT企業なら多数ある。GUIで多層のニューラルネットワークを組めるフレームワークも既にある。しかしCNNへの学習機能と画像分類機能をパッケージソフトに入れて、誰でも使えるようにしたソフトウェアは画期的だと思う。
この画像機器展には、多数の日本のベンダーが標準的なディープラーニング・CNNを使って、小さな部品の外観検査のデモを行っていた。各ベンダーに質問すると、必要な教師画像データの数は、百枚程度あれば足りるというベンダーから、数千枚以上は必要だというベンダーまで幅広い。使用するソフトも、ベンダーしか扱えないものから、ユーザーでもなんとか教師データの再学習ができそうなものまでバラエティに富んでいた。ここはベンダーの設計思想や技術力の差が大きく、POCを積み重ねてきた経験の差なのだろうな。
それにしても2018年10月にあった「日経 xTECH EXPO」、「CEATEC JAPAN」、「Japan IT Week 秋」などの大展示会で展示していた「AIソフト」らしきものを見る限りでは、ディープラーニング技術のビジネス利用はマダマダという印象だった。どこのベンダーも「POC貧乏」にあえいでいるばかりとしか思えなかったのだ。それがこの画像機器の展示会を見ると、ディープラーニングの実用化が、この分野では確実に始まっている。以前から画像機器を開発しているソフトウェアベンダーは、ディープラーニングの技術を2015年頃から注目し、活用を始めているからだという。
比較的小規模の画像機器展に出展しているような中小のソフトベンダーは、狭いマーケットだからこそ顧客ニーズを良く理解しており、市場にマッチしたディープラーニングを利用したサービスを素早く提供できるのだ。日本は品質に厳しい工場が多数あるので、CNNの応用先としては製品の最終外観検査が適しているはずと、誰でも気がついていたはずだ。10月の大IT系展示会場では、何社も外観検査のデモをしていたのだが、話を聞いてみるとPOCばかりで実運用をしたことがないという。主な原因は、数万枚の教師画像データがない用意できないとか、精度や判定速度が悪いという話が多かった。製品の外観検査をCNNで判定する場合、CNNを得意とするAIベンダーなら、単純に良品と欠陥品の画像が大量にありさえすればできると思ってしまう。ところが現実には、数万枚もの製品の画像データなどないし、用意したとしても画像データ全部に良品と欠陥品のラベル付けする工数が膨大で、非現実的なのだ。
しかしこの画像機器展では、CNNの実用化が進んでいるベンダーが多い。この差は明らかに、外観検査というかマシンビジョンシステムを長年やってきている経験とノウハウの差だろう。CNNなどない時代から画像機器で外観検査をしてきているので、検査対象となる製品へのライティングの重要性を認識しており、その職人芸的ノウハウを持っているのだ。例えば半透明や光沢のあるパーツの場合、照射する光の波長や角度には知識と経験が必要で、単純なライティングではまともな画像は得られない。
さらにCNNを長年の間、研究というか開発実装しており、現場の状況も熟知しているので、教師画像データを減らす工夫をしている。ここはベンダーの技術力の差が大きく、教師画像データを綺麗に撮るだけのベンダー、画像処理やCGさらには「GAN」を利用して大量に画像を水増しするベンダー、そして「転移学習」でスマートに学習させるベンダーと様々あった。明言はしなかったが転移学習を使っていると思われる日本のベンダーは「システム計画研究所」で、正常画像データが100枚程度あればよいとのことだった。
まあ転移学習だとしても100枚は少なすぎるだろうと思ったが、ポイントは「製造業向け外観検査用」や「コンクリートのひび割れ用」のように、利用する画像を狭い範疇に絞っているところにあると思われる。そうすればCNNのネットワークの事前学習で、かなり精度が良い学習ができるからだ。
ちなみに日本のAIベンチャーの雄であるPFNも、この展示会で新製品を発表していた。PFNは技術力が高いと評判で多額の資金を集めているが、現実に具体的製品やサービスを出しているのを見たことがない。10月のIT展示会では、「全自動お片付けロボット」が床に置いてある物体を取り上げて箱に入れるデモをしていた。こんなものは、1969年にスタンフォード大学が開発した世界初の「汎用ロボットShakey」と大差ない。閉じられた空間「マイクロワールド」でしか動作しないはずだ。「フレーム問題」があるので、原理的に一般家庭にある多種多様な物体を認識できるわけがないのだ。理論ばかり先行して、実世界での経験がないから実用的なサービスを開発できないのだろう、と思っていた。
そのPFNが画像機器展で新製品を発表していたのだが、やっと現実に目覚めたのか照明機器の画像機器ベンダーと組んで、外観検査用ツールとしてCNNの応用商品を出展していた。特徴は教師データが100枚程度で学習できるというものだったが、今となってはシステム計画研究所のサービスより出遅れてしまっている。
それにしても冒頭で紹介したCOGNEX社は、技術力は日本のベンダーより明らかに高いし、そもそもビジネスモデルが異なっている。外観検査システムを構築する場合、日本のベンダーはユーザーから大量の教師画像を収集してパラメーターを調整するなどカスタマイズすることが大前提だ。これに対してCOGNEX社のビジネスは、最初から大量にソフトウェアを売ることができるように、CNNをパッケージに組み込み、ユーザー自ら教師画像で学習とその評価もできる簡単なUIを備えているのだ。
COGNEX社は長年マシンビジョンシステムを提供しているので、ユーザーニーズを熟知している。しかも顧客の手離れの良いパッケージソフトを売ることで、社内の貴重な技術者を、顧客毎の対応が必須のカスタマイズに無駄遣いする必要がなく、パッケージソフトの進化に技術を注力できるのだ。まさにパッケージソフトの王道を追求している。
日本のITベンダーのビジネスモデルでは、ビジネスを拡大するには顧客毎に技術者が必要なので、売上は技術者の数に依存してしまう。この人手不足のなかでは、技術力の向上も難しくなる。これでは大半のユーザーは、カスタマイズしてくれなくても、価格の安いパッケージソフトに流れてしまうだろうな。