ビッグサイトで6/28~6/30まで開催されていた第1回人工知能 EXPO は、大盛況だった。主催者側が何を考えたのか、出入り口が1ヵ所しか設けないという愚作の為に、会場に出入りするだけでも長蛇の列だった。こんな展示会は初めてだ。

何度もここで書いてきたが、AIとか人工知能とかいうバズワードを、製品にではなく宣伝にしか使っていない企業が、相変わらず大半だった。それでも半年前に比べれば、多層ニューラルネット・DNN(ディープラーニング)を応用した製品が、わずかでも登場してきている。遅々として進まない日本のAI搭載製品だが、最近あまり進展が見られなかった日本語の自然言語処理技術で、唯一ブームとなっているのが「チャットボット」だ。

チャットボットは、一昔前なら「人工無能」とか言われていたのだが、昨年後半から商用化が続々と始まっている。昨年秋の展示会では、百社以上が「チャットボット商品」として宣伝していた。実際にはかなりのチャットボットは、ブームに乗じただけの人工無能だったが・・・

この話も以前書いたのだが、日本語の自然言語処理は英語と比較してかなり遅れていたが、それでも長い時間をかけて地道に研究が進んできた。そして形態素解析から構文解析、意味解析、文脈解析まで、やっとたどり着いたようだ。まともなチャットボットは、その自然言語処理の成果を応用して、ユーザーとある程度会話ができるようになった。つまりユーザーが入力した質問文の意味を解釈して、適切な回答がある程度できるようになった。

意味解析ができない人工無能の方は、入力された文章の中から用意してあるキーワードがあったら、IF文で分岐して回答文を選んで表示するだけだ。困ったことに、ユーザーはチャットボットの宣伝文句だけ読んでも、どれがまともに意味解析をやっているかは区別がつかない。チャットボットの性能を客観的に測る基準がまだないからだ。

どっちにしろ、このチャットボットは昨今のAIブームの主役であるDNNとは無縁の技術で、少なくとも日本語処理にDNNはまだほとんど利用されていないのが実情だ。唯一自然言語処理にDNNの一種であるLSTMを用いているのが、NTTレゾナントの「goo AIオシエル」だ。発表は2016年9月で、私も以前詳しく紹介している。今回の展示会でも発表していたが、素晴らしいのは長文の回答を自動生成していることだ。私が知る限りでは、どんなチャットボットの回答でも、事前に用意している文章を返しているだけだ。
もっとも、このAIオシエルは恋愛相談に対する回答なので、正解があるわけでもなく、気楽に回答しても問題は無い。だから、まずはこの恋愛相談で練習しているのだろう。NTTレゾナントは、秋には旅行相談にこの技術を使うと発表していた。ユーザーからの問い合わせに対して、希望に沿ったパッケージ商品を紹介するそうなので、間違えた商品を勧めるわけにはいかないだろう。そうなると一段と回答精度のハードルが上がるので、本格的な応用に進んでいくはずだ。他社はこの技術に追従できないのだろうか。

それと今回、私が初めて出合ったのが「日本語の長文を要約するエンジン」だ。エーアイスクエアという会社がデモ版として発表していたのだが、資料もなく危うく見落とすところだった。この技術は、(私の知る限りでは)まだどこも実用化していないはずだ。NTT系列の会社や自然言語処理を長らくやっている企業でも、まだできていないと言っていた技術だ。YHOOニュースで見出し作成の補助機能としてなら実用化していたが、あくまで編集者の参考でしかない。しかしこの要約機能は、何ページもある日本語の長文を、指定した文字数に要約してしまうのだ。英語なら数年前から本格的に実用化されており、私も利用したことがある。しかし日本語の要約エンジンはなかなか登場しなかった。

今回公開していた要約エンジンの原理は、最近自然言語処理分野で大ブームになっている「Word2Vec」だそうだ。これは、単語をベクトル化して表現する定量化の手法。例えば日常的に使う日本語の語彙数は数万から数十万といわれるが、これを各単語200次元くらいのベクトルとして表現する。このような手法は、ニューラルネットワーク分野で「分散表現(word embeddings)」と呼ばれている。英語圏では2014年頃から流行していたが、日本語でこの技術を利用して、要約を実現できたとなると画期的なことだと思う。

昔からコツコツと自然言語処理をやってきた研究者にとってみたら、やっと文脈解析までたどり着けそうになったのに、突然全く別のアプローチが出現して、しかも実用性能を一気に上回ってしまったのだから大変だろうな。結局、長年の研究目標だった「文章からの意味抽出」をしなくても、実用性の高い翻訳や要約が出来てしまうのだから。

そういえば展示会での発表ではないが、TOEIC900点程度の和文英訳が瞬時に行える機械翻訳エンジン登場という記事が6月末にあった。これもニューラルネットの応用とのことだ。こうなると人間の翻訳者は、近いうちにお払い箱になりそうだな。

ビジネスパーソンの業務時間の大半は、文章を作成することに費やしていると思う。しかし、このように自然言語処理分野の技術が急速に進展していくと、事務作業の大半は不要になっていくはずだ。AIは人間の仕事を着実に減らしていくが、言葉や文章を自在に操れるようになることが、最もインパクトが大きいことだと思っているのだが・・・