6-2.日本企業のAPI
【docomo、goo、リクルートテクノロジーズA3RT、Jetrun、Studio Ousia】
・画像認識
画像を送信することで、画像内の物体等を認識しその名称等を返却することができる。カテゴリ認識では、Deep Learningの技術を用い、画像に写っているものが、指定されたモデルの中のどのカテゴリに属するのかを判定し、そのカテゴリの名称と判定の確からしさを表すスコアを返却する。
オブジェクト認識は、ユーザまたは開発者が事前に登録した画像に対して、認識を行うことができる。認識結果として、ユーザが登録した名称と画像認識の確からしさを表すスコアを返却する。
・文字認識
画像内の文字を読み取るWeb API。対象となる画像から文字や単語を抽出し、位置座標や認識精度を示すスコアも併せて得ることができる。
・山座同定
位置や方位等の地点情報及び撮影した画像を解析し、画像内の山の名前と稜線を返却するAPI。
・発話理解
発話文をテキストでインプットすると、文脈を解析し、その意図に沿った機能名及び値を返却する。発話は話しかけるような自然な文章を入力でき、回答は機能名の他に、文章中の特徴的な単語を抽出したものを返却する。
・言語解析
日本語文字列を解析する6つの機能を提供する。
日本語文字列を語句に分割する「形態素解析」、文字列中の人名・地名などを抽出する「固有表現抽出」、2つの語句の表記ゆれ度を算出する「語句類似度算出」、日本語をひらがな/カタカナに変換する「ひらがな化」、複数の商品レビュー記事を要約する「商品評判要約」と、人名や地名、組織など文書を特徴づけるキーワードを抽出する「キーワード抽出」の機能が利用できる。”
・シナリオ対話
ユーザーの発話テキストを受け付け、その入力に対してあらかじめ設定したシナリオに沿った自然な対話を提供
・雑談対話
ユーザの何気ない一言にバリエーション豊富な応答を返す、コンピュータと雑談を楽しむことができるAPI。雑談対話APIはユーザのどんな発話に対しても必ず応答。対話における話題と文脈を認識し、大規模発話データから応答文を選択し発話できる。(注)インターメディアプランニング「Repl-AI」を利用。
・トレンド記事抽出
インターネット上のニュース記事やブログ記事から、独自のトレンド解析エンジンにより抽出された、注目度の高い記事の一覧を取得し提供する。
・知識Q&A
質問をテキストでインプットすると、回答を返却するAPI。質問は話しかけるような自然な文章を入力でき、回答はズバリの回答候補を返却する。ドコモが提供する音声エージェントサービス「しゃべってコンシェル」でも活用している。
・音声合成
テキストを受け付け、その入力に対して自然な感じの読み上げをする(3種類ある)
【Powered by AI】人の声で合成する技術コーパスベース音声合成方式を採用し、より人間らしく自然な音声を実現。好みに合わせて話者が選択可能
【Powered by HOYAサービス】誰でも簡単に音声を作成、人の声に限りなく近い圧倒的な肉声感、明瞭感を実現。感情表現として幅を持たせることが可能。
サンタクロースやクマなどオリジナルのキャラクターの話者を選択可能
【Powered by NTT-IT】「元気なお姉さん」「女の子」「お婆さん」「メイド」「癒やし系お兄さん」「執事」などの話者(声色)と口調(抑揚)を組み合わせることで、225種類もの多彩な合成音声を選択可能。読み誤りが非常に少なく、聞き心地の良い自然な音声を実現
話す速さ、声の高さ、音量、アクセント位置、ポーズ長などを設定し自在に音声の読み上げが可能。
・音声認識
音声認識APIは、端末等で入力、収集した音声のデータをテキスト化する(2種類ある)
【Powered by NTTテクノクロス】従来のキーボードやボタンを使用してのテキスト入力ではなく、人が自然に話す音声でテキスト入力をすることができ、キーボードに不慣れなユーザのためのサービスなどを手軽に構築できる。
【Powered by アドバンスト・メディア】HTTPで音声データをPOSTするだけで、AndroidやiOSに限らず様々なプラットフォームでのご利用が可能。クライアントアプリケーションに特殊なライブラリを組み込む必要がないため自由度の高い実装が可能。リアルタイム認識を行うタイプの音声認識と比較して、応答速度が遅い為、レスポンスが求められる用途には不向き。
■goo
・地図API
目印となる建物を色づけや立体化でハイライトし、目的地までをわかりやすくナビゲートする地図が作れる。
・時刻情報正規化API
時刻情報正規化APIはリクエストで送られた日本語文字列と日時情報から、日付や時刻を表す表現を抜き出しその値を正規化して返却する。
・キーワード抽出API
リクエストで送られたタイトルと本文からなる文書から、人名や地名、組織など文書を特徴づけるキーワードを抽出。
・形態素解析API
リクエストで送られた文章つまり日本語文字列を、形態素と呼ばれる単語単位に分割
・固有表現抽出API
リクエストで送られた日本語文字列から、人名や地名、日付表現などの固有表現を抽出
・ひらがな化API
リクエストで送られた日本語文字列を、ひらがな もしくは カタカナ による記載に変換
・語句類似度算出API
リクエストで送られた2つのキーワードについて、その語句の発音内容を比較してその類似度を算出
・商品評判要約
商品レビュー記事の集合から、要約に含めるべき重要な評判情報となる部分を抽出し、それらを読みやすいように並べ直した要約文を生成する。
■リクルートテクノロジーズA3RT
・Listing API
word2vecのアルゴリズムを利用して、リスト生成をするためのAPI。ユーザーの行動ログを元にアイテム間の相関リストや、各ユーザーへのレコメンドリストなどを生成することができる。オンラインレコメンドや、ターゲティングメールなどに使用する。
・Image Influence API
CNNで画像の”影響度”を測り、多くの人に注目されやすい画像の判別に利用する。画像と画像に対応する点数を用意すると、未知の画像が自分好みかどうかを点数で把握できるモデルが作成可能。
・Text Classification API
CNNで文章を予め与えられたラベルに自動的に分類する。例えば、ポジティブなことを言っている文章かネガティブなことを言っている文章かを自動的に分類することが可能。
・Text Suggest API
LSTMで文章の自動生成および入力補助を実現する。膨大な原稿を学習することで、その中の文章の言い回しや表現を機械が学習し、ユーザが入力した単語や文章の後に続く文章を生成する機能を提供。
・Proofreading API
LSTMで、大量の日本語文章データから正しい文章の構成や文法、単語の流れを学習し、異常検知的に誤字脱字を発見する。例えば、”経験や視覚を活かせる職場です”という文章に対して”経験や <<視覚>>を活かせる職場です”という形で不自然な箇所を指摘し、その怪しさ度を返す。また、文章として書き換えた方が良さそうな単語も検知できる。
・Talk API
Chatbot用にLSTMで入力文から応答文を生成して日常会話応答を提供する。例えば運用しているWebサイトでAPIを呼び出し、サイト上でユーザとの会話を可能にする。さらにユーザとの会話を学習していくことでより賢く、より自然な会話を実現できる。
・Image Generate API
DCGANを用いてオリジナルの画像を生成するAPI。このモデルでは、既に自動生成された画像を合成し、新しい画像を作ることができる。作成した画像を評価することで、画像の生成に反映させることができる。
・Image Search API
画像とテキストの相互検索API。マルチモーダルDeep Learningという技術により画像とテキストの関係を学習することでテキストから画像を検索したり、画像からテキストを検索したりといったことが可能となる。
■Jetrun
・カテゴリ分析
膨大なニュース記事や社内データを解析して、その属性や成分を把握する。豊富な話題カテゴリ(ワード毎に付けられた1900以上の分類)を活用することで、細かな記事・口コミの分類が可能となる。分類の仕方もサービスに合わせてチューニング出来るので、詳細な分類が可能。
・TrueTALK
テキストで入力と出力を行う対話エンジンで、問いかけ文章を入力すると、その内容に応じた応答文章が返却される。ユーザーから話しかけられた内容に応じて、対話エンジン側の感情が「上機嫌・不機嫌」と変化し、話す内容が変化する。対話ログを蓄積・解析することで、ユーザーの趣味嗜好をエンジンが把握する。
・文章自動要約
テキストデータからユーザー行動ステータス、時間軸、行動起因や心理状態を抽出・解析する事で文書中の重要な要点を引き出し、最も必要な情報を効率的に把握する事を実現するAPI。この文章自動要約技術は、大規模な語彙や1900を越えるJetrun独自の話題カテゴリを持つ言語解析エンジンTrueTextを活用している。ニュース記事などの大量の文章と「伝えたい事」「取得したい情報」を予め深く学習し、新たな文章を要約して情報の「発信」と「取得」を行う。
・感情分析
ユーザーの声を“ポジティブ・ネガティブ・ニュートラル”の3段階に分類し数値化する機能。感情分析のもとになる感情・行動表現を数万パターンを用意し、ポジティブ・ネガティブを判断。ポジ・ネガそれぞれはスコアで評価しているので、どの程度ポジティブ・ネガティブなのかと言った、感情の強さも分析可能となる。
自社商品に対するネット上の書き込みを解析する機能。ソーシャルメディアや掲示板などに書き込まれた、とある商品に対するレビューを収集・解析ができる。
・キーワード抽出
豊富な語数を持つ独自辞書だけでなく、ゆらぎワード(表記の異なる同一のものを指すキーワード)も大量に保持しているので、ユーザごとに異なる表記でも同一として見ることができる。
・関連語抽出
キーワードから関連性が高い言葉を抽出するAPI。この関連語抽出を活用すれば、 言葉同士の関連性を評価し、文章中に含まれる言葉と関連語を抽出することが可能。例えば、「東京」と入力すると「大阪」、「東京タワー」と入力すると「東京スカイツリー」のように関連している言葉を抽出する。
・キュレーション技術
ネット上にある情報を効率よく集めて、話題と関心をマッチングするAPI。ユーザーの嗜好や過去の行動履歴に合致しない情報をノイズとして排除するのではなく、その中にこそユーザーに「気づき」を与える情報が埋もれていることに着目。コンテンツの話題性とユーザーの行動履歴に、コンテンツの属性割合とオノマトペを用いたニュアンスによる「ざっくり」したまとめなど、これまでになかった切り口で、フィルターの強度をチューニングができる。
・センシティブ分析
隠語を自動的に検知するAPI。隠語を含む公序良俗に反する有害な情報を自ら判断して除外可能となる。機械学習を行う際のデータクレンジングにも利用できる。フィルタリング用のワードを、ユーザーに合わせて提供することも可能。
・文概要分析
文中から「いつ」 「どこで」「誰が」「何を」「どのように」といった概要を示す単語を抜き出し、文の概要作成に必要な情報を整理・仕分けする。文章の長短に関係なく文章を構成するための要素として、重要な単語の組み合わせを抽出でき、文節単位で評価していくため、細かい分析ができる。
・キーワードゆらぎ取得
入力されたテキストの中から、主に名詞キーワードに対して単語情報と正表記を取得し、それに紐づく「ゆらぎ」を取得し、最適化する。
■Studio Ousia
・Semantic Kernel
自然言語処理のグローバルなコンペティションで2回優勝した、キーワード抽出エンジン。文章中から、固有名詞などのキーワードを精度よく抽出。キーワードの曖昧性を解消する。Wikipediaとの一対一対応でキーワードを正確に認識。キーワードの人間から見た重要性を認識、付与できる。キーワードを分類、DBpedia Ontology Classesを付与してカテゴライズする。
・QA Engine
高精度な質問応答システム。ユーザからの自然文で書かれた質問を解析し、即座に回答を返答ができる。著名な国際会議で開催された人工知能のクイズコンペティションで優勝している。
・Linkify
キーワードを自動的にリンク化する機能を簡単に組み込むことの出来る開発者向けAPI。
LinkifyをアプリやWebに導入すると、ユーザが検索したくなるようなキーワードを自動的にリンク化し、キーワードをワンタップで検索することができるようになる。
■インターメディアプランニング
・Repl-AI
誰でも簡単に、問い合わせ対応チャットボットを、自由に作成できる。プログラミング不要で、簡単に対話AIを作成が可能。