画像認識 ×AI ×チャットボット技術の融合

カテゴリ: 成功の秘訣やポイント


今日のAI(人工知能)サービスのトレンドとして、画像に写っているモノを認識する画像認識とヒトの言葉を理解する自然言語処理を活用したチャットボットがあります。本記事では画像認識と自然言語処理が普及した背景を確かめたうえで、このふたつの技術が融合したサービスを紹介します。

ディープラーニングのAI学習によって実現した画像認識

今日、画像認識が急速に認知度を上げた背景にはディープラーニングによるAIの学習が技術的に確立されたことがあります。ディープラーニングとは、ヒトの脳神経細胞(ニューロン)の働きをまねしたニューラルネットワークと呼ばれるデジタル処理を何層にも重ねた学習処理プロセスを意味しています。「ディープ」という言葉は、この積み重なったニューラルネットワークの層によって「深い」学習プロセスが実現していることを表現しているのです。

ディープラーニングは、幾層もあるニューラルネットワークが画像の特徴を少しずつ抽出した後、抽出した特徴を結合して画像が何であるかを判断します。例えば、手書きの数字の「3」を認識する時は、ふたつの曲線部分を抽出してから認識するというプロセスを実行します(実際はもっと複雑です)。

ディープラーニングによる画像認識は、多くの画像を認識することによって認識精度が向上するという特徴があります。そのため、画像認識の精度を上げるためには、大量の学習データが必要となります。大量の学習データをデータベースに蓄積していくことは時間的な問題、サーバー負荷の問題など様々な検討課題を要します。

コンテクストを理解する自然言語処理AIの登場

チャットボットやスマートスピーカーの登場に見られるように、今日のAIの重要なトレンドとして、自然言語処理(ヒトの言葉の理解)もあります。コンピュータは、その語源が「計算する(compute)」であることから分かるように、もともとは数値計算を高速で処理するデバイスとして発明・開発されました。

その数値計算能力をチェスのような明瞭なルールのあるゲームに応用することに関しては大きな成果を上げることができましたが、言語のような曖昧さを多く含むものへの応用は遅れていました。

しかし、最近では言語の曖昧さを許容する処理方法が開発され、チャットボットのようなヒトの言葉に反応するサービスが登場しました。現在の自然言語処理では、文章を単語ごとに分割して処理する形態素解析とともに、文章のコンテクストを抽出する文脈解析を実行することで曖昧な自然言語に対応しています。ここでいう、コンテクストとは、文脈や前後関係、事情を指します。すなわち、言葉の意味を前後関係から読み取ることや、状況・環境を考慮しながら意味を抽出するという複雑な作業を理解できるようにAIがなってきているということなのです。

「画像認識 ×AI ×チャットボット」が実現する自然な接客

以上のような画像認識と自然言語処理を組み合わせたサービスが、昨年8月に発表しました。チャットボット<OK SKY>を開発・提供する株式会社空色は、ネオス株式会社の画像認識AIとチャットボット開発基盤<SMART Message BOT>と<OK SKY>を融合させた新しい接客システムを発表しました。この接客システムの登場によって、従来は有人オペレーターが対応していた接客をよりAIに代替することが可能となります。具体的には、以下のようなAI活用を想定しています。

スマホで撮影した服に合わせてAIがコーディネート

まずユーザがお持ちの服やカバン、アクセサリーをスマホで撮影後チャットを介して送信して頂きます。送信された画像からAIがユーザのファッションアイテムを一括して認識します。そして、認識した情報をもとにしてユーザに合うコーディネートを提案します。チャットボットには学習機能があるので、学習を繰り返すことによって複雑な内容の提案も次第に可能となります。今まで学習するという行為はヒトでしか対応できない行為ととらえられがちでしたが、Ai技術が目覚ましく発展してきた現代においては、有人で対応していたカスタマの接客対応自体も少しずつヒトからAIへ転換し始めているのです。

返品の接客対応をAI化

購入された商品に汚れやほつれなどの不具合が見つかった時、その不具合ヶ所をスマホで撮影して頂いた後、チャットを介して送信して頂きます。送信されてきた画像をもとにAIが不具合箇所を認識し、認識した不具合を交換・返品基準に照らし合わせたうえで返品処理を実行します。従来は有人オペレーターが対応していた返品業務をAIが代替することによって、人件費の削減と接客品質の安定化が実現します。

AIを導入することで生まれる効用

スマートフォンを常に携帯し情報を収集するスマートフォンの利用時間が非常に長くなっている現代社会において、カスタマが欲しい商品の情報を24時間365日、リアルタイムに、クイックレスポンスで対応していくことは売上拡大するために非常に重要になってきています。営業時間外だから対応できない、不具合や返品基準を確認しているため一定の時間を要する(カスタマをその時間の分だけお待たせしないといけない)、在庫や他店舗情報を確認するのに少し時間を要するなど、今まで全て店舗の接客員が行っていた行為も、そのデータさえデータベースに投入し学習していくことができればその業務は全てAIに代替可能なのです。接客員によって対応が遅い早い、コーディネートのセンスが良い悪いなど接客品質の差が出てしまうことも、AIであれば一定の品質を保つことが可能です。

世界のAI学習を備えた画像認識の活用例

AI×画像認識技術によって精度を向上させた屋外用防犯カメラ

世界では画像認識×AIの活用事例はたくさん出ています。その1つとしてNetatmo社が発表した、Deep Learningを使った屋外用監視カメラがあります。Netatmo社はスマートホーム製品を開発発売していますが、AI(人工知能)によって人や車、動物を検知し、さらにユーザーに通知することもできる屋外用防犯カメラ「Presence」を3万9700円(税込み)で発売しました。

「Presence」は、検出エリアを設定できます。たとえば公道などは検知対象外として通知せず、私有地内に入ってきた対象のみを通知させるといったことが可能です。また、AI(人工知能(深層学習アルゴリズム)によって人や車、動物を区別し、それぞれに対して検出するかどうかを決めることができます。もし検出した対象が不明瞭な場合や検知を迷った場合などには、それが人なのか車なのかをあとから利用者が選んで学習させることもできます。こういったことを積み重ねることで精度が向上するのは人工知能搭載の強みかもしれません。この精度を向上させる積み重ねが実用性を大きく左右するといえます。

画像認識×AIの技術のより実社会の交通量を算出するサービス

もう1つ面白い世界の画像認識×AIの例として、Placemeterは歩行者数を計測し、実世界のコンバージョン率を導き出したという例があります。Placemeterは画像処理技術を活用し、歩道などに設置したIPカメラの映像から、車、自転車、歩行者数の交通量などを算出するサービスだ。計測したデータは、例えば、都市計画や小売店の出店場所の選定などに役立てることができる。

以上のように、画像認識と自然言語処理というそれぞれ別個に進化してきたAIテクノロジーが融合することによって、従来ではAIが代替するとは見なされていなかった業務もAIが代替可能となるのです。AIが代替可能な業務は、今後も拡大していくでしょう。