ナイトライダーの世界が現実に! クルマと対話時代に突入!「音声認識」最前線

■今後は音声のほか、感情も認識する時代へ

ドコモの音声感情認識技術とEmpathの音声感情解析AI(人工知能)技術をもとに開発。2018年度中にトヨタ車への導入を目指しているという。走行雑音がある環境でもドライバーの音声を検知し、感情を認識し、ドライバーの声から声の高さや音色などの音響的特徴を分析する。事前に機械学習で生成しておいた感情認識モデルを使い「怒り」「喜び」「悲しみ」のどの感情に当てはまるかを推定。AIがドライバーの感情を理解してそれに応じた声かけを行うことで、運転中の倦怠感の減少や居眠り運転の解消などにつながり、安全性が高まるという

注目したいのは、通信技術企業による音声認識技術の研究開発が着々と進んでいることだ。大手通信企業であるNTTドコモは、話し手とコミュニケーション機器との「自然な会話」のやりとりを実現するためにNTTドコモは人工知能を利用した「AI音声エージェント」を開発し、トヨタのシステムへ導入。

具体的な機能は、音声による入力に従ってコンピューターが自動的に会話の内容を判断して処理を行うとのこと。人工知能のバーチャルエージェントがユーザーの自然な発話を聞き取り、ナビの目的地設定やオーディオの操作、機器の取り扱い説明などを行い、複雑な発話でも理解することができるという。

重要なのは、音声認識技術で得られた発話の内容を理解するための「自然言語処理技術」だ。特にコマンドなどの予め決められたフレーズのみではなく、「話し言葉」によるあいまい(自由な)表現や新しい言葉に対しても解析や意味の理解などを精度よく行えるよう開発が進められている。

■人のセリフを口の動きで読み取る顔認証技術に発展

さらにNTTドコモは、同社の音声感情認識技術を利用して、感情の認識まで可能とするシステムも開発した。「音声感情認識AI」とは、対話音声として発話者が特定の感情の音声を意図的に発声しようとせずに、自然に発生された音声を認識。

雑音の多い環境での実証実験では、AIの声がけで、居眠りやドライバーの倦怠感を解消でき、気分良く運転できるようになるという。

ここまで来ると、最終的には自動運転を考慮して、音声認識に追加される機能があるとすれば、小型カメラを使って顔の表情を読むとともに、読唇術ではないが、人のセリフを口の動きで読みとって認識するような顔認証技術などが、自動運転技術の実用段階に向けた最終ステップとなるはず。

もはや音声認識だけでは留まらず、人とメカニズムのコミュニケーションという大枠のなかで研究開発が進められ、将来の自動運転技術実現へと進むキーテクノロジーのひとつになっていくことは間違いない。

新車不足で人気沸騰! 欲しい車を中古車でさがす ≫

最新号

新型プレリュード仮想カタログほか、スポーツカー好き大歓喜情報満載!ベストカー12月10日号発売中!!

新型プレリュード仮想カタログほか、スポーツカー好き大歓喜情報満載!ベストカー12月10日号発売中!!

 ベストカーWebをご覧の皆さま、ちわっす! 愛車がどれだけ部品を交換してもグズり続けて悲しみの編集…