■今後は音声のほか、感情も認識する時代へ
注目したいのは、通信技術企業による音声認識技術の研究開発が着々と進んでいることだ。大手通信企業であるNTTドコモは、話し手とコミュニケーション機器との「自然な会話」のやりとりを実現するためにNTTドコモは人工知能を利用した「AI音声エージェント」を開発し、トヨタのシステムへ導入。
具体的な機能は、音声による入力に従ってコンピューターが自動的に会話の内容を判断して処理を行うとのこと。人工知能のバーチャルエージェントがユーザーの自然な発話を聞き取り、ナビの目的地設定やオーディオの操作、機器の取り扱い説明などを行い、複雑な発話でも理解することができるという。
重要なのは、音声認識技術で得られた発話の内容を理解するための「自然言語処理技術」だ。特にコマンドなどの予め決められたフレーズのみではなく、「話し言葉」によるあいまい(自由な)表現や新しい言葉に対しても解析や意味の理解などを精度よく行えるよう開発が進められている。
■人のセリフを口の動きで読み取る顔認証技術に発展
さらにNTTドコモは、同社の音声感情認識技術を利用して、感情の認識まで可能とするシステムも開発した。「音声感情認識AI」とは、対話音声として発話者が特定の感情の音声を意図的に発声しようとせずに、自然に発生された音声を認識。
雑音の多い環境での実証実験では、AIの声がけで、居眠りやドライバーの倦怠感を解消でき、気分良く運転できるようになるという。
ここまで来ると、最終的には自動運転を考慮して、音声認識に追加される機能があるとすれば、小型カメラを使って顔の表情を読むとともに、読唇術ではないが、人のセリフを口の動きで読みとって認識するような顔認証技術などが、自動運転技術の実用段階に向けた最終ステップとなるはず。
もはや音声認識だけでは留まらず、人とメカニズムのコミュニケーションという大枠のなかで研究開発が進められ、将来の自動運転技術実現へと進むキーテクノロジーのひとつになっていくことは間違いない。
コメント
コメントの使い方