<< 前のエントリ合通ロジのトップページへ次のエントリ >>
2019年02月25日

【流 通】NEC 非定型音声データを用いる声認証技術を強化

NECは特定フレーズに依存しない非定型の音声データを用いるテキスト独立方式における声認証技術を強化し、認証時間を10秒から5秒に半減、認識精度を90%から95%に向上させた。

今回、深層学習を用いた新手法を開発するとともに、学習用音声データの話者数を5倍に拡張することで、自然会話による認証時間を10秒から5秒へ半減した。また、背景雑音や劣悪な通信環境下での電話会話や、複数話者の声が混在する状況など人でも聞き分けることが困難な環境で従来10%程度であった誤認証率を5%に半減し95%という高精度な個人認識が可能になった。特定のフレーズに限らない短い発声からでも個人の特徴を正確に抽出・識別することができるため、音声を利用した簡便なユーザインタフェースでの高いセキュリティを実現する。なお、95%の認証精度は米国国立標準技術研究所(NIST)が開催する第三者評価において実証された。

人間の身体的特徴や行動的特徴を用いて個人を認証する生体認証は、従来のIDとパスワードを使った認証と比べて、忘れる心配がなく、認証時のユーザの負担も軽いことから、指紋認証や顔認証を中心に幅広い場面で普及が進んでいる。特に声認証は話すという簡便な動作で認証ができる手軽さから、指紋や顔に続く新たな生体認証手段として注目されている。

声認証には特定フレーズの発話音声データを登録および認証に用いる「テキスト依存方式」と特定フレーズに依存せず非定型の自然な発話データを登録し、認証に用いる「テキスト独立方式」の2方式があ、そのうちテキスト依存方式はすでにスマートスピーカー等で実用化されているが、特定のフレーズを使用する必要があり利活用の場が限定されていた。一方、テキスト独立方式では自然会話から認証が可能であるため、発言スピード、アクセント、言語に依存せず応用・活用の場が広く期待されている。これまでは、認証に10秒以上の長い発声が必要といった技術的制約があったが、今回の新技術は、これらの課題を解決し、声認証技術の普及を大きく推進する。

この技術は本人確認手続きの効率化という点でコールセンター等の顧客応対業務や、他の生体認証等との連携によるEコマースやテレホン/ネットバンキングでの決済手続きの利便性向上、音声鑑定のような犯罪捜査支援などへ応用することを視野に、2020年の実用化を目指す。

※ 製品名および会社名は、各社の商標または登録商標です

投稿者:gotsuat 09:40| 流通