100dBの騒音下でも高品質な通話や音声認識を可能とする小型インテリジェントマイクを開発
2014年09月24日

100dBの騒音下でも高品質な通話や音声認識を可能とする小型インテリジェントマイクを開発

~様々な利用シーン向けの音響信号処理技術を取り揃え、NTT-ATより展開~

日本電信電話株式会社
エヌ・ティ・ティ・アドバンステクノロジ株式会社

  日本電信電話株式会社(以下NTT、本社:東京都千代田区、代表取締役社長:鵜浦博夫)は、100dBの騒音下(工場内や電車通過中のガード下など)でも、高品質な通話や高精度な音声認識を可能とする「小型インテリジェントマイク」を開発しました。
  小型インテリジェントマイクとは、安価な汎用のマイク素子2~3個と、目的とする音声とそれ以外の雑音を高精度に推定して分離する「音響信号処理技術」を組み合わせることで、高騒音環境下でも、話者の音声を明瞭に集音できるものです。 (図1)
  本マイクを活用することで、これまで実現が困難であった大きな騒音下、例えば、工場内や工事現場等の機械騒音下や、高速道路を走行中の自動車内などにおいても、高品質な通話(明瞭なハンズフリー通話)や高精度な音声認識が可能になります。

  これまで、NTTでは、"単一マイク"で構成されるスマートフォンや音声会議装置、録音機器でも、高品質な通話・録音、音声認識を可能とする「背景雑音抑圧技術」や、カメラでズームするように遠く離れた場所(約20m)で話す人々の声から指定した人の声のみをクリアに集音可能な「ズームアップマイク技術」*1などを開発してまいりました。
  今後NTTでは、新開発の「小型インテリジェントマイク」によって、従来技術では困難であった音声サービスを実現し、様々な端末と音声を利用したサービスの飛躍的な発展に貢献してまいります。(図2)

※「モバイル音声認識向け背景雑音抑圧技術*2」、「音声会議・録音機器向け背景雑音抑圧技術*3



【販売について】
  エヌ・ティ・ティ・アドバンステクノロジ株式会社(以下:NTT-AT、本社:神奈川県川崎市、代表取締役社長:花澤 隆)は、今回NTTが開発した「小型インテリジェントマイク技術」をもとにした、ソフトウェアライブラリ「インテリジェントマイクライブラリ(仮称)」の販売を2014年10月より開始します。また、その他、音響処理技術も取得し、本ライブラリを、これら各種技術と組み合わせ、様々な利用シーン・ハードウェア構成における音声を利用した商品/サービス/ソリューションとして提供していく予定です。

利用イメージ

NTTの技術が可能とする音響処理の適用範囲

*1 凹型反射板の前に準最適に配置された多数のマイク素子と、それぞれのマイク間に生じる位相/振幅の差を利用することで、 任意の位置の目的音を強調して集音する技術(2014年4月16日ニュースリリース)http://www.ntt.co.jp/news2014/1404/140416a.html
*2 音声らしさを表す統計音声モデルとユーザーの発話の経過に応じて変化する特徴量を用い、雑音下での音声認識精度を大きく改善する技術
*3 通話向け用途に、比較的長時間(数秒~10秒程度)の雑音データからその雑音のスペクトルの時間変化推定することで、雑音の時間変化にも対応した雑音除去技術
報道発表詳細につきましては、以下のPDFをご覧ください。
このニュースへのお問い合わせ先

エヌ・ティ・ティ・アドバンステクノロジ株式会社
商品お問合わせセンタ


Twitterでシェア Facebookでシェア