話者ごとの音声分析に最適な多指向性マイクロフォン用開発キットを販売開始~世界初!12方向の発話を瞬時に分離し集音、自動追従機能も搭載~
2020年11月11日

話者ごとの音声分析に最適な多指向性マイクロフォン用開発キットを販売開始
~世界初!12方向の発話を瞬時に分離し集音、自動追従機能も搭載~

NTTアドバンステクノロジ株式会社
NTTテクノクロス株式会社

NTTアドバンステクノロジ株式会社(以下:NTT-AT、本社:神奈川県川崎市、代表取締役社長:木村丈治)とNTTテクノクロス株式会社(以下:NTT-TX、本社:東京都港区、代表取締役社長:串間和彦)は、NTTメディアインテリジェンス研究所の技術を活用して開発した世界初となる多指向性小型マイクロフォンモジュール(Voice Compass Direction Module)とアプリケーションの開発に必要な開発者用マニュアルをセットにした「Voice Compass Developer Kit」(以下:本製品)を、2020年12月上旬から販売します。

多指向性小型マイクロフォンモジュールは、最大12方向の音を個別に分離して集音する機能および話者の方向を自動で推定し位置変化に合わせて集音する自動追従機能を有することから、これらの機能を会議議事録システムに搭載することで、これまでは困難であった話者を分離・識別した音声認識が可能となるため、議事録作成業務の効率化が図れます。

本製品は、11月12日(木)~13日(金)に開催される「コールセンター/CRMデモ&コンファレンス2020 in 東京」に出展予定です。

背景

企業やそこで働く人々にとって、日常的に行われる会議の議事録作成は、大きな負担となっています。その手助けとなる自動議事録作成ツールは、多くの企業が開発し販売しています。しかし、一般的な置き型全指向性マイクを使用し複数人の会話を収録すると、話者の識別が困難なため、音声の認識率に悪影響をおよぼします。また、一人ひとりにマイクを用意すると、装着の煩わしさやコストの増加などの問題が発生します。

それらの問題を解決すべく生まれたのが本製品です。1台のマイクデバイスで最大12方向の高度な話者分離を実現し、正確かつ手軽な自動議事録作成に大きく貢献します。

本製品の特長

本製品は、NTTメディアインテリジェンス研究所で研究開発されたIM-ASTER*1技術をベースにしたマイクデバイス(NTT-ATが商品開発)とIM-ASTERライブラリ(NTT-TXが提供)、および開発者用マニュアルをセットで提供する製品です。

〔主な特長〕

  • IM-ASTER技術により、最大12方向を個別に分離*2して集音を可能とする多指向性小型マイクロフォンモジュール
  • 話者の方向を自動で推定し、位置変化に合わせて集音する自動追従機能
  • 高品質な雑音抑圧機能
  • 8個のMEMS*3マイクとIM-ASTER技術によるソフトウェア処理で指向性をより鋭く形成
  • 約60gの軽量・小型のため持ち運びが簡単
  • マイクデバイスはUSBバスパワー方式による給電
  • 12方向分離を商用化した製品は世界初*4

提供範囲

本製品では、マイクデバイスで集音した音声を、ソフトウェアで処理することにより音声分離を実現します。ソフトウェアはライブラリ形態での提供となります。

製品名 提供物
Voice Compass Developer Kit Voice Compass Direction Module(マイクデバイス+IM-ASTERライブラリ)および開発者用マニュアル

マイクデバイス

マイク素子数 8個
周波数特性 60~7,000Hz
消費電流 150mA以下
電源 USBバスパワー (DC5V)
外形寸法 H14.5×φ64.7mm
質量 約61g (コード除く)
対応OS IM-ASTERライブラリの動作要件に準ずる
付属品 USB(A-miniB)コード(約1m)

 

IM-ASTERライブラリ

提供形態 ・64bit Windows DLL形式ライブラリ(Windows)
・共有ライブラリ(*.so)形式ライブラリ(Linux)
機能 ・方向別音声分離(最大12方向、自動追従時は最大6方向、集音範囲は約60°)
・自動追従機能(最大±30°の範囲)
動作要 Windows用 CPU:Intel Core i5以上のCPU
OS:Windows 10 64bit
Ubuntu用 CPU:Quad-Core Intel Atom E3845
1.91GHz以上
OS:Ubuntu 18.04 LTS
ARM Linux用 CPU:Cortex-Aシリーズ1.4GHz以上、
NEON命令利用可

OS:Linux OS (ARM 32bit)

開発者用マニュアル

  • インターフェース仕様書
  • サンプルプログラム

販売開始時期

2020年12月上旬

販売元

NTT-AT、NTT-TX

価格・販売

価格や販売に関する詳細につきましてはお問い合わせ下さい。

展示会のお知らせ

次の展示会に出展いたします。

コールセンター/CRM デモ&コンファレンス2020 in 東京

*1  IM:Intelligent Microphone

ASTER:Anti-distortion Suppression of noise with mask-based TransfER function estimation

*2  12方向から集音しますが、各方向の集音範囲は概ね60°程度となります。

*3 MEMS:Micro Electro Mechanical Systems(微小電気機械システム)

*4  2020年10月現在 NTT-AT調べ

 

※記載された会社名及び製品名は、各社の商標または登録商標です。

【NTT-AT 会社概要】 https://www.ntt-at.co.jp/

NTT-ATは、1976 年の創立以来、NTTグループの技術的中核企業として、NTT研究所のネットワーク技術、メディア処理技術、日本語処理技術、環境技術、光デバイス、ナノデバイス技術などの多彩な先端技術のみならず、国内外の先端技術を広く取り入れ、それらを融合してお客様の課題を解決し、お客様にとっての価値を提供し続けています。

【NTT-TX 会社概要】 https://www.ntt-tx.co.jp/

NTT-TXは、NTT研究所の最先端技術を中核に、国内外の優れた商材を豊富な実績とノウハウで掛け合わせることで、お客様のビジネスシーンに最適なソリューションを創出します。時代に先駆けたソリューションにより、豊かな未来社会の実現に貢献し続けます。


 

 

 
このニュースへのお問い合わせ先


 

 
Twitterでシェア Facebookでシェア