単語音声データベース
単語音声データベース

操作用語/地名/人名/商取引用語に主に使用する単語を収録した音声データベース

概要 / 特徴

すでに家庭向けとしても導入が進みつつある音声認識システム。
単語音声データベースは、頻繁に利用される単語を多数収録し、機械学習のための教師データとして、さらに品質検証用のデータとしても最適な製品です。

音声によるコマンド入力機能を備えた情報機器が普及段階を迎えるにあたり、システム調整、性能評価などで、ご要望の強い単語を基本とした発声者200名*1(男女各100名)の音声データベースを商品化しました。
 

特徴

  • 広い年齢層(14~77才)の発声者
  • 国際標準(ITU-T勧告P.80)に従った録音。計測用低雑音コンデンサマイクロホンを使用し、防音室で実施しているため高SN比。
  • ディジタル編集:16kHz、16bitサンプリング、バイナリファイル(Windows WAV形式への変換ソフト(DOSで使用可)添付)
  • 単語ごとにパワーレベルを等化(ITU-T勧告P.56のActive Speech Levelで、16bit Max点に対し-26dB)
WAV形式でもご提供いたします、価格等詳細につきましてはお問い合せください。

構成

第1巻 制御用語編:CD2枚組

<PC・ワープロなど操作用語>
例: 新規、作成、保存、範囲、大文字、改ページ、整列、明朝、半角、…など、178単語
<各種運搬機械、電気機器など操作用語>
例: 上昇、下降、早く、遅く、前進、後退、開ける、閉める、再生、録音…など、76単語


第2巻 地名編:CD2枚組

地名:新幹線駅名、東京近郊高速道路インター名、全国主要空港名、県庁所在地名、新、町、北などの接頭語を含む216単語


第3巻 人名編

人口比第1位から第256位までの姓、256単語


第4巻 商取り引き用語編

数字*2、単位、バンキング、交通など347種

電話機(コードレス、携帯を含む)を通した場合や、騒音、雑音を加えた場合のカスタム版も開発中。

*1 誤発声、不自然な発声などを除去しているため、単語によって発声者の組み合わせが多少違うことがあります。
*2 2桁数字は1桁目、2桁目とも1~9が必ず使用されるような9個の組み合わせ(発声者ごとに異なる)を発声させたため、同一数字で見ると発声者数は20人程度となっています。


※ 本ページに記載されております製品、サービス名または固有名詞は、各社の商標または登録商標です。

価格

単語音声データベース 1巻:400,000円(税抜)より / 1ライセンス
※同商品シリーズを含む複数ライセンスをご購入の際は、お値引価格をご用意しておりますので、別途御見積いたします。

同商品シリーズ


資料請求・お問い合わせ

Twitterでシェア Facebookでシェア