単語音声データベース
操作用語/地名/人名/商取引用語に主に使用する単語を収録した音声データベース
概要 / 特徴
すでに家庭向けとしても導入が進みつつある音声認識システム。
単語音声データベースは、頻繁に利用される単語を多数収録し、機械学習のための教師データとして、さらに品質検証用のデータとしても最適な製品です。
音声によるコマンド入力機能を備えた情報機器が普及段階を迎えるにあたり、システム調整、性能評価などで、ご要望の強い単語を基本とした発声者200名*1(男女各100名)の音声データベースを商品化しました。
特徴
- 広い年齢層(14~77才)の発声者
- 国際標準(ITU-T勧告P.80)に従った録音。計測用低雑音コンデンサマイクロホンを使用し、防音室で実施しているため高SN比。
- ディジタル編集:16kHz、16bitサンプリング、バイナリファイル。※サンプルとしてWAV形式への変換ソフトを添付しておりますが、16bitのDOSプログラムのため、仮想DOSマシン(NTVDM)が有効化されたMicrosoft Windows 10 (32bit版)上でのみ動作を確認しています。
- 単語ごとにパワーレベルを等化(ITU-T勧告P.56のActive Speech Levelで、16bit Max点に対し-26dB)
WAV形式でもご提供いたします、価格等詳細につきましてはお問い合せください。
構成
第1巻 制御用語編:CD2枚組
<PC・ワープロなど操作用語>
例: 新規、作成、保存、範囲、大文字、改ページ、整列、明朝、半角、…など、178単語
<各種運搬機械、電気機器など操作用語>
例: 上昇、下降、早く、遅く、前進、後退、開ける、閉める、再生、録音…など、76単語
第2巻 地名編:CD2枚組
地名:新幹線駅名、東京近郊高速道路インター名、全国主要空港名、県庁所在地名、新、町、北などの接頭語を含む216単語
第3巻 人名編
人口比第1位から第256位までの姓、256単語
第4巻 商取り引き用語編
数字*2、単位、バンキング、交通など347種
電話機(コードレス、携帯を含む)を通した場合や、騒音、雑音を加えた場合のカスタム版も開発中。
*1 誤発声、不自然な発声などを除去しているため、単語によって発声者の組み合わせが多少違うことがあります。
*2 2桁数字は1桁目、2桁目とも1~9が必ず使用されるような9個の組み合わせ(発声者ごとに異なる)を発声させたため、同一数字で見ると発声者数は20人程度となっています。
価格
単語音声データベース | 1巻:440,000円(税込)より / 1ライセンス |
---|
同商品シリーズ
- 環境騒音データベース
- 広帯域ステレオ音声データベース
- 高齢者&子供音声データベース
- 多言語音声データベース2002
- 多言語音声データベース(擬似音声)
- 多言語音声データベース(都市名)
- 日本語音声データベース