多言語音声データベース2002
世界7カ国語をカバーし、発声者ごとに300の異なる文章を収録した多言語音声データベース
概要 / 特徴
概要
すでに家庭向けとしても広がりつつある、音声認識を利用したAI端末。2020年の東京オリンピックにおいても、複数言語を理解する音声認識システムの活用が期待されています。
世界7カ国語をカバーし、発声者ごとに300の異なる文章を収録した多言語音声データベース。
弊社製品「多言語音声データベース1994」との相違点。
- 21ヶ国語という多彩な言語を7言語に絞ることによって、発声者一人あたりの発音文章数を多く収録しました。
- 同じ文章を数人の発声者が、発音しています。
また、日本語については、「日本語音声データベース」も販売しております。 オプションとして「擬似音声データベース」もお買い求め頂けます。なお、擬似音声だけの別売りは致しませんのでご了承ください。
仕様 / 詳細
仕様
ファイル形式
バイナリファイル(PCMフォーマット、16bit)で、16kHzサンプリング。文章ごとにパワーレベルを等化(-26dB)
録音
音声サンプルはディジタル録音・編集機器を用いて録音しています。録音方法はITU-T勧告P.800に準拠しています。
発声者
発声者によるアクセント等の違いは発声者の習慣を尊重し、特に言い直しはさせておりません。また、発声途中の呼気音、嚥下音(唾を飲み込む音)などは、除去しておりません。
※ 発声誤り、雑音を含んだサンプルなどを除去したため、文章によって発声者の組み合わせが多少違うことがあります。
米語*1 | 男女No.1~5 300文章 | |
---|---|---|
男女No.6~10 170文章 | ||
英語*2 | 男女各5名 200文章 | |
フランス語*2 | 男女各5名 200文章 | |
ドイツ語*2 | 男女各5名 200文章 | |
日本語*2 | 男女各5名 200文章 | |
スペイン語 | 男女各5名 150文章 | |
中国語 | 北京語 | 男女各5名 180文章 |
広東語 | 男女各5名 100文章 |
4秒程度の短文章を発声しています。
*1 このうち48文章は、男女10名が共通の文章を発声しています。
*2 英語、フランス語、ドイツ語、日本語は、10名が同じ文章を発声しています。他の言語は異なります。
価格
多言語音声データベース2002 | 880,000円(税込)/ 1ライセンス |
---|
※同商品シリーズを含む複数ライセンスをご購入の際は、お値引価格をご用意しておりますので、別途お見積させていただきます。