多言語音声データベース2002
多言語音声データベース2002

世界7カ国語をカバーし、発声者ごとに300の異なる文章を収録した多言語音声データベース

概要 / 特徴

概要

すでに家庭向けとしても広がりつつある、音声認識を利用したAI端末。2020年の東京オリンピックにおいても、複数言語を理解する音声認識システムの活用が期待されています。

世界7カ国語をカバーし、発声者ごとに300の異なる文章を収録した多言語音声データベース。
弊社製品「多言語音声データベース1994」との相違点。

  1. 21ヶ国語という多彩な言語を7言語に絞ることによって、発声者一人あたりの発音文章数を多く収録しました。
  2. 同じ文章を数人の発声者が、発音しています。

また、日本語については、「日本語音声データベース」も販売しております。 オプションとして「擬似音声データベース」もお買い求め頂けます。なお、擬似音声だけの別売りは致しませんのでご了承ください。


仕様 / 詳細

仕様

ファイル形式

バイナリファイル(PCMフォーマット、16bit)で、16kHzサンプリング。文章ごとにパワーレベルを等化(-26dB)


録音

音声サンプルはディジタル録音・編集機器を用いて録音しています。録音方法はITU-T勧告P.800に準拠しています。


発声者

発声者によるアクセント等の違いは発声者の習慣を尊重し、特に言い直しはさせておりません。また、発声途中の呼気音、嚥下音(唾を飲み込む音)などは、除去しておりません。
※ 発声誤り、雑音を含んだサンプルなどを除去したため、文章によって発声者の組み合わせが多少違うことがあります。

米語*1 男女No.1~5 300文章
男女No.6~10 170文章
英語*2 男女各5名 200文章
フランス語*2 男女各5名 200文章
ドイツ語*2 男女各5名 200文章
日本語*2 男女各5名 200文章
スペイン語 男女各5名 150文章
中国語 北京語 男女各5名 180文章
広東語 男女各5名 100文章

4秒程度の短文章を発声しています。

*1 このうち48文章は、男女10名が共通の文章を発声しています。
*2 英語、フランス語、ドイツ語、日本語は、10名が同じ文章を発声しています。他の言語は異なります。


※ 本ページに記載されております製品、サービス名または固有名詞は、各社の商標または登録商標です。

価格

多言語音声データベース2002 800,000円(税抜)/ 1ライセンス
※同商品シリーズを含む複数ライセンスをご購入の際は、お値引価格をご用意しておりますので、別途お見積させていただきます。

同商品シリーズ


資料請求・お問い合わせ

Twitterでシェア Facebookでシェア