日本語音声データベース
日本語音声データベース

15~65歳の日本人男女が4秒程度の短文章を200文章発声

概要 / 特徴

概要

日本語でもっと多くの文章と発声者のサンプルが欲しい、というご要望にお答えして、好評発売中!
スマートフォンの普及により、すっかり身近なものとなった音声認識システム。
その精度の向上には、発声者の異なる多数の音声サンプルを用いた機械学習や、自然言語データベースを利用した検証作業などが必要不可欠です。

世界の標準化機関でも音質評価用日本語データベースとして推奨。
男声/女声、必要な音声を選択可能。100人分/50人分とご予算に応じて必要なデータベース量を購入できます。


発声者

15歳~65歳の一般の男性、女性それぞれ100名ずつが発声しています。発声者によるアクセント等の違いは発声者の習慣を尊重し、特に言い直しはしておりません。無視しております。また、発声途中の呼気音、嚥下音(唾を飲み込む音)などは、除去しておりません。

※ 発声誤り、雑音を含んだサンプルなどを除去したため、文章によって発声者の組み合わせが多少違うことがあります。

文章

4秒程度の短文章(200文章)を発声しています。既にITU-Tでおこなわれた音声符号化方式の品質評価試験で使用した音声サンプルも収められています。

※ 本ページに記載されております製品、サービス名または固有名詞は、各社の商標または登録商標です。
※ 本製品の仕様は予告なく変更することがあります。

資料請求・お問い合わせ

 

仕様 / 詳細

仕様

ファイル形式

バイナリファイル(PCMフォーマット、16bit)で、16KHzサンプリング。文章ごとにパワーレベルを等化しました。(ITU-T勧告P.56のActive Speech Levelで、16bit Max点に対し-26dB)

※ Windows WAV形式への変換ソフト(MS-DOSで使用)を添付しております。  

録音

すべての音声サンプルはディジタル録音・編集機器を用いて録音しています。録音方法はITU-T勧告P.800に準拠しています。

本ページに記載されております製品、サービス名または固有名詞は、各社の商標または登録商標です。
※ 本製品の仕様は予告なく変更することがあります。

適用例 / 導入事例

適用例

音声を用いた製品開発、ネットワークなど各種音質評価試験、音声認識研究

価格

日本語音声データベース お問い合わせください。
※ なお、上記50人分の年代などお客様のご希望による組み合わせの変更はできません。



PAGETOP

同商品シリーズ


資料請求・お問い合わせ

Twitterでシェア Facebookでシェア