ホーム > 音素バランス音声データ

音素バランス音声データ

音声処理・音響系の試験・評価、音声合成のための素材音声、音声認識用の音素学習に最適

資料請求・お問い合わせ

概要/特徴

発声内容

  • 音素バランスした1000の短文を読み上げています。
  • 音素バランス1000文とは、次のようなものです。
    ・日本語音声には、外来音節を含めて124種の音節があります。また、音素の点からは、27種類あります。
    ・これらの音節をすべて含み、かつ前後の音の組み合わせとして、できるだけ多くのものを含む文セットを設計しました。
    ・前後の音の組み合わせについては、音素の三つ組み(trigram)として、できるだけ多様なものが含まれるように考慮してあります。
    ・新聞記事などから抽出した短文を、上記観点から評価し、1000文を選択しました。
  • 音素バランス1000文を20個のサブセットに分割し、各サブセットでも音素バランスするようにしてあります。
  • 文の長さは、文字数で平均25.6文字、音節数で平均27.4音節になっています。

発声者・収録法

発声者 専門の俳優・声優の団体に属している男女各2名の声優
収録法 専用のスタジオで、DAT(デジタル・オーディオ・テープ)に録音
データ単位 デジタル信号のままパソコンに取り込み、文音声ごとにファイルへ格納
確認方法 文音声切り出しの後、波形表示・受聴