|
JAIST Repository >
b. 情報科学研究科・情報科学系 >
b10. 学術雑誌論文等 >
b10-1. 雑誌掲載論文 >
このアイテムの引用には次の識別子を使用してください:
http://hdl.handle.net/10119/4928
|
タイトル: | 文脈効果のモデル化とそれを用いたワードスポッティング |
著者: | 米沢, 裕司 赤木, 正人 |
キーワード: | 文脈効果 調音結合 ワードスポッティング なまけ |
発行日: | 1997-01-25 |
出版者: | 電子情報通信学会 |
誌名: | 電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 |
巻: | J80-D-II |
号: | 1 |
開始ページ: | 36 |
終了ページ: | 43 |
抄録: | 人間は聴覚の補正機構の働きにより, 調音結合のためになまけた音韻であっても正しく認識することができる. 本論文では, 聴覚の補正現象の一つとして考えられる文脈効果をモデル化し, モデルをワードスポッティングの前処理として用いる. モデルは近接したスペクトルピークの影響で人間の知覚するスペクトルが本来のスペクトルに比べ変化することを記述したものであり, 報告されている心理実験の結果をもとに, 最小分類誤り学習によりモデル化を行った. 次に, モデルの能力を検証するため, モデル適用によるホルマント軌跡の変化を調べた. その結果, モデルには調音結合のため連続音声中に現れる「なまけ」を回復する働きがあることがわかった. また, モデルを前処理として用いた母音認識実験を行い, その結果, モデルを用いることにより有意な認識率の向上が見られた. 更に, モデルを前処理として用いたワードスポッティング実験を行った. その結果, 単語検出率が1-6ポイント程度向上し, モデルが前処理として有効に機能することを示した. |
Rights: | Copyright (C)1997 IEICE. 米沢裕司, 赤木正人, 電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理, J80-D-II(1), 1997, 36-43. http://www.ieice.org/jpn/trans_online/ |
URI: | http://hdl.handle.net/10119/4928 |
資料タイプ: | publisher |
出現コレクション: | b10-1. 雑誌掲載論文 (Journal Articles)
|
このアイテムのファイル:
ファイル |
記述 |
サイズ | 形式 |
J80.pdf | | 507Kb | Adobe PDF | 見る/開く |
|
当システムに保管されているアイテムはすべて著作権により保護されています。
|