JAIST Repository >
School of Information Science >
Articles >
Journal Articles >

Please use this identifier to cite or link to this item: http://hdl.handle.net/10119/4928

Title: 文脈効果のモデル化とそれを用いたワードスポッティング
Authors: 米沢, 裕司
赤木, 正人
Keywords: 文脈効果
調音結合
ワードスポッティング
なまけ
Issue Date: 1997-01-25
Publisher: 電子情報通信学会
Magazine name: 電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理
Volume: J80-D-II
Number: 1
Start page: 36
End page: 43
Abstract: 人間は聴覚の補正機構の働きにより, 調音結合のためになまけた音韻であっても正しく認識することができる. 本論文では, 聴覚の補正現象の一つとして考えられる文脈効果をモデル化し, モデルをワードスポッティングの前処理として用いる. モデルは近接したスペクトルピークの影響で人間の知覚するスペクトルが本来のスペクトルに比べ変化することを記述したものであり, 報告されている心理実験の結果をもとに, 最小分類誤り学習によりモデル化を行った. 次に, モデルの能力を検証するため, モデル適用によるホルマント軌跡の変化を調べた. その結果, モデルには調音結合のため連続音声中に現れる「なまけ」を回復する働きがあることがわかった. また, モデルを前処理として用いた母音認識実験を行い, その結果, モデルを用いることにより有意な認識率の向上が見られた. 更に, モデルを前処理として用いたワードスポッティング実験を行った. その結果, 単語検出率が1-6ポイント程度向上し, モデルが前処理として有効に機能することを示した.
Rights: Copyright (C)1997 IEICE. 米沢裕司, 赤木正人, 電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理, J80-D-II(1), 1997, 36-43. http://www.ieice.org/jpn/trans_online/
URI: http://hdl.handle.net/10119/4928
Material Type: publisher
Appears in Collections:b10-1. 雑誌掲載論文 (Journal Articles)

Files in This Item:

File Description SizeFormat
J80.pdf507KbAdobe PDFView/Open

All items in DSpace are protected by copyright, with all rights reserved.

 


Contact : Library Information Section, Japan Advanced Institute of Science and Technology