JAIST Repository >
b. 情報科学研究科・情報科学系 >
b10. 学術雑誌論文等 >
b10-1. 雑誌掲載論文 >

このアイテムの引用には次の識別子を使用してください: http://hdl.handle.net/10119/7754

タイトル: 変調伝達関数に基づく音声信号処理(1)パワーエンベロープ逆フィルタ処理の原理とその応用について
著者: 鵜木, 祐史
発行日: 2008-09
出版者: 信号処理学会
誌名: Journal of Signal Processing = 信号処理
巻: 12
号: 5
開始ページ: 339
終了ページ: 348
抄録: 私達は,日常,何不自由なく音声を介してコミュニケーションをとっている。しかし,読者はこんな経験をしたことはないだろうか。例えば,お風呂場や教会など音が非常に響く環境(残響環境)や,人で賑わっている雑多な場所,交通量の多い場所といった非常に騒がしい環境(騒音環境)では,静寂な環境に比べて非常に音を聴き取り難く,いつもと同じように簡単に会話をできないと感じたことである。これは,身の回りの音場環境の影響により,音声が歪んだため,音声知覚に重要な情報が欠落したことによるものである。このような音声コミュニケーションの難しさを評価する尺度として,音声明瞭度,単語・文章了解度が利用されている。前者は無意味音節を発声したとき受聴者がその何%を正しく聞き取れたかを,後者は沢山の有意味単語を発声したとき受聴者が正しく聞き取れた単語数の割合を示すものである。これらの尺度は,音声情報伝達を議論するときに,よく利用されるものであるが,同時に室内音饗学と関係して議論されるとき,音声レベル,騒音レベル,残響時間等の物理量との関連を見出そうとする検討も古くから行われている。代表的なものとして,Houtgast とSteeneken によって提唱された変調伝達関数(Modulation Transfer Function:MTF)に基づく音声明瞭度予測理論がある。これは,音場内において,音声波形の時間的な包絡線情報(以後,エンベロープと呼ぶ)が残響や雑音によって変形することに着目し,100%振幅変調した正弦波を利用してMTFの減衰量から音声伝達指標(SpeechTransmission Index: STI)を予測するものである。この方法は,その後,簡易測定法であるRASTIとして提案され,現在でも標準的な方法として利用されている。STI/RASTI の方法は,理論的に明解であり,実用上多くの利点をもつため,講演会場など室内音響設計にも役立っている。しかしながら,この方法は決して万能であるわけではなく,(1) 音場の時間構造・空間構造を反映していないことや(2) 音源(音声)の物理特性を反映していないことから,音声明瞭度予測に対して適用限界があることが示唆されている。Houtgast とSteeneken が提唱した音声明瞭度予測理論は,室内音響を拡散音場と仮定しているため,上記のように,その適用限界があることは間違いない。しかしながら,室内音響伝達系を入出力の強度情報の関係と残響・雑音に対するMTF を明解に関係づけた点は,大きな業績であり,評価されることであろう。また,この考えは,他の音声信号処理で残されている諸問題を解決するために利用することもできる。例えば,室内の残響の影響を受けた音声を伝達系を測定せずに回復する方法 や,残響環境下での音声の基本周波数推定方法がある。最近では,室内の残響時間をブラインド推定する方法や異なる二つの音場空間を考慮した音場再生法も提案されている。本論文は,合計3回のシリーズで構成される。これらでは,著者が関係した研究分野(残響環境下の音声信号処理)を中心に,MTF を利用した音声信号処理を解説する。本稿では,まず,Houtgast とSteeneken が示したMTF の概念を解説するとともに,その概念に基づいたパワーエンベロープ逆フィルタ法を紹介する。
Rights: Copyright (C) 2008 信号処理学会. 鵜木祐史, 信号処理, 12(5), 2008, 339-348.
URI: http://hdl.handle.net/10119/7754
資料タイプ: author
出現コレクション:b10-1. 雑誌掲載論文 (Journal Articles)

このアイテムのファイル:

ファイル 記述 サイズ形式
RISP08.pdf508KbAdobe PDF見る/開く

当システムに保管されているアイテムはすべて著作権により保護されています。

 


お問い合わせ先 : 北陸先端科学技術大学院大学 研究推進課図書館情報係