JAIST Repository >
i. 北陸先端科学技術大学院大学(JAIST) >
i20. 学位論文 >
M-IS. 修士(情報科学) >
M-IS. 1997年度(H09) >

このアイテムの引用には次の識別子を使用してください: http://hdl.handle.net/10119/1129

タイトル: 強化学習における危険回避行動獲得のための負の報酬伝搬法
著者: 寺田, 賢二
著者(別表記): てらだ, けんじ
キーワード: 強化学習、分類子システム、バケツリレーアルゴリズム、罰回避
reinforcement learning, classirier system, bucket
発行日: Mar-1998
記述: 
Supervisor:國藤 進
情報科学研究科
修士
タイトル(英語): Exploitation-Oriented Reinforcement Learning with the Aim to Avoid a penalty
著者(英語): Terada, Kenji
言語: jpn
URI: http://hdl.handle.net/10119/1129
出現コレクション:M-IS. 1997年度(H09) (Jun.1997 - Mar.1998)

このアイテムのファイル:

ファイル 記述 サイズ形式
396abstract.pdf63KbAdobe PDF見る/開く
396jabstract.pdf34KbAdobe PDF見る/開く
396paper.pdf491KbAdobe PDF見る/開く

当システムに保管されているアイテムはすべて著作権により保護されています。

 


お問合せ先 : 北陸先端科学技術大学院大学 研究推進課図書館情報係 (ir-sys[at]ml.jaist.ac.jp)