JAIST Repository: 強化学習における危険回避行動獲得のための負の報酬伝搬法

トップページ| 北陸先端科学技術大学院大学| 附属図書館

一覧

登録利用者:

登録者ページ
利用者(E-people)

このアイテムの引用には次の識別子を使用してください: https://hdl.handle.net/10119/1129

タイトル:	強化学習における危険回避行動獲得のための負の報酬伝搬法
著者:	寺田, 賢二
著者（別表記）:	てらだ, けんじ
キーワード:	強化学習、分類子システム、バケツリレーアルゴリズム、罰回避 reinforcement learning, classirier system, bucket
発行日:	Mar-1998
記述:	Supervisor:國藤進情報科学研究科修士
タイトル（英語）:	Exploitation-Oriented Reinforcement Learning with the Aim to Avoid a penalty
著者（英語）:	Terada, Kenji
言語:	jpn
URI:	https://hdl.handle.net/10119/1129
出現コレクション:	M-IS. 1997年度(H09) (Jun.1997 - Mar.1998)

このアイテムのファイル:

当システムに保管されているアイテムはすべて著作権により保護されています。

お問合せ先 : 北陸先端科学技術大学院大学　研究推進課学術情報係 (ir-sys[at]ml.jaist.ac.jp)