JAIST Repository >
b. 情報科学研究科・情報科学系 >
b10. 学術雑誌論文等 >
b10-1. 雑誌掲載論文 >

このアイテムの引用には次の識別子を使用してください: http://hdl.handle.net/10119/12319

タイトル: 行動評価関数を用いたモンテカルロ木探索の重点化と見落としの抑制
著者: 池田, 心
ビエノ, シモン
キーワード: モンテカルロ木探索
行動評価関数
バイアス
Progressive Widening
見落とし
発行日: 2014-11-15
出版者: 情報処理学会
誌名: 情報処理学会論文誌
巻: 55
号: 11
開始ページ: 2377
終了ページ: 2388
抄録: モンテカルロ木探索は現在囲碁プログラムの主流であり,基本となるアルゴリズムにさまざまに工夫が加えられ用いられている.シミュレーション部分において,行動評価関数などを用いて良い手を高い確率で打つことは,全合法手を等確率で選ぶ場合に比べ効果的であることはよく知られる.この評価関数は木探索部分への利用も可能であり,有望な着手に探索を重点化したり,あるいはそれらのみに探索を着手限定したりといったことも行われる.本論文では,行動評価関数を木探索部分で活用する着手限定と重点化の2つの方法の効果やパラメータの影響,組合せた場合の性能を,囲碁プログラムNomitan,Fuegoを用いた実験により示す.そのうえで,着手限定で生じる“見落とし”を抑制するための3つの方法を提案し,NomitanのFuegoに対する勝率が4,000試合ずつの実験で57.7%から64.5%に向上したことを示す. : Monte-Carlo Tree Search is now the most popular method for the game of Go, and many techniques and variations are used to improve the strength. It is already known that biased Monte-Carlo simulations using a probability model containing static knowledge are more efficient than random simulations. Such probability models can be also used in the tree search policy to bias the search or limit the search to a subset of the legal moves. In this article, first we describe more precisely how static knowledge can be used to improve the tree search policy. Then, we show how to reduce the oversight mistakes caused by the limitation of the number of searched moves. We confirm experimentally the efficiency of the proposed methods, with a large number of games using our Go program Nomitan, against Fuego, an open source program. The winning ratio of our program is increased from 57.7% to 64.5% (4,000 games for each).
Rights: 社団法人 情報処理学会, 池田心, ビエノ シモン, 情報処理学会論文誌, 55(11), 2014, 2377-2388. ここに掲載した著作物の利用に関する注意: 本著作物の著作権は(社)情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。 Notice for the use of this material: The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan.
URI: http://hdl.handle.net/10119/12319
資料タイプ: publisher
出現コレクション:b10-1. 雑誌掲載論文 (Journal Articles)

このアイテムのファイル:

ファイル 記述 サイズ形式
21069.pdf1132KbAdobe PDF見る/開く

当システムに保管されているアイテムはすべて著作権により保護されています。

 


お問い合わせ先 : 北陸先端科学技術大学院大学 研究推進課図書館情報係