JAIST Repository >
d. 融合科学系 >
d11. 会議発表論文 >
d11-1. 会議発表論文 >

このアイテムの引用には次の識別子を使用してください: http://hdl.handle.net/10119/20012

タイトル: 囲碁における人間の着手を模倣するにはKataGoのHumanSLだけで十分か?
著者: シュエ, ジュウシュエン
池田, 心
キーワード: 囲碁
KataGo HumanSL
人間らしさ
着手の模倣
Go
Human-likeness
Imitation of moves
発行日: 2024-11-15
出版者: 情報処理学会
誌名: ゲームプログラミングワークショップ2024論文集
巻: 2024
開始ページ: 80
終了ページ: 87
抄録: 人間プレイヤのゲームプレイを模倣することは,人間プレイヤを楽しませたり,教えたりする際の重要な要素の1 つである.本稿では,囲碁を対象とし,教師あり学習(Supervised Learning,SL)に基づき,大量の人間プレイヤの棋譜を用いて学習されたKataGoのHumanSLモデルについて調べる.具体的には,(1) 人間らしいゲームプレイを実現するために,教師あり学習モデルが予測した着手の選択確率分布をどのように利用すべきかを調査し,(2) HumanSLの人間らしさを評価し,(3) HumanSLの人間らしさをさらに改善する方法を提案する.(1) については,選択確率最大の着手を選ぶ方法や選択確率分布通りにサンプリングする方法がよく使われているが,我々の結果では,中間的なバージョンであるsoftmaxのほうが,望ましい棋力を達成できることが示される.(2) については,着手一致率,尤度,直前手との距離といった指標を用いる.(3) については,直前手との距離による補正を選択確率を入れる.その結果,HumanSLの人間らしさが改善されていることを確認した.Imitating human players’ gameplay is one of the important factors when entertaining or teaching human players. In this paper, we target the game of Go and investigate KataGo’s HumanSL model, which was trained using plenty of human players’ game records based on supervised learning (SL). More specifically, we (1) investigate how the probability distributions over legal moves predicted by SL models should be used to achieve human-like gameplay, (2) evaluate the human-likeness of HumanSL, and (3) propose a method to further improve the human-likeness of HumanSL. Regarding (1), researchers often select the move with the highest selection probability or sample according to the probability distribution, while we find that an intermediate version, softmax, can better achieve the desired playing strength. Regarding (2), we employ the metrics of move-matching accuracy, likelihood, and distance to the previous move. Regarding (3), we adjust the selection probability of a move based on its distance to the previous move. We confirm that the human-likeness of HumanSL is improved.
Rights: 社団法人 情報処理学会, シュエ,ジュウシュエン, 池田 心, ゲームプログラミングワークショップ2024論文集, 2024, 80-87.ここに掲載した著作物の利用に関する注意 本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。Notice for the use of this material: The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan.
URI: http://hdl.handle.net/10119/20012
資料タイプ: publisher
出現コレクション:d11-1. 会議発表論文 (Conference Papers)

このアイテムのファイル:

ファイル 記述 サイズ形式
T-IKEDA-K-0930-9.pdf405KbAdobe PDF見る/開く

当システムに保管されているアイテムはすべて著作権により保護されています。

 


お問合せ先 : 北陸先端科学技術大学院大学 研究推進課図書館情報係 (ir-sys[at]ml.jaist.ac.jp)