JAIST Repository >
d. 融合科学系 >
d11. 会議発表論文 >
d11-1. 会議発表論文 >

このアイテムの引用には次の識別子を使用してください: http://hdl.handle.net/10119/20017

タイトル: 着手確率を用いた人間の勝率予測の改善
著者: 小川, 竜欣
シュエ, ジュウシュエン
池田, 心
キーワード: 勝率予測
ヒューマンAIインタラクション
将棋
Win Rate Prediction
Human-AI Interaction
Shogi
発行日: 2024-11-15
出版者: Institute of Electrical and Electronics Engineers (IEEE)
誌名: ゲームプログラミングワークショップ2024論文集
巻: 2024
開始ページ: 166
終了ページ: 172
抄録: 近年,強いゲームAI を指導や観戦支援に役立てる研究や,指導・観戦用のゲームAIを作る研究が進められている.指導・観戦の観点から考えると,強いゲームAIにとっての最善手だけではなく,人間プレイヤがどのような手を指しそうなのか,その場合の人間プレイヤにとっての勝率がいくらなのかを知ることができれば有益である.強いゲームAI は主にAI 自身の勝利を目標に学習しているため,人間の指し手・予測勝率を正確に予測できるとは限らない.人間の指し手を予測する研究は盛んに行われている一方で,人間の勝率を予測する研究には残された課題が多い.本研究では将棋を対象に,既存のAlphaZeroのような強化学習手法や教師あり学習手法の人間の勝率予測性能を調べる.そのうえで,着手確率分布を組み合わせることで,人間にとって良さそうに見える手の勝率を高めに,思いつきにくい手の勝率を低めに重みづけて勝率を予測する手法を提案する.実験の結果,提案モデルは既存モデルに比べて,より高精度で勝率を予測できることが分かった.In recent years, research has been progressing in utilizing strong game AIs for teaching human players or supporting spectators, as well as in developing game AIs specifically for teaching or spectating purposes. From the perspective of teaching or spectating, it would be beneficial not only to know the optimal moves of strong game AIs but also to understand what moves human players are likely to make and what their win rates would be in such cases. Since strong game AIs are mainly trained with the objective of maximizing their own win rates, they may not necessarily be able to accurately predict human moves or the win rates for human players. While much research has been conducted on predicting human moves, there remain many challenges in predicting human win rates. In this study, we target Shogi and investigate the performance of existing reinforcement learning methods, like AlphaZero, as well as supervised learning methods in predicting human win rates. Furthermore, we propose a method that combines move probability distributions to weight the win rates, assigning higher weights to moves that seem good from human perspectives and lower weights to moves that are harder to come up with. Experimental results show that the proposed model can predict win rates with higher accuracy compared to existing models.
Rights: 社団法人 情報処理学会, 小川 竜欣, シュエ ジュウシュエン, 池田 心, ゲームプログラミングワークショップ2024論文集, 2024, 166-172. ここに掲載した著作物の利用に関する注意 本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。Notice for the use of this material: The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan.
URI: http://hdl.handle.net/10119/20017
資料タイプ: publisher
出現コレクション:d11-1. 会議発表論文 (Conference Papers)

このアイテムのファイル:

ファイル 記述 サイズ形式
T-IKEDA-K-0930-6.pdf527KbAdobe PDF見る/開く

当システムに保管されているアイテムはすべて著作権により保護されています。

 


お問合せ先 : 北陸先端科学技術大学院大学 研究推進課図書館情報係 (ir-sys[at]ml.jaist.ac.jp)