JAIST Repository >
d. 融合科学系 >
d11. 会議発表論文 >
d11-1. 会議発表論文 >

このアイテムの引用には次の識別子を使用してください: http://hdl.handle.net/10119/18234

タイトル: 対局状況をより正確に表現するための盤面評価値
著者: 小川, 竜欣
池田, 心
キーワード: コンピュータ将棋
Computer Shogi
発行日: 2021-11-06
出版者: 情報処理学会
誌名: ゲームプログラミングワークショップ2021論文集
巻: 2021
開始ページ: 28
終了ページ: 33
抄録: ゲームAI は将棋,囲碁,チェスなどのボードゲームで人間よりも強くなったが,人間を楽しませるという点から見ると,残された課題は多い.トッププレイヤに勝てるようなゲームAI をそのまま対局に使用すると人間には理解できない高度な手を示され,探索に手を加えると人間では考えられないミスが発生してしまう.また,最近ではプロ棋士の対局で局面の評価値が示されることも多いが,人間プレイヤの実感または実際と乖離した評価値が示されることもある.本稿では,盤面から勝率を予測する教師あり学習を行う際に,棋力も入力に含めることで,より人間らしい局面の評価を目指す.また,推定した勝率の性能を確かめるため,指し継ぎによる評価を行った.指し継ぎには,人間的な評価項目を採用している技巧2 を用いた.探索の深さを制限した弱いAI による指し継ぎの勝敗は,我々のモデルの予測勝率のほうが,強いAI の予測勝率よりも近かった.また,同一局面で入力レートが変わる場合に予測勝率が大きく異なる局面やほとんど等しい局面をサンプリングして,局面の解釈を行った.その結果,このサンプリング方法で逆転が起こりやすい局面や起こりにくい局面をある程度抽出することができた.:Game AI has become stronger than humans in board games such as Shogi, Go, and chess. However, in terms of entertaining humans, there are still many issues to be solved. If a game AI that can beat top players is used as is, it will show advanced moves that humans cannot understand. If we weaken the ability to search for the game AI, it will make mistakes that humans cannot imagine. Recently, evaluation values of professional players’ games are shown. However, the evaluation values sometimes deviate from the human player’s feelings or reality. In this paper, we aim for a more human-like evaluation of the game by including the player’s ability as an input in the supervised learning process to predict the winning percentage from the position. To verify the performance of the estimated probability of winning, we evaluate the probability by weak Shogi AI simulating. For the evaluation, we used Gikou 2, which uses human-like evaluation items. The predicted win rate of our model was closer to the predicted win rate of the strong AI than to that of the weak AI with limited search depth. We also sampled positions in which the predicted winning percentage differed greatly or were almost equal when the input rate changed in the same positions and then interpreted the positions. As a result, we were able to extract the positions where comebacks are likely to occur and those where they are unlikely to occur to some extent using this sampling way.
Rights: 社団法人 情報処理学会, 小川 竜欣, 池田 心,ゲームプログラミングワークショップ2021論文集, 2021, 28-33. ここに掲載した著作物の利用に関する注意 本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。Notice for the use of this material: The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan.
URI: http://hdl.handle.net/10119/18234
資料タイプ: publisher
出現コレクション:d11-1. 会議発表論文 (Conference Papers)

このアイテムのファイル:

ファイル 記述 サイズ形式
I-IKEDA-K0405-9.pdf6640KbAdobe PDF見る/開く

当システムに保管されているアイテムはすべて著作権により保護されています。

 


お問い合わせ先 : 北陸先端科学技術大学院大学 研究推進課図書館情報係