JAIST Repository >
School of Information Science >
Articles >
Journal Articles >

Please use this identifier to cite or link to this item: http://hdl.handle.net/10119/15102

Title: 花札の「こいこい」ゲームの強化学習によるコンピュータプレイヤ
Authors: 佐藤, 直之
上原, 隆平
池田, 心
Keywords: 花札
こいこい
強化学習
方策勾配法
特徴量
Issue Date: 2017-07-08
Publisher: 情報処理学会
Magazine name: 情報処理学会研究報告. GI, 研究報告ゲーム情報学
Volume: 2017-GI-38
Number: 6
Start page: 1
End page: 7
Abstract: 花札の 「こいこい」 ゲームは交互 2 人零和不完全情報ゲームの一種で,様々な媒体で多くの人に遊ばれているが研究例が少なく,人間の上級者に匹敵する人工プレイヤが開発されたという話も聞かない.そのため我々は強化学習の方策勾配法を用いて強い 「こいこい」 プレイヤの実装を試みた.まずはゲーム知識に基づいた高級な特徴量を人間が設計し,その重み付き線形和モデルで状態行動の価値を推測して学習を行った.その結果,ランダム行動プレイヤとルールベースプレイヤを上回る強さを獲得した.さらに我々は,状態行動の価値により複雑なモデルを適用すれば更に高い性能が引き出せると考えて,その準備のための実験のみを本稿で行った.ゲームに関する低級な特徴量を設計して,それが ANN の学習を通じて適切にゲームの最終スコア予測のために利用できそうな事を確かめた.
Rights: 社団法人 情報処理学会, 佐藤 直之, 上原 隆平, 池田 心, 情報処理学会研究報告. GI, 研究報告ゲーム情報学, 2017-GI-38(6), 2017, 1-7. ここに掲載した著作物の利用に関する注意: 本著作物の著作権は(社)情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。 Notice for the use of this material: The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan.
URI: http://hdl.handle.net/10119/15102
Material Type: publisher
Appears in Collections:b10-1. 雑誌掲載論文 (Journal Articles)

Files in This Item:

File Description SizeFormat
23523.pdf2279KbAdobe PDFView/Open

All items in DSpace are protected by copyright, with all rights reserved.

 


Contact : Library Information Section, JAIST (ir-sys[at]ml.jaist.ac.jp)