JAIST Repository >
人間相手のゲーム実験における時間と場所の制約を緩和するアプリの検討とHanabiでの試行
ゲームの展開に過度に影響されないプレイヤ強さの推定方法
着手確率を用いた人間の勝率予測の改善
Optimal execution strategy using Deep Q-Network with heuristics policy
Using Reinforcement Learning to Generate Levels of Super Mario Bros. with Quality and Diversity