BonanzaMethodで位置評価は諦めよう!

位置評価は頑張って取り組んでるんですが、対戦させると弱くなることばかりです(´・ω・`)ショボーン


もう諦めます!


よく考えたら、棚瀬さんの去年の自戦記には、絶対値評価をBonanzaMethodで学習させているとは書いてないです。
王の周囲の利きによる得点を、王の位置によって、学習させているってことでしょう。
実際、終盤の位置評価は、従来の手動絶対評価で十分でしょ(大槻将棋は去年は王の脅威は学習させてないと書かれていたし)

序盤は落とし穴、もしくは部分ハッシュによる評価で行きましょう。
棚瀬将棋の自戦記を読むと、王・金・銀の部分ハッシュで統計をとって評価されている様子。
しかし、実際やるとするとどうするのか?
ハッシュの値毎に出現回数をカウントして、多い物をよりプラス評価する?
実際は、エントロピーを考えて、あるハッシュからあるハッシュへ遷移した数で評価すれば、うまく行くのかもしれない。
そのへんでやってみようと思う。