2006-11-15から1日間の記事一覧

局面評価の学習を目指した探索結果の最適制御2

ということで、GPW2006から帰ったその日から学習方法を研究中なのですが、 あの数式群をプログラムに落とし込むところが、まだまだできておりません。 が、言わんとすることはおぼろげながらわかってきたように思います。 会社の行きも帰りも、GPWの論文を読…

局面評価の学習を目指した探索結果の最適制御

http://www.geocities.jp/bonanza_shogi/gpw2006.pdfgpw2006でも発表スライドを保木さんがおまけとして公開されているようです。 それを読んでもらえば判りますが、futility,null move pruningなどの技術を使えば、 探索の大きさは=1/4*(2.23)^n となって、…

GPW2006について

しばらく更新が止まってましたが、ひたすら学習を研究中です。 TACOSのパターンによるN-Gram、端攻めタイミングの判定 激指の実現確率のN-Gram統計化 DF-PNとλ探索 などが興味深い発表でした。 そしてなんといっても、保木さんによるBonanzaでの評価関数の自…