王の周囲の囲いを評価する特徴をやや作りこみ

王の周囲の評価を多少作りこみました。
そのぶん探索が遅くなりましたが、わりと副作用も無く動いているようです。
yowai_gps将棋相手ですが、追う手ではない感じで攻めてました。
攻めが続かずにに相手に大量に駒を渡してしまう場面も見られたので、多少パラメーター調整が必要かも。


http://www.graco.c.u-tokyo.ac.jp/~kaneko/papers/gpw04.pdf
GPS将棋チームのこの論文が面白いです。
証明数、反証数を予測する評価関数の学習を扱ったものです。


証明数は、王手をかけられた王が逃げられる手の数=詰みを証明しないといけない数
と理解してますが、


論文では、王の24近傍の攻めの利き数、受け側の利き数、配置される駒毎の得点などのいくつかの特徴の重ね合わせの重みを、
共益勾配法で学習したようです。
探索ノード数が大きいほど、予測が外れやすく、ノードが少ないと予測精度が高いという結果が出ているようです(確かにって感じ)
残念ながら、この特徴があるときに○○%みたいな結果は書いてありませんでした(^^;
載ってれば王の囲いの評価に使えるかなと思ったんですが(^^;
一般に証明数が高いほど、王は逃げる余地が多い、すなわち
証明数が少なくなる=王を追い込んでいる、とみなせるかなと思います。
すなわち、王を挟撃するとか、縛りをかける行為=証明数を減らす行為と一般化できないかなと。