位置評価の学習

手動の評価関数に、学習位置評価を加えるという消極的な学習採用でやっています。
学術的にはすべて学習にするのが良いでしょうが、要は強くなればいいのだし。


ペナルティをかなり高めにしているので、駒損の危険もそんなにないようです(あるようならさらに強めるし)


学習に使ってない棋譜を利用して一致度を調べると

35639 [400-100] time= 0時間12分27秒 J=205147 J'=5.76
4.96/41[5.2](28%) 5.46/75[14.9](38%) 6.37/100[21.4](37%) 7.39/118[11.5](39%)

ちゃんとJが下がってるので、良しとしましょう。
手動で調整してるときはJ'が8を切るのがやっとでしたが、あっさり5点台(^^;
学習には2ch棋譜のプロ棋譜。一致度は24の高段の棋譜を利用している。


だいたい、大駒の移動可能数とかそういうのは手動で作れる程度の評価だし
(評価と評価をどのぐらいの割合で足すかとかは難しいにせよ)


むしろ、王と隣接する味方駒とさらに隣接する味方駒とか、手動で位置評価を作るのが難しいような
ところに学習の結果を入れてみようと思います。