位置評価の学習
手動の評価関数に、学習位置評価を加えるという消極的な学習採用でやっています。
学術的にはすべて学習にするのが良いでしょうが、要は強くなればいいのだし。
ペナルティをかなり高めにしているので、駒損の危険もそんなにないようです(あるようならさらに強めるし)
学習に使ってない棋譜を利用して一致度を調べると
35639 [400-100] time= 0時間12分27秒 J=205147 J'=5.76 4.96/41[5.2](28%) 5.46/75[14.9](38%) 6.37/100[21.4](37%) 7.39/118[11.5](39%)
ちゃんとJが下がってるので、良しとしましょう。
手動で調整してるときはJ'が8を切るのがやっとでしたが、あっさり5点台(^^;
学習には2ch棋譜のプロ棋譜。一致度は24の高段の棋譜を利用している。
だいたい、大駒の移動可能数とかそういうのは手動で作れる程度の評価だし
(評価と評価をどのぐらいの割合で足すかとかは難しいにせよ)
むしろ、王と隣接する味方駒とさらに隣接する味方駒とか、手動で位置評価を作るのが難しいような
ところに学習の結果を入れてみようと思います。