高速化と学習データの弊害

学習した位置評価をいれるとオーダリングも向上するとは思うんですが、
序盤の駒得重視の局面で、駒損より、位置評価を優先して、
たとえば8筋で後手の飛先をやぶられて速攻で詰まされたり(´・ω・`)ショボーン
これって王が移動すると、全体の評価値がガラっと変わるので、場合によっては
歩損を上回ってるんだと思う。


はじめはバグかと思ったんですが、学習データを読まないと、8筋をきちんと守ります。
とりあえず学習データは使わずに、高速化の方向を工夫してみました。
序盤では40万nps出るようになったので、反復進化がわりと回るようになりました。
BonanzaはreCapture、one replyを0.5手延長してるようですが、
延長すると、反復が回らないので、王手延長だけにしてます。


というわけで、YowaiGPSと1秒思考で戦わせてもうまく行けば勝てるようになりました
(以前は5秒なら時々勝てるとこまでは行きましたが、その後バグだらけになって勝てないように……)
ただ、k-shogiの最弱に苦戦してます(´・ω・`)ショボーン
最弱っていっても、yowaiGPSみたいにおかしな手を打たないので強いです。


学習データを使わないのももったいないので、1/10ぐらいに薄めて評価として足したいと思います。
あと入王とかの場合を考えて、位置評価は自前でも傾斜をかけましょう。