特徴の更新に慣性項を追加

52ステップ 50局 合計5284手 J=5774.807617 J'=1.092886
0時間18分14秒
歩   香   桂   銀   金   角   飛    と   杏   圭   全   馬    龍
 100, 360, 356, 503, 693, 733, 861, 417, 396, 479, 574, 943,1130,
 1.0/2618| 1.1/417| 1.3/392| 1.2/705|

前回更新時の集計結果を残しておいて、符号が反転したら更新幅を-1
符号がそのままなら+1
というのをやってみました。
ニューラルネットワークでも収束を早めるために前回の微分値に係数をかけて足したりしますね。


他にもいくつか特徴を追加したのもあって40stepぐらいではJ'が1になるようなりました
しかし、50局とは言え、本当に1になるとは(^^;
実際はdT(x)/dxのフィルターで、評価関数の差が大きい場合はdJ/dwが0になりますが、
J'の集計自体は T(x)の和で、
T(x)=1/(1+exp(-x/delta)ですが、
(J'のstep1ではJ'=17ぐらいから始まります)