学習で詰みからみの手を捨てて学習

GA将さんのコメントで

私は「軽い探索で詰みが発見出来たなら、実際の対局でも読めば分かる。だからあえて学習しない。」
って選択肢もありかな−、とか考えています。
ボナンザメソッドと強化学習では色々違うかもしれませんが…

が参考になった。読まないと解らない手は捨てるは考えていたので、
SEEでかなり駒損する手(-400)が棋譜の手は学習せず捨ててるんですが
逆に、読めば解る手を捨てるという考えがありませんでした。
読めば詰むと解る局面は読めば解るし、裏を返せば読まないと解らないと言えるかも。
あくまで、一般常識を学習させたいだけなので、
その局面がシミュレートできるようにしたいわけではないし。


詰みからみの局面を捨てると
まず初期状態でJ'がかなり下がります(学習対象が減るので学習も速くなる)
実験で400局なのでアレですが、J'自体は終盤も下がるようになってます。
今まで位置評価だけだと全然終盤が下がらなかったのに。

26ステップ 400局 合計43131手 J=526624.000000 J'=12.209872 0時間16分33秒
 Objective Func=40.817720 target=12.209872 penalty=28.607847
12.8/24829|12.2/5216|13.2/4740| 9.9/8346|
  歩   香   桂   銀   金   角   飛   と   杏   圭   全   馬   龍
 100, 260, 286, 442, 570, 682, 836, 524, 414, 527, 547, 914,1066,
-------------------
-468 -411 -342 -276 -215 +190  +32 +248  +32  1
-473 -407  -59 -275  +18 +104 -179    X +217  2
-474 -209  -95 -231 +172 +201  +32  +32  +32  3
-472  -95 -106  +27  +72  +27 +250 +249 +140  4
 -73 -128  -31 -103  -28  +24 -169 -114 -217  5
  -9   +5   +3   +3   +5   +4   +3   -3   -9  6
  -3   +0   +3   +4   +5   +0   +2   -6   -7  7
  -8    X   +2   -2   +4   -5   -6   -5   -3  8
 -10   -4   +5   -3   -2   -9   -5   -2   -4  9

位置評価は初期値でマニュアルである程度増減させてるので0からこうなってるわけではないけど、
重要なのは、1ステップでJ'が下がるかどうかなので、
下がれば良し


位置評価だけで下がってくれれば、かなりいいかもしれない。
あとはクローズテストで未知の棋譜でもちゃんとJ'が終盤も含めて低めの値が出れば
将棋の一般常識を獲得できたことなるのだが……
あーなんとかなってくれー(最後は神頼み)