学習で詰みからみの手を捨てて学習
GA将さんのコメントで
私は「軽い探索で詰みが発見出来たなら、実際の対局でも読めば分かる。だからあえて学習しない。」 って選択肢もありかな−、とか考えています。 ボナンザメソッドと強化学習では色々違うかもしれませんが…
が参考になった。読まないと解らない手は捨てるは考えていたので、
SEEでかなり駒損する手(-400)が棋譜の手は学習せず捨ててるんですが
逆に、読めば解る手を捨てるという考えがありませんでした。
読めば詰むと解る局面は読めば解るし、裏を返せば読まないと解らないと言えるかも。
あくまで、一般常識を学習させたいだけなので、
その局面がシミュレートできるようにしたいわけではないし。
詰みからみの局面を捨てると
まず初期状態でJ'がかなり下がります(学習対象が減るので学習も速くなる)
実験で400局なのでアレですが、J'自体は終盤も下がるようになってます。
今まで位置評価だけだと全然終盤が下がらなかったのに。
26ステップ 400局 合計43131手 J=526624.000000 J'=12.209872 0時間16分33秒 Objective Func=40.817720 target=12.209872 penalty=28.607847 12.8/24829|12.2/5216|13.2/4740| 9.9/8346| 歩 香 桂 銀 金 角 飛 と 杏 圭 全 馬 龍 100, 260, 286, 442, 570, 682, 836, 524, 414, 527, 547, 914,1066, ------------------- -468 -411 -342 -276 -215 +190 +32 +248 +32 1 -473 -407 -59 -275 +18 +104 -179 X +217 2 -474 -209 -95 -231 +172 +201 +32 +32 +32 3 -472 -95 -106 +27 +72 +27 +250 +249 +140 4 -73 -128 -31 -103 -28 +24 -169 -114 -217 5 -9 +5 +3 +3 +5 +4 +3 -3 -9 6 -3 +0 +3 +4 +5 +0 +2 -6 -7 7 -8 X +2 -2 +4 -5 -6 -5 -3 8 -10 -4 +5 -3 -2 -9 -5 -2 -4 9
位置評価は初期値でマニュアルである程度増減させてるので0からこうなってるわけではないけど、
重要なのは、1ステップでJ'が下がるかどうかなので、
下がれば良し
位置評価だけで下がってくれれば、かなりいいかもしれない。
あとはクローズテストで未知の棋譜でもちゃんとJ'が終盤も含めて低めの値が出れば
将棋の一般常識を獲得できたことなるのだが……
あーなんとかなってくれー(最後は神頼み)