GA将!さんのTD学習がけっこう上手く行ってきてる様子

http://d.hatena.ne.jp/streakeagle/20090709/1247129745

183-0-188で勝率49.3の95%信頼区間が44.1〜54.5。
 ようやく強くなってきましたね。

SSP相手に5割まで達している様子。
今日、ちょっと読んだ農工大の人のTDleaf(λ)のスライドには
chessでのTDleafが紹介してあって、自己対戦でのRの上昇より
他のエンジンと対戦させたほうが強くなる割合が良かったようでした。


bona411評価関数をつんでもBona本家とはR500ぐらい離れていて、
一方で、bona411評価関数をつんだおかげのR上昇は250ぐらいなので、
(探索自体がかなり向上しているので実際はR150ぐらいしか差が無いかもしれない)
むしろ差があるのは「探索力」なんですよね
探索が強力なエンジンがTD学習をすれば、さらに強くなる余地があるなら、
決勝クラスこそ、ちょっとやってみてもいいんじゃないかと思います