モンテカルロ将棋(6) UCB1 SEEオーダリング始めました

遠見将棋さんがコメントをしてくれてました
http://d.hatena.ne.jp/yos92/20080219

ちなみに遠見(MC)ではSEEを使用しています


SEEやってるんですね。
試しにmisaki(MC)でもやってみました。
あきらかにシミュレーションの精度は良くなった感じがします。


一回試行から「△27香打(57/1) 」明らかに勝率が良いです
ただ、160playout/sec程度と、速度が10分の一に下がってしまいました orz

SEEも積み重なるとかなり時間のかかる処理になってしまうので1000po/secくらいしか出ていません.


は、速いですね(^^;
自分のSEEってバグってるんだろうか?
(それとも手のリストを1度作って使い回す方法をやってないので、それをやれば激速になるのかな?)

▼v歩
 9 8 7 6 5 4 3 2 1
---------------------------+
 馬v桂 ・ ・ ・ ・ ・v桂v王|一a
 ・ ・ ・ ・ ・ ・v金v金v香|二b
v歩 ・ ・ と ・v歩v角v銀 ・|三c
 ・ ・v歩 ・v歩 ・v歩 ・v歩|四d
 ・ ・ ・ ・ ・ ・ ・ 銀v金|五e
 ・ ・ 歩 ・ 歩 ・ 歩 飛 ・|六f
 歩 ・ 桂 ・ ・ ・ ・ ・ 歩|七g
 ・ ・ ・ ・ ・ ・ ・ 銀 香|八h
v龍 ・ ・ ・ ・ ・ 金 桂 玉|九i
---------------------------+
△ 歩五 香二 銀
qui: △27飛(-787) △37馬(-1407) △34銀(-1450) △24歩打(-1525) △24銀(-1580) △16
飛(-1652) △27歩打(-1677) △55馬(-1689) △46馬(-1794) △35銀打(-1840) △27香打(-
1871) △81馬(-1914) △14銀(-1931) △37銀打(-1964) △27銀打(-1964)

GoSimulation!
△27飛(45/1) △37馬(46/1) △34銀(45/1) △24歩打(59/1) △24銀(44/1) △16飛(48/1)
△27歩打(33/1) △55馬(44/1) △46馬(33/1) △35銀打(22/1) △27香打(57/1) △81馬(34
/1) △14銀(35/1) △37銀打(46/1) △27銀打(40/1) △64馬(44/1) △44銀打(45/1) △24
銀打(36/1) △42銀打(48/1) △73馬(35/1) △53と(33/1) △35歩(23/1) △24香打(56/1)
△16銀(32/1) △44歩打(45/1) △82馬(41/1) △41銀打(50/1) △89歩打(50/1) △52と(25
/1) △55歩(25/1) △24歩打(51/2) △27香打(52/2) △24香打(46/2) △27香打(53/3) △2
7香打(52/4) △27香打(52/5) △27香打(54/6) △27香打(52/7) △27香打(53/8) △27香打
(54/9) △27香打(53/10) △27香打(55/11) △27香打(57/12) △27香打(58/13) △27香打(
58/14) △27香打(57/15) △27香打(57/16) △27香打(58/17) △27香打(59/18) △27香打(
58/19) △27香打(59/20)
playout=5100 node=662396 mateHash=0 checkMateOne=1333 time=31.6秒


ボナンザメソッドの

学習前: J(v) = 404823.50

この学習前というのは、駒の価値は、すべて同じでやった場合ですか?
それとも、一般的な価値でやった場合ですか?
やはり、自分の探索エンジンに合わせて駒割を学習させれば、そんなにJ(v)が変わってくるんですかねえ?