単純モンテカルロ

真ん中に先に打った方が勝つ局面
1万playout

[1] アゲハマ ○0 ●0
  123456789
 1●┼┼┼┼┼┼┼┼
 2┼┼┼┼●┼┼┼┼
 3┼┼┼┼●┼┼┼┼
 4┼┼┼┼●┼┼┼┼
 5┼○○○┼○○○┼
 6┼┼┼┼●┼┼┼┼
 7┼┼┼┼●┼┼┼┼
 8┼┼┼┼●┼┼┼┼
 9┼┼┼┼┼┼┼┼┼
wVic=3982 bVic=3961
time=4.73秒

●が真ん中以外に打ったときは、勝率は同じぐらい(相手も単純ランダムなんで)


真ん中に●を打たすと

[1] アゲハマ ○0 ●0
  123456789
 1┼┼┼┼┼┼┼┼┼
 2┼┼┼┼●┼┼┼┼
 3┼┼┼┼●┼┼┼┼
 4┼┼┼┼●┼┼┼┼
 5┼○○○●○○○┼
 6┼┼┼┼●┼┼┼┼
 7┼┼┼┼●┼┼┼┼
 8┼┼┼┼●┼┼┼┼
 9┼┼┼┼┼┼┼┼┼
wVic=6755 bVic=1556
time=4.53秒

勝率が跳ね上がる。
まあ、当たり前といえば当たり前ですが……
どこに打つのが一番良いかを効率よく求めるのがUCBで、まずはその前段階ってことで
USBで最善手が求まったら、それを打って、次の手をUCBで探す。
そういうTREE探索がUCTですよね?


パスする条件はまだ動いて無いので、150手超えたらDRAW扱いにしてます。