単純モンテカルロ
真ん中に先に打った方が勝つ局面
1万playout
[1] アゲハマ ○0 ●0 123456789 1●┼┼┼┼┼┼┼┼ 2┼┼┼┼●┼┼┼┼ 3┼┼┼┼●┼┼┼┼ 4┼┼┼┼●┼┼┼┼ 5┼○○○┼○○○┼ 6┼┼┼┼●┼┼┼┼ 7┼┼┼┼●┼┼┼┼ 8┼┼┼┼●┼┼┼┼ 9┼┼┼┼┼┼┼┼┼ wVic=3982 bVic=3961 time=4.73秒
●が真ん中以外に打ったときは、勝率は同じぐらい(相手も単純ランダムなんで)
真ん中に●を打たすと
[1] アゲハマ ○0 ●0 123456789 1┼┼┼┼┼┼┼┼┼ 2┼┼┼┼●┼┼┼┼ 3┼┼┼┼●┼┼┼┼ 4┼┼┼┼●┼┼┼┼ 5┼○○○●○○○┼ 6┼┼┼┼●┼┼┼┼ 7┼┼┼┼●┼┼┼┼ 8┼┼┼┼●┼┼┼┼ 9┼┼┼┼┼┼┼┼┼ wVic=6755 bVic=1556 time=4.53秒
勝率が跳ね上がる。
まあ、当たり前といえば当たり前ですが……
どこに打つのが一番良いかを効率よく求めるのがUCBで、まずはその前段階ってことで
USBで最善手が求まったら、それを打って、次の手をUCBで探す。
そういうTREE探索がUCTですよね?
パスする条件はまだ動いて無いので、150手超えたらDRAW扱いにしてます。