GPS将棋チームでもUCT/MC将棋を実験されてました

http://d.hatena.ne.jp/tawake/20080428

UCB1-Tuned (UCT) 
1手詰関数 (MC, UCT) 
SEE が正の手を優先 (MC) 
4096手で終局しないなら評価値の正負を返す (MC) 
ノードを作る閾値が32 (UCT) 
とりあえず入れた値なので、変更の余地あり。 

渡辺竜王 vs Bonaのあの手をあっさり指してるようです。
やはり、末端まで見通した戦略までUCT/MC認識できるのは間違いないようです。
これは、終盤の探索に、なんらかの形で、組み合わせたいですね。来年の課題ということで。
このへんの流れが成果をだせば、プロ棋士との差がぐっと近づくかもしれませんね(もちろん強いソフトがやればという意味ですが)
詰めろもからめた、中終盤は、uct/mcの活用で、可能性が広がってると思います。
問題は、序盤ですね。
学習してたとしても、まったく知らない序盤をやられると厳しい。人間はあらかじめ「研究」して指してきますからねえ。
COMも「研究」できれば、人間相手にはめ手とかもできるようになるんでしょうが……