やねうらおさん経由でSlashdotにも張られてました

/.は技術的に濃い人が多いので、議論がたいへん面白く参考になりました。
おそらくゲーム理論を専門にしない研究者なんかも議論に参加してる感じで、違う視点の考え方が勉強になります。

http://slashdot.jp/comments.pl?sid=395375&threshold=-1&commentsort=3&mode=thread&cid=1321052
ここのトピックなんかも面白いです。

今回、MoGoが勝ったのが9路だったことで、

広さの大小以前の問題として、そもそも別ゲームですよ。これらは。

碁を打つときは将来の攻め合いやヨセまで想定して布石の1路の違いにも気を払って考えるんですが、
大抵のプロ棋士にとって9路なんて真面目に勉強するもんじゃないから、定石も変化も真剣には研究していないと思います。
なので、案外13路盤くらいでもコンピュータが勝てちゃったりするような気もしなくもないです

9路はプロも勉強してないから、負けたんじゃないかって意見です。
他のトピックスでも、「プロにとって囲碁とは19路であって、９路じゃない」「タイトルが囲碁なのはおかしい」といった書き込みもありました。

次は、別の見方のコメント

コンピュータ囲碁で9路盤がまじめに研究されているならご指摘の通りでしょうが、実際のところコンピュータ囲碁界で9路盤ってどの程度研究の対象になってるんでしょうか？

コンピュータ将棋では「駒落ちはまじめに研究している人が少ないので、大抵駒落ちになると平手よりも弱くなる」なんて話 [mycom.co.jp]がありますが。

COM将棋で、駒落ちを研究している人が少ないってのは確かにそうですね。COM囲碁は19路やる前にまず9路でしょうから、9路をまじめに取り組んでないってのは無いはずですね。
将棋で55将棋はやってない人も多いので、将棋ではそうかも

これに対して、囲碁が強い人が反論です。

囲碁についてどれぐらいご存知ですか？ぼくは下手（一番強かった時はアマ３段ぐらい）ですが，9路も19路も共通しているように思います．9路盤の考えられる範囲を含んでいる19路でいろんな攻め合いやヨセを考えるからこそ，当然9路も強いはずだと思います．

要するに、9路が基本で、9路の強さを利用して19路を打っている。19路が強いなら9路も強いということですね

別の囲碁の強い人が裏付けます

その通りです。
私もプロに比べてはるかに弱い、アマ6段（県代表1回）ですが。
9路も共通要素は多く、得意不得意はあるでしょうが
プロならば相当強いです。

MoGoかCrazyStoneか忘れましたが、たしか19路の論文で、19路の場合部分的に9路に分割して、その結果を集計して全体の評価とする
みたいな手法を読んだ覚えがあります。9路と19路を同じ方法で探索しているわけではない無いだろうと思います。
組合せゲーム理論とかもありますが、あのへんの考え方ってモンテカルロに適用できないんですかねえ？（できるならやってるんでしょうけど）

たしかに9路は19路の基本かもしれませんが、人間の凄い所は、9路の経験を19路で使える所ですね。抽象化と一般化能力のすごさです。
将棋でも定跡の部分一致とかの研究（きのあさんとか）がありますが、一駒動くと全然違う局面になる場合もあるので、知識の部分適用は、難問です。

モンテカルロでは3x3のパターンを利用して、指し手の確率を変化させている
将棋でも、部分パターンとn-gram指し手マクロや、部分パターンと指し手の実現確率など、部分パターンとの合わせ技手法がある
棚瀬将棋は、金銀王の部分ハッシュを序盤の囲い評価に利用している
詰め部分木探索も、知識の部分適用ですね？
N-Gram指し手マクロは、ポジショナル（空間）ではなく、時系列の部分知識適用？

議論が対立します

いや、論点違うでしょ。
相当じゃ意味が無いの。人間が人生かけて磨き上げたものをコンピュータが超えられるかどうか、って話なんだから
9路が19路と同じように研究し尽くされてなければ、比較対象として不適当なわけよ。
得手不得手があるって言ってる時点で、もう同列には語れないって。

たとえ9路が19路の基本であっても、9路を研究していないんだったら、負けても仕方ないでしょ
ってことで、初めの問題提起から反論です

最終的に、どちらの議論もオカシイという話に

正直、あんたらどっちも分かってないね。
囲碁も将棋も、終盤になればなるほどコンピュータが強い。囲碁なら、一手打つごとに場合の数が減るわけだし、将棋にしても、読むべき手がどんどん限られてくる。これでコンピュータの得意な、しらみつぶし的な読みが優勢になり、最後は（ほぼ）間違えることはない。
9路盤で打つということは、ある意味、ほぼ最初から最終盤を戦うということであるから、かなり人間が不利。まあ、負けるのもしょうがないともいえるが、やっぱプロが負けちゃいかんな。19路盤はしばらく安泰だろうけど。

問題提起の構造としては
　9路は研究されていない→負けても仕方ない
　9路は19路の基本で、プロは9路も相当強い。
　9路は（19路と比較して）冒頭から終盤。研究うんぬんじゃなくて、CPU有利なの。

研究を「ポジショナル」な有利さと考えると、将棋と比べて、囲碁はつねに「ポジショナル」な感じがします(^^;
ただ、９路は盤が狭いので、終端までが近く、モンテカルロシミュレーションでの精度が高まるので有利はあります。
AlphaBeta探索だと、駒の取り合いみたいなタクティカルな評価は良いと思うのですが、
曖昧模糊なポジショナルな評価は、1歩づつ確実に進めない。
それは、かなり先まで見通した千里眼のような羅針盤がないといけない（＝確実な評価関数）
評価関数を使わずに終端まで読んでしまうモンテカルロは、曖昧模糊な状態からの前進には向いているんだろうと思います。

ただ、ポジショナルって考えた場合、モンテカルロは、「石をばらまく」傾向があるようで、人間の感覚とはだいぶ違うようです
私自身が、囲碁がぜんぜん指せないので、むちゃくちゃな方向で考えてる気もしますが……

あと、将棋で駒落ちがCPUが苦手なのは、駒を落とした方は、位取りとかポジショナルな戦略で攻めてくるから、
それをCPUに理解させるのが苦手だからなんでしょうね。
でも、駒を落としてもらった方は、ひたすら駒得で撃破すればいいんでしょうけど、相手の思考を予測するって面で、不利になる。

あと、「しらみつぶし」という言い方が、AlphaBetaとモンテカルロだと、ニュアンスがだいぶ違うと思います。
結局、探索空間が10^100ぐらいあったとして、1ステップの10のうち、確実に最善手を選んで、1^100の一本の最善手の線を見つけ出すのがAlphaBetaとして、
モンテカルロは、１playoutが1^100だけど、それはランダムに選んだだけです。

モンテカルロがしらみつぶしと言えるためには、10^100をすべて通るだけのPlayoutが実行されないといけないけど、そんなことは時間的に不可能。
alphabetaがしらみつぶしなのも、浅い探索深さの間だけで、しかも不正確な評価関数の結果で評価しているので、しらみつぶしでも完全な答が得られる保証はない。

あと、uctもあるから話がややこしくなりますね
http://usapyon.cocolog-nifty.com/shogi/2008/03/post_4c88.html

たとえば、あるノードで、次にある手を打たれたら「勝ちはない」のなら、そのノードの勝率は完全に０にしてしまうとか。
…全然理論的な裏づけはないんですが（苦笑）。

うさ親さんが、uctにもMinMaxの考えた方をもっと入れられるんでは？　と考えてる話が興味深かったです

要するに、相手にOR探索的に「必勝の手」があるなら、そのノードはもう勝てない＝勝率０にしてしまおう（βカット）
って感じですかね。
相手が、その最善手に気づいて、必ず打ってくるって仮定の下ですが
必勝の手があるのに、それを打たずに、他の手を打った場合の可能性も含めてシミュレーションしても、精度のコストパフォーマンスが悪いですよね。
これって、むしろ、コンピュータ将棋のモンテカルロ化に有効かもしれません。

uctってMinMax探索だけど、alphaBeta探索じゃないですね
GPW2007でその手の研究あったかも。ちょっと読み返すかな？

いかん、ちょっとエントリーが長くなり過ぎた（汗