やねうらおさん経由でSlashdotにも張られてました

/.は技術的に濃い人が多いので、議論がたいへん面白く参考になりました。
おそらくゲーム理論を専門にしない研究者なんかも議論に参加してる感じで、違う視点の考え方が勉強になります。




http://slashdot.jp/comments.pl?sid=395375&threshold=-1&commentsort=3&mode=thread&cid=1321052
ここのトピックなんかも面白いです。


今回、MoGoが勝ったのが9路だったことで、

広さの大小以前の問題として、そもそも別ゲームですよ。これらは。

碁を打つときは将来の攻め合いやヨセまで想定して布石の1路の違いにも気を払って考えるんですが、
大抵のプロ棋士にとって9路なんて真面目に勉強するもんじゃないから、定石も変化も真剣には研究していないと思います。
なので、案外13路盤くらいでもコンピュータが勝てちゃったりするような気もしなくもないです

9路はプロも勉強してないから、負けたんじゃないかって意見です。
他のトピックスでも、「プロにとって囲碁とは19路であって、9路じゃない」「タイトルが囲碁なのはおかしい」といった書き込みもありました。


次は、別の見方のコメント

コンピュータ囲碁で9路盤がまじめに研究されているならご指摘の通りでしょうが、実際のところコンピュータ囲碁界で9路盤ってどの程度研究の対象になってるんでしょうか?

コンピュータ将棋では「駒落ちはまじめに研究している人が少ないので、大抵駒落ちになると平手よりも弱くなる」なんて話 [mycom.co.jp]がありますが。

COM将棋で、駒落ちを研究している人が少ないってのは確かにそうですね。COM囲碁は19路やる前にまず9路でしょうから、9路をまじめに取り組んでないってのは無いはずですね。
将棋で55将棋はやってない人も多いので、将棋ではそうかも



これに対して、囲碁が強い人が反論です。

囲碁についてどれぐらいご存知ですか?ぼくは下手(一番強かった時はアマ3段ぐらい)ですが,9路も19路も共通しているように思います.9路盤の考えられる範囲を含んでいる19路でいろんな攻め合いやヨセを考えるからこそ,当然9路も強いはずだと思います.

要するに、9路が基本で、9路の強さを利用して19路を打っている。19路が強いなら9路も強いということですね


別の囲碁の強い人が裏付けます

その通りです。
私もプロに比べてはるかに弱い、アマ6段(県代表1回)ですが。
9路も共通要素は多く、得意不得意はあるでしょうが
プロならば相当強いです。

MoGoかCrazyStoneか忘れましたが、たしか19路の論文で、19路の場合部分的に9路に分割して、その結果を集計して全体の評価とする
みたいな手法を読んだ覚えがあります。9路と19路を同じ方法で探索しているわけではない無いだろうと思います。
組合せゲーム理論とかもありますが、あのへんの考え方ってモンテカルロに適用できないんですかねえ?(できるならやってるんでしょうけど)


たしかに9路は19路の基本かもしれませんが、人間の凄い所は、9路の経験を19路で使える所ですね。抽象化と一般化能力のすごさです。
将棋でも定跡の部分一致とかの研究(きのあさんとか)がありますが、一駒動くと全然違う局面になる場合もあるので、知識の部分適用は、難問です。

  • モンテカルロでは3x3のパターンを利用して、指し手の確率を変化させている
  • 将棋でも、部分パターンとn-gram指し手マクロや、部分パターンと指し手の実現確率など、部分パターンとの合わせ技手法がある
  • 棚瀬将棋は、金銀王の部分ハッシュを序盤の囲い評価に利用している
  • 詰め部分木探索も、知識の部分適用ですね?
  • N-Gram指し手マクロは、ポジショナル(空間)ではなく、時系列の部分知識適用?


議論が対立します

いや、論点違うでしょ。
相当じゃ意味が無いの。人間が人生かけて磨き上げたものをコンピュータが超えられるかどうか、って話なんだから
9路が19路と同じように研究し尽くされてなければ、比較対象として不適当なわけよ。
得手不得手があるって言ってる時点で、もう同列には語れないって。

たとえ9路が19路の基本であっても、9路を研究していないんだったら、負けても仕方ないでしょ
ってことで、初めの問題提起から反論です


最終的に、どちらの議論もオカシイという話に

正直、あんたらどっちも分かってないね。
囲碁も将棋も、終盤になればなるほどコンピュータが強い。囲碁なら、一手打つごとに場合の数が減るわけだし、将棋にしても、読むべき手がどんどん限られてくる。これでコンピュータの得意な、しらみつぶし的な読みが優勢になり、最後は(ほぼ)間違えることはない。
9路盤で打つということは、ある意味、ほぼ最初から最終盤を戦うということであるから、かなり人間が不利。まあ、負けるのもしょうがないともいえるが、やっぱプロが負けちゃいかんな。19路盤はしばらく安泰だろうけど。


問題提起の構造としては
 9路は研究されていない→負けても仕方ない
 9路は19路の基本で、プロは9路も相当強い。
 9路は(19路と比較して)冒頭から終盤。研究うんぬんじゃなくて、CPU有利なの。


研究を「ポジショナル」な有利さと考えると、将棋と比べて、囲碁はつねに「ポジショナル」な感じがします(^^;
ただ、9路は盤が狭いので、終端までが近く、モンテカルロシミュレーションでの精度が高まるので有利はあります。
AlphaBeta探索だと、駒の取り合いみたいなタクティカルな評価は良いと思うのですが、
曖昧模糊なポジショナルな評価は、1歩づつ確実に進めない。
それは、かなり先まで見通した千里眼のような羅針盤がないといけない(=確実な評価関数)
評価関数を使わずに終端まで読んでしまうモンテカルロは、曖昧模糊な状態からの前進には向いているんだろうと思います。


ただ、ポジショナルって考えた場合、モンテカルロは、「石をばらまく」傾向があるようで、人間の感覚とはだいぶ違うようです
私自身が、囲碁がぜんぜん指せないので、むちゃくちゃな方向で考えてる気もしますが……


あと、将棋で駒落ちがCPUが苦手なのは、駒を落とした方は、位取りとかポジショナルな戦略で攻めてくるから、
それをCPUに理解させるのが苦手だからなんでしょうね。
でも、駒を落としてもらった方は、ひたすら駒得で撃破すればいいんでしょうけど、相手の思考を予測するって面で、不利になる。


あと、「しらみつぶし」という言い方が、AlphaBetaとモンテカルロだと、ニュアンスがだいぶ違うと思います。
結局、探索空間が10^100ぐらいあったとして、1ステップの10のうち、確実に最善手を選んで、1^100の一本の最善手の線を見つけ出すのがAlphaBetaとして、
モンテカルロは、1playoutが1^100だけど、それはランダムに選んだだけです。


モンテカルロがしらみつぶしと言えるためには、10^100をすべて通るだけのPlayoutが実行されないといけないけど、そんなことは時間的に不可能。
alphabetaがしらみつぶしなのも、浅い探索深さの間だけで、しかも不正確な評価関数の結果で評価しているので、しらみつぶしでも完全な答が得られる保証はない。


あと、uctもあるから話がややこしくなりますね
http://usapyon.cocolog-nifty.com/shogi/2008/03/post_4c88.html

たとえば、あるノードで、次にある手を打たれたら「勝ちはない」のなら、そのノードの勝率は完全に0にしてしまうとか。
…全然理論的な裏づけはないんですが(苦笑)。

うさ親さんが、uctにもMinMaxの考えた方をもっと入れられるんでは? と考えてる話が興味深かったです


要するに、相手にOR探索的に「必勝の手」があるなら、そのノードはもう勝てない=勝率0にしてしまおう(βカット)
って感じですかね。
相手が、その最善手に気づいて、必ず打ってくるって仮定の下ですが
必勝の手があるのに、それを打たずに、他の手を打った場合の可能性も含めてシミュレーションしても、精度のコストパフォーマンスが悪いですよね。
これって、むしろ、コンピュータ将棋のモンテカルロ化に有効かもしれません。


uctってMinMax探索だけど、alphaBeta探索じゃないですね
GPW2007でその手の研究あったかも。ちょっと読み返すかな?


いかん、ちょっとエントリーが長くなり過ぎた(汗