やねうらおさん経由でSlashdotにも張られてました
/.は技術的に濃い人が多いので、議論がたいへん面白く参考になりました。
おそらくゲーム理論を専門にしない研究者なんかも議論に参加してる感じで、違う視点の考え方が勉強になります。
http://slashdot.jp/comments.pl?sid=395375&threshold=-1&commentsort=3&mode=thread&cid=1321052
ここのトピックなんかも面白いです。
今回、MoGoが勝ったのが9路だったことで、
広さの大小以前の問題として、そもそも別ゲームですよ。これらは。 碁を打つときは将来の攻め合いやヨセまで想定して布石の1路の違いにも気を払って考えるんですが、 大抵のプロ棋士にとって9路なんて真面目に勉強するもんじゃないから、定石も変化も真剣には研究していないと思います。 なので、案外13路盤くらいでもコンピュータが勝てちゃったりするような気もしなくもないです
9路はプロも勉強してないから、負けたんじゃないかって意見です。
他のトピックスでも、「プロにとって囲碁とは19路であって、9路じゃない」「タイトルが囲碁なのはおかしい」といった書き込みもありました。
次は、別の見方のコメント
コンピュータ囲碁で9路盤がまじめに研究されているならご指摘の通りでしょうが、実際のところコンピュータ囲碁界で9路盤ってどの程度研究の対象になってるんでしょうか? コンピュータ将棋では「駒落ちはまじめに研究している人が少ないので、大抵駒落ちになると平手よりも弱くなる」なんて話 [mycom.co.jp]がありますが。
COM将棋で、駒落ちを研究している人が少ないってのは確かにそうですね。COM囲碁は19路やる前にまず9路でしょうから、9路をまじめに取り組んでないってのは無いはずですね。
将棋で55将棋はやってない人も多いので、将棋ではそうかも
これに対して、囲碁が強い人が反論です。
囲碁についてどれぐらいご存知ですか?ぼくは下手(一番強かった時はアマ3段ぐらい)ですが,9路も19路も共通しているように思います.9路盤の考えられる範囲を含んでいる19路でいろんな攻め合いやヨセを考えるからこそ,当然9路も強いはずだと思います.
要するに、9路が基本で、9路の強さを利用して19路を打っている。19路が強いなら9路も強いということですね
別の囲碁の強い人が裏付けます
その通りです。 私もプロに比べてはるかに弱い、アマ6段(県代表1回)ですが。 9路も共通要素は多く、得意不得意はあるでしょうが プロならば相当強いです。
MoGoかCrazyStoneか忘れましたが、たしか19路の論文で、19路の場合部分的に9路に分割して、その結果を集計して全体の評価とする
みたいな手法を読んだ覚えがあります。9路と19路を同じ方法で探索しているわけではない無いだろうと思います。
組合せゲーム理論とかもありますが、あのへんの考え方ってモンテカルロに適用できないんですかねえ?(できるならやってるんでしょうけど)
たしかに9路は19路の基本かもしれませんが、人間の凄い所は、9路の経験を19路で使える所ですね。抽象化と一般化能力のすごさです。
将棋でも定跡の部分一致とかの研究(きのあさんとか)がありますが、一駒動くと全然違う局面になる場合もあるので、知識の部分適用は、難問です。
- モンテカルロでは3x3のパターンを利用して、指し手の確率を変化させている
- 将棋でも、部分パターンとn-gram指し手マクロや、部分パターンと指し手の実現確率など、部分パターンとの合わせ技手法がある
- 棚瀬将棋は、金銀王の部分ハッシュを序盤の囲い評価に利用している
- 詰め部分木探索も、知識の部分適用ですね?
- N-Gram指し手マクロは、ポジショナル(空間)ではなく、時系列の部分知識適用?
議論が対立します
いや、論点違うでしょ。 相当じゃ意味が無いの。人間が人生かけて磨き上げたものをコンピュータが超えられるかどうか、って話なんだから 9路が19路と同じように研究し尽くされてなければ、比較対象として不適当なわけよ。 得手不得手があるって言ってる時点で、もう同列には語れないって。
たとえ9路が19路の基本であっても、9路を研究していないんだったら、負けても仕方ないでしょ
ってことで、初めの問題提起から反論です
最終的に、どちらの議論もオカシイという話に
正直、あんたらどっちも分かってないね。 囲碁も将棋も、終盤になればなるほどコンピュータが強い。囲碁なら、一手打つごとに場合の数が減るわけだし、将棋にしても、読むべき手がどんどん限られてくる。これでコンピュータの得意な、しらみつぶし的な読みが優勢になり、最後は(ほぼ)間違えることはない。 9路盤で打つということは、ある意味、ほぼ最初から最終盤を戦うということであるから、かなり人間が不利。まあ、負けるのもしょうがないともいえるが、やっぱプロが負けちゃいかんな。19路盤はしばらく安泰だろうけど。
問題提起の構造としては
9路は研究されていない→負けても仕方ない
9路は19路の基本で、プロは9路も相当強い。
9路は(19路と比較して)冒頭から終盤。研究うんぬんじゃなくて、CPU有利なの。
研究を「ポジショナル」な有利さと考えると、将棋と比べて、囲碁はつねに「ポジショナル」な感じがします(^^;
ただ、9路は盤が狭いので、終端までが近く、モンテカルロシミュレーションでの精度が高まるので有利はあります。
AlphaBeta探索だと、駒の取り合いみたいなタクティカルな評価は良いと思うのですが、
曖昧模糊なポジショナルな評価は、1歩づつ確実に進めない。
それは、かなり先まで見通した千里眼のような羅針盤がないといけない(=確実な評価関数)
評価関数を使わずに終端まで読んでしまうモンテカルロは、曖昧模糊な状態からの前進には向いているんだろうと思います。
ただ、ポジショナルって考えた場合、モンテカルロは、「石をばらまく」傾向があるようで、人間の感覚とはだいぶ違うようです
私自身が、囲碁がぜんぜん指せないので、むちゃくちゃな方向で考えてる気もしますが……
あと、将棋で駒落ちがCPUが苦手なのは、駒を落とした方は、位取りとかポジショナルな戦略で攻めてくるから、
それをCPUに理解させるのが苦手だからなんでしょうね。
でも、駒を落としてもらった方は、ひたすら駒得で撃破すればいいんでしょうけど、相手の思考を予測するって面で、不利になる。
あと、「しらみつぶし」という言い方が、AlphaBetaとモンテカルロだと、ニュアンスがだいぶ違うと思います。
結局、探索空間が10^100ぐらいあったとして、1ステップの10のうち、確実に最善手を選んで、1^100の一本の最善手の線を見つけ出すのがAlphaBetaとして、
モンテカルロは、1playoutが1^100だけど、それはランダムに選んだだけです。
モンテカルロがしらみつぶしと言えるためには、10^100をすべて通るだけのPlayoutが実行されないといけないけど、そんなことは時間的に不可能。
alphabetaがしらみつぶしなのも、浅い探索深さの間だけで、しかも不正確な評価関数の結果で評価しているので、しらみつぶしでも完全な答が得られる保証はない。
あと、uctもあるから話がややこしくなりますね
http://usapyon.cocolog-nifty.com/shogi/2008/03/post_4c88.html
たとえば、あるノードで、次にある手を打たれたら「勝ちはない」のなら、そのノードの勝率は完全に0にしてしまうとか。 …全然理論的な裏づけはないんですが(苦笑)。
うさ親さんが、uctにもMinMaxの考えた方をもっと入れられるんでは? と考えてる話が興味深かったです
要するに、相手にOR探索的に「必勝の手」があるなら、そのノードはもう勝てない=勝率0にしてしまおう(βカット)
って感じですかね。
相手が、その最善手に気づいて、必ず打ってくるって仮定の下ですが
必勝の手があるのに、それを打たずに、他の手を打った場合の可能性も含めてシミュレーションしても、精度のコストパフォーマンスが悪いですよね。
これって、むしろ、コンピュータ将棋のモンテカルロ化に有効かもしれません。
uctってMinMax探索だけど、alphaBeta探索じゃないですね
GPW2007でその手の研究あったかも。ちょっと読み返すかな?
いかん、ちょっとエントリーが長くなり過ぎた(汗