ProbCutの卒論
http://streakeagle.blog15.fc2.com/blog-entry-579.html
どうもどうも。和文は読みやすいですねー
実際にプロ棋士の棋譜から統計処理して、検証しているのが凄いですね。
マージンの決め方とか面白かったです。棋譜によっては1000ぐらいとらないと分散しているものもあるようですね。
CHESSよりは、将棋の方が、取った手も使えるし、変動が大きいんでしょうかね。
1,2,3に場合わけされてますが、ProbCutも前向き枝狩なのは確かと思うんですよ。
そういう意味では、Bonanzaも純粋には全幅とは言えないのでは?と思います。
悪そうな手を打ち切るのも、前向き枝狩ですよね?
山下さんの掲示板での、2005年あたりのBonanza作者さんのやり取りを見ていて、興味深かったのが、
基本的に、これまでの将棋ソフトは、
- 良さそうな手を生成する。
- 良さそう手を探す
- 良さそうな手を延長する
- 評価値を更新した手を0.5手延長して、確認する(水平線効果じゃないか)
- 王手は1手延長する(水平線効果じゃないか)
という風に、零の状態から、前向きに探索するのに対して(PCが低性能な時代から出発しているので)
逆に
Bonanzaのような全幅探索がベースの場合は、前部の手が生成された状態から、
悪そうな手を見つけて、切り捨てる、探索削減の方向で考えている感じがします。(消去法)
たとえば、
>この,「実は評価値が下がる」状況は,悪そうに見えた手をもう少し深く読むと実は評価値が上がるという状況の克服よりも重大だという,
>私の知らない何かしらの根拠があるに違いないと思っておりました.
Bonanzaの作者さんのこの書き込みは、悪そうな手をカットしてたら、本当は良い手までカットしてしまってう問題の克服に悩まされている
という感じがしますが、
逆に、YSSのような、最善手を更新した手を、再延長しているのが、「なぜそんなことをしているのか?」と疑問に見えているのではないかと思いました。
これは考え方がまったく逆なので、意見がかみ合ってない感じがします。
このアプローチの差は、CSAの過去の資料集にあった「米国とヨーロッパの差」を思い出しました。