親子モデルと兄弟モデル

http://www.graco.c.u-tokyo.ac.jp/~kaneko/papers/gpw03.pdf
GA勝!さんが紹介していた将棋の論文ですが、
たしか以前、一度読んだ覚えがありますが、そんときは「へぇー」と思ったぐらいだったんですが、
大量の棋譜において、全候補手の中で、指された手が、一番に評価値が上がっているはず
という仮定の元に、
2駒の位置関係を、調整する手法が=兄弟モデルということですが、
Bonanzaは、次の一手問題を利用して、駒の位置関係も含めて評価関数を学習させているようなので、
まさに、同じ手法じゃないかと思います。


論文を読むと、「手を指した局面と指す前の局面では、指した局面は評価が上がっているはず」仮定=親子モデル
「ある局面の全候補手の中で、指された手が一番に評価値が上がっているはず」仮定=兄弟モデル
という二つのモデルについて、実際に学習をさせて、考察されているが、
断然、兄弟モデルの方が、成績が良いらしい。
とくに、序盤の定跡との一致度、悪形の検出などで、成績が良いらしい。


2駒の位置関係の評価が、実は、駒得や、王と近いと高い評価といった従来の評価を包含できるというのも面白かった。
序盤みたいに、駒得でも、王に近くづくわけでもない手を評価するには、駒と駒の位置関係の評価をすれば可能なのか……
この実験では、兄弟モデルなら、序盤の手もかなり多く正解するようなので、序盤の駒組も評価関数で理解できているということ?
それだと、落とし穴よりも、よほど良い手法のような気が……
この論文はGPS将棋チームによるものですね。