「ボナンザのすごいところ」につっこむ

http://d.hatena.ne.jp/higotakayuki2/20071107/p2

ボナンザのすごいところは、人間が指した手全てを正例にしたところだと思います。この発想はなかなかできません。普通は人間より強いものを作るために、棋譜の中から重要なデータだけを統計的に取り出そうとします。

ちょっと誤解されてると思うので言及。


Bonanzaの凄いところはそうではないです。
人間の棋譜の手を正例にして学習した例は、2003年に既に東大のGPS将棋チームがされています。
これは、親子モデル・兄弟モデルの中の兄弟モデルで、棋譜の手の状況での他の合法手を兄弟としてモデル化して、
学習をされています。
http://d.hatena.ne.jp/mkomiya/20060825/p1



Bonanzaの発想が斜め上をいったのは、
棋譜の手を打った局面そのものを学習対象にしたのではなく、そこから駒がぶつかっている場面の取り合いを行って
局面を静かな局面まで進めて、その静かな局面を学習対象にしたことです。


細かいことを言えば、過学習を防ぐために慣性項のようなものをいれたり、
ロジスティック関数で評価値の離れたモノをフィルターしたりとかもありますが……


アルゴリズムに特化したブログのようでしたのでいちおう書いておきます。
#実際、静止探索後の局面を使わないとなぜダメなのかを考えるとアルゴリズムとして面白いと思いますので