今回、決勝戦で感じたのは「受けのすごさ」

去年と比較して余計に感じました。完全に劣勢になっても、ものすごく頑強に受けるので、し合いが長引く、
でへたすると逆転もある。
柿木将棋が完全に優勢で入玉で逃げ切れると思いきや、受けられて逆転されたり……


解説のプロがうなるような受けが多かったと思います。
ちょっと不思議な現象でした。ひとつだけならまだしも、全体的にそんな感じでした。


女流の方がおっしゃってましたけど「コンピュータは、細かいプラスになる手をうまく指す」って。
でも、それって、むしろ今までは苦手だったんですよね
昔は、コンピューターは駒得重視で、大駒を大事にし過ぎで、大味の試合が多かった。
細かい得点を積み重ねたり、小駒の活用は、人間が上手くて、それが人間の長所と言われていた。


それが逆に、コンピュータの方が、細かい手を積み重ねるのが上手くて、受けも強くて、
どんどん人間的になってきている……
やはり、評価関数が、手作りの数十とかの要素ではなく、機械学習的に何十万の要素の結合になってきているから、
その積み重ねで、「細かい得点をかせぐ手」が見えるようになっているんじゃないかと思います。
(もちろん、手動でも数千の要素を入れられるような凄い人はいらっしゃいますが(^^;)



攻殻機動隊のマンガに「私は情報の海から生まれた生命だ」という台詞がありますが、
ある程度の複雑な状況まで進むと、そこから、何かが突然生まれてくる、敷居値みたいなものが
あるのかもしれません。
(ここでカンブリア爆発とか言うとSF的ですが)




自分でもソフトを作ってる立場として、防御は難しいです。攻めるのは、紐付きの駒を敵王の周りに貼っていけば、
加速度的に勝てる。
でも、防御は守り駒を貼りすぎると攻めができないし、敵に剥がされて劣勢になるだけの場合もある。
なので、実際、うちのソフトは防御は、敵の攻めの裏返しで評価することになっていると思う(MinMaxなので)
なにか防御的な機能を入れれば、攻撃と防御の両者から評価できるから、より精度が高まるんですよね
これは、色々なことに言えて、詰め将棋のdfpnは、王手と応手の両方から評価するから、速いし正確
(PN探索では片方からしか見えない)
Bonanzaメソッドも、正解手を強化するだけじゃなくて、Jが高い間違いの手を抑制する方向の両方があるから、
学習速いし正確なんだろうとと思います