Blunderまで+3

http://wdoor.c.u-tokyo.ac.jp/shogi/logs/LATEST/players-floodgate.html

ついにレーティング差が+3まで来てますね。
もう二週間ぐらいはなにもしてないですが、R自体はすこしづつ増えてます。
傾きの速さから行って、土日でこのまま抜くかもしれない。


eval_diff的な評価関数を使ったオーダリングがけっこう対Blunder戦で成績が良かったので
投入すればもっとRが増えると思うのですが、
バグで落ちるので投入してません。いづれ投入したいところです。


この場合のオーダリングは、静的な知識なので、前向き枝狩りに近いと思います。
素直にSEEだけでやった方がいい場合も多い(はず) ←SEEでしょぼいとはいえ一応探索してる
なので、探索末端でやると有効なのではないかと想像してます。
もう探索できないのなら、探索で確認(=後ろ向き枝狩り)できないのだし、
前向き枝狩りでもやらないよりはマシぐらいの感じ。
※枝狩りという直接的意味ではなく、統計的な平均解を局所的に適用することの是非


あと、終盤に関してはとにかく速くする必要があるのですが、
現在は2.5GhzノートPCでシングル探索なので、
マシンパワーでの下駄はあえて残しておきたいと思います←大リーグ養成ギブス


Bona411評価関数はとにかく重いので、評価関数の結果をハッシュで保持していたのですが、
Bona412では同様な修正が加わっていたので「保木さんも同じことしてる」と一人ほくそ笑みましたw
静止探索でパスを利用して評価関数の呼び出しを省力するといった手法を真似すれば
もっと速くなることは解っているのですが、概念が解りにくいでのまだやってません


Rが上がり続けて、調子に乗ってBlunderBona411(2183)まで追いついてしまうと
探索力に関してはBlunderと同等ということが言えてしまえますし、
(実際はマシンが劣っているので上回っていると言えるかもしれない)
必要なRはあと2183-2013=170


SpearTest(2235)まで行くには、後2235-2013=222
3.0GHz&4並列化で、Rが+100になると仮定すると、現在が2013ですから2113と考えて、
残り122です。
あと122だけソフトパワーで強くすればSpearTestの探索力に追いつく予定は未定


探索力さえ身につけば、あとはオリジナルの評価関数をちゃんと作れば
最終的にちゃんと強いソフトができるはずである。
↑それが難しいんですがwww



55将棋でもBona411的な激重評価関数を作って学習してみたんですが、
sspに負けてしまう始末でした(涙目