2006-11-01から1ヶ月間の記事一覧

0と0.3では

寝てる間に自己対戦させてた0と0.3の延長では、 9勝23敗で、今度は0.3手延長が今のところ勝ち越してます。 思考時間にもよると思うので、30秒考えるとまた別かも。 Bonanzaぐらい速くて、反復進化が充分回っていれば、0.5で深く読んだほうが強いのかもし…

0.5手延長と0.3手延長で自己対戦

今日は残業で帰りが遅いので、作業はせずにもう寝ましょう。 会社に行ってる間に自己対戦でテストしてました。王手は1手延長として、 recapとone replyを、0.5手、0.3手延長で1手5秒で自己対戦です。 序盤は定跡で、選択は、頻度の一番高い手か二番目に高い…

シリアル対戦成功

礒部将棋とシリアル対戦できるようになりました。 投了コマンドがまだなんで、それをいれましょう。 次は連続対戦ができるようにしたいですが、 CSA通信プロトコルには規定がないですねえ。 k-shogiも連続対戦できるようだし、ちょっと調べてみましょう。 通…

手の受信に成功

CSAのサイトにある通信プロトコルサンプルを見て、 http://www.computer-shogi.org/protocol/source_win_e.html http://www.computer-shogi.org/protocol/ RS232Cのシリアル通信部分を製作中。 無料であるvc++2005 express editionで、COMポートをたたくプロ…

今日は日曜日だった

微妙な手の選択は、評価関数や探索のパラメーターを変えるだけで変わるので、 まずは明らかな悪手を指した棋譜を調べて、ひとつひとつ原因を探らねばならないでしょう。 まだまだ悪手を指すので、バグが眠ってるようです。 探索延長に関しては0.5を0.3にすれ…

yowa_gpsに5秒モードで勝利!

5秒モードでも勝てた! 棋譜の悪手を調べていて、王の安全度を測る関数にすごい副作用があることを発見。 角が王の周辺に特攻した時に、一時的に敵王の周辺に利きが増えるので、 それで一気に王の安全度が下がっていた。 実際は取ればいいだけなので、そんな…

同じ1秒モードだと負けた(´・ω・`)ショボーン

yowai_gpsにあわせて、こちらも思考時間1秒にしたら負けた…… http://wdoor.c.u-tokyo.ac.jp/shogi/tools/view/index.cgi?go_last=on&csa=http%3A%2F%2Fwdoor.c.u-tokyo.ac.jp%2Fshogi%2FLATEST%2Fwdoor%2Byowai_gps-1500-0%2Bmisaki%2Byowai_gps%2B200611252…

いつのまにか「詰めと必至ハンドブック」のNo1が解けなくなりました。

ログをきちんとしらべてませんが、なぜか解けなくなりました。 futilityとかnullMoveとかで枝刈りされてるのか? ちょっと前は解けてたのに……。

ヒストリームーブ

勘違いしていて、ヒストリームーブというのは、実行時に統計をとって、その頻度を利用してやる方法らしい。 depthの関係ないキラームーブみたいなものかと思っていた。 GA勝のアベントさんが紹介してた大学のゼミレポートみたいな解説を読んで気づきました。…

探索延長について

Bonaといっしょで、王手1手、recap0.5手、one reply0.5手で延長している。 が、この数字は、反復進化にかなり効いてくる。 かといって、recapを0にしてしまうと、反復は回るでしょうが、ぜんぜん深く読めなくなる。 このへんは自己対戦で最適なところを見つ…

yowai gpsにも勝つ

これは勝てないと話にならないでしょうけど。 詰め将棋ルーチン無し http://wdoor.c.u-tokyo.ac.jp/shogi/tools/view/index.cgi?go_last=on&csa=http%3A%2F%2Fwdoor.c.u-tokyo.ac.jp%2Fshogi%2FLATEST%2Fwdoor%2Byowai_gps-1500-0%2Byowai_gps%2Bmisaki%2B20…

1秒モードのBonanzaに健闘( ̄ー ̄)ニヤリッ

バグつぶしに奮闘しております。 どんどん色々と機能をいれては、バグを蓄積している現状は間違ってるということで、 細かくチェックをしております(性格に合わないので辛いです) マイムーブ西村さんによれば、 「評価関数は駒割だけでも、深く読めますよ…

コンピュータ将棋用マシン考察

アベントさんが、開発マシンを新調の模様「コンピュータ将棋用マシン考察」 メモリ4GBも買いますか( ̄ー ̄) それだったらハッシュがかなりとれますね。 4core、4GB モンスターマシンですなあ。 並列といえば、 http://www.top500.org/list/2006/11/100 スパ…

探索延長で大きく変わる

前回の必至問題(詰めと必至ハンドブック・4章No3)。 詰み探索を入れないとなかなか解けないと書いてましたが、 反復進化の回数を優先して、王手1手延長のみでしたが、 ReCap0.5手、one reply0.5手の延長を加えてみたところ、 短時間で必至を見つけました。 ▼…

Bonanzaのイベントの棋譜

マグノリアの発売イベントがPCWATCHに http://pc.watch.impress.co.jp/docs/2006/1120/bonanza.htm 珍しいですね。MYCOM PC WEB(今はジャーナルですか)が取材するのはよく見ますが、 impressの記事はあまり見た記憶がありません。 マグノリアさんとお付き合…

全幅で、詰探索を入れた場合と入れない場合の必至問題(訂正)

「詰めと必至ハンドブック」4章のNO3の問題。 詰め探索をいれた場合といれない場合で比較。 あくまでうちでの実装依存の話です( ̄ー ̄) 詰め探索を入れた場合は(4手深さまで、詰みそうな場合のみ詰め探索を呼ぶ) ▼持駒v歩十六v香四v桂三v銀四v金二v角二 …

お絵かき

将棋を打つコンピュータ将棋のみさき(擬人化) 最近エンタメ要素が皆無なので久しぶりにお絵かき。 マウスで直接描いてみました。 将来的にはツインテールで2並列になればいいなと(意味不明)

bitBoard議論について

ライエル先生も参考文献に挙げてらっしゃいますが、 YSSの掲示板の過去ログには、山下さんが詰め将棋でbitBoardをやられた話を書き込み、 そこにBonanzaの保木さんがご自分の手法を解説された書き込みがあります。 昨晩、読んでみたのですが、これはかなり示…

TD法を用いた将棋の評価関数の学習(小谷研究室)

以前、国会図書館でコピーしてきた論文です。 前に読んだときは、あまり理解できませんでしたが、 Bonanzaの発表を見て、土日にうんうん悩んだ末に読むと「あ!」って感じでした。 ここでは、駒の価値、持ち駒の価値、王の周囲の利きの数の得点、互いの王と…

学習……

土日で色々と試しましたが、まだうまくいってません。 目的関数の勾配をどう求めるか? などが曖昧です。 評価関数の複数の要素の重みを学習させるとか、そのへんからやろうと思います。 たとえば、Bonanzaの評価要素では、王の周囲25近傍の利きの状態を学習…

bitBoardやるべ!

ライエル先生がbitBoardの実装方法をGPWで発表されてましたが、 探索の高速化のためには、やるしかあるまいと思います。 特に、静止探索の中で、1手詰みの王手を指さすとか、 あと、大駒の移動可能枡の数が簡単にわかるとか、魅力が高いと思います。 しかし…

詰めと必至ハンドブック(日本将棋連盟)

内藤さんの必至の入門書を以前買ってましたが、デバッグに丁度いいので 解かせました。 というか解けませんでしたので、解けるようにデバッグしました。 第四章(P187)のちょっと難しい1手必至No1から ▼持駒v歩十五v香四v桂四v銀v金四v角二v飛 9 8 7 6…

マイムーブがさっそく手の生成順序を変更していた

http://chocobo.yasuda-u.ac.jp/~nisimura/mymove/index.cgi?no=369さっそくハッシュの次をSEE>0にしてらっしゃいますね。 結果が気になってましたが、ちゃんと高速化しているようなので、素晴らしいです。 http://chocobo.yasuda-u.ac.jp/~nisimura/mymove/…

CPUひとつ13万円

YSSの掲示板によれば、来年の選手権では山下さんはCore2QuadのDualで8CPUで参戦される様子(*´Д`) 今、CPU単体は秋葉で13万らしいですが、二つで26万円。マザーが3万ぐらいとして、他は流用で、 30万の出費で作れるかな? 春までには価格も下がるでしょう。安…

シグモイド関数を使う意味をきちんと理解してなかった

特徴ベクトルを追加しても目的関数があまり向上しなかったと書いてましたが、そもそもシグモイド関数は、教師を増やすために分解能をわざわざ広げるために導入しているんでした。 理想的な、階段関数にすれば、棋譜の手より評価を良いと判断した手しかカウン…

特徴ベクトル(+大駒の移動可能な枡数の得点)

特徴ベクトルを追加してみました。 12-137 Lpv= 93.4/207 25.9% [avg 19.9] 0.0sec OK(258)17.6% NG(1209)82.4% top5(420)28.6% top10(514)35.0% top20(1068)72.8% top30(1193)81.3% 12-138 Lpv= 50.4/137 26.0% [avg 19.9] 0.0sec OK(258)17.6% NG…

局面評価の学習を目指した探索結果の最適制御2

ということで、GPW2006から帰ったその日から学習方法を研究中なのですが、 あの数式群をプログラムに落とし込むところが、まだまだできておりません。 が、言わんとすることはおぼろげながらわかってきたように思います。 会社の行きも帰りも、GPWの論文を読…

局面評価の学習を目指した探索結果の最適制御

http://www.geocities.jp/bonanza_shogi/gpw2006.pdfgpw2006でも発表スライドを保木さんがおまけとして公開されているようです。 それを読んでもらえば判りますが、futility,null move pruningなどの技術を使えば、 探索の大きさは=1/4*(2.23)^n となって、…

GPW2006について

しばらく更新が止まってましたが、ひたすら学習を研究中です。 TACOSのパターンによるN-Gram、端攻めタイミングの判定 激指の実現確率のN-Gram統計化 DF-PNとλ探索 などが興味深い発表でした。 そしてなんといっても、保木さんによるBonanzaでの評価関数の自…

将棋に勝つ考え方(谷川浩司著 池田書店)

http://www.amazon.co.jp/exec/obidos/ASIN/4262103013/doublecrownsp-22id:doublecrownさんの http://doublecrown.under.jp/shogi/0142.html で紹介されていた「形勢判断の参考書」が、定量的に形勢判断を解説してる良書のようなので、 amazonのマーケット…