ブログ検索を実験開始

自宅のceleronマシンにmySQLを入れて、ブログクロールマシンにしました。


#ココログ新着
&NewsGet( "http://updates.cocolog-nifty.com/status/updates.rdf" );
#gooブログ新着
&NewsGet( "http://blog.goo.ne.jp/index.php?fid=freshEntryRss&provider=1" );
#はてなダイアリー新着
&NewsGet( "http://blog.goo.ne.jp/index.php?fid=freshEntryRss&provider=5" );
#livedoorBlog新着
&NewsGet2( "http://clip.livedoor.com/rss/site/blog.livedoor.jp" );
#gooブログ新着オール
&NewsGet( "http://blog.goo.ne.jp/index.php?fid=freshEntryRss" );


ブログ会社の更新差分をwindowsのタスク機能で10分間隔で見に行くようにしました。
一晩でどのくらいエントリーがたまってるか分かりませんが、
今までは小規模なwebサービスばかりやっていたので、ある程度大規模なやつにもチャレンジしてみます。
インデックスを使わずに、どのくらいのエントリー数まで検索の速度が持つのか? あたりも知りたいところです。
my.iniのメモリー設定などは多少増やしてみました。



現時点のブログ検索のipアドレスは、以下
http://203.138.191.178/blog/blog.cgi
たぶんすぐ変わってしまいます
自分ではアクセスできないので未確認ですが(^^;


今現在、保持エントリー約3000ですが、はてなのホットキーワードがまったく検索にヒットしません(^^;
というかすごいアニオタ系に偏ってますね(w