みさきニュースhttp://props.tripod.co.jp/news/

「今日のなんでやねん」さんで取り上げて頂いた。
http://kitaj.no-ip.com/tdiary/20030426.html#p05

>これ,分類まで自動なのか
 そうなんです。自動で分類やってます。


 わたしが調査したところ、バルクニュースやRSSがらみの自動取得サイトだと、たんに記事を取得して羅列するだけのようです。
 凝ったものでも、被アクセス数でソートする「せかいのまんなか」があるくらいではないでしょうか
http://bulknews.net/
http://webmania.jp/~keitsuda/ 


http://homepage1.nifty.com/kazuf/renewal.html
 ここのAWAKING Projectに触発されて開発しています。
 米国だとGoogleNewsという物凄いものがありますが、この種のサービスはまだ国内は皆無だと思います。

 キーワード分類は、「キー」「カテゴリ」が対の辞書を利用しているだけです。さほど高度な処理はしてません。
 要点は、カテゴライズに優先順位を儲けていることで、
 たとえば、


 仮に、以下の記事を仮定すると、
田村ゆかり、アニメ祭に出演」

 田村ゆかり:声優
 という辞書が合った場合は、すみやかに「声優」にカテゴライズされます。
 もしない場合は、「アニメ:アニメ」で「アニメ」にカテゴライズします。
 より具体的なカテゴライズを優先して行っているわけです。


 開発はHSPなので、コンパイラもタダです。インタプリタなのでデバッグも楽です。C++とかJavaとか使えば見かけはカッコイイですが、
 プログラムは動けばいい。アルゴリズムの実現がキモである。
 と常々思っているので問題ありません(なので職業プログラマには向きません。しくしく)