みさきニュースhttp://props.tripod.co.jp/news/
「今日のなんでやねん」さんで取り上げて頂いた。
http://kitaj.no-ip.com/tdiary/20030426.html#p05
>これ,分類まで自動なのか
そうなんです。自動で分類やってます。
わたしが調査したところ、バルクニュースやRSSがらみの自動取得サイトだと、たんに記事を取得して羅列するだけのようです。
凝ったものでも、被アクセス数でソートする「せかいのまんなか」があるくらいではないでしょうか
http://bulknews.net/
http://webmania.jp/~keitsuda/
http://homepage1.nifty.com/kazuf/renewal.html
ここのAWAKING Projectに触発されて開発しています。
米国だとGoogleNewsという物凄いものがありますが、この種のサービスはまだ国内は皆無だと思います。
キーワード分類は、「キー」「カテゴリ」が対の辞書を利用しているだけです。さほど高度な処理はしてません。
要点は、カテゴライズに優先順位を儲けていることで、
たとえば、
仮に、以下の記事を仮定すると、
「田村ゆかり、アニメ祭に出演」
田村ゆかり:声優
という辞書が合った場合は、すみやかに「声優」にカテゴライズされます。
もしない場合は、「アニメ:アニメ」で「アニメ」にカテゴライズします。
より具体的なカテゴライズを優先して行っているわけです。
開発はHSPなので、コンパイラもタダです。インタプリタなのでデバッグも楽です。C++とかJavaとか使えば見かけはカッコイイですが、
プログラムは動けばいい。アルゴリズムの実現がキモである。
と常々思っているので問題ありません(なので職業プログラマには向きません。しくしく)