職場ではアンテナ作ってます
今はアンテナを作ってます。とりあえずはてなアンテナというお手本があるので、まずはデッドコピーを作ろうかと。
mySQLで全部管理してるんで、動きも確実だし、なによりリレーションどうにでもなるので、作るのが楽。
差分作る部分はできてるので、RSSも作れます。
早くみさきニュースもmySQL化したいです。xreaでmySQLいまだによく判らず。
やはり自宅サーバーかなあ。
日ごろからceek.jp newsは凄いなと思うんで、自分も会社でc#でニュース見出しをベイス推定でカテゴライズするのにチャレンジしてます。
3-gramでやってましたが、既知のニュースは分類できるけど、未知に弱い。
形態素解析使わないとだめかも。
これもperl+MySQLでやったほうがいいかな。kakasiも入れてるし。
よりエンタメ、オタ方面に特化したceek.jp news的なニュースサイトを作ったらキャラ立ちできてグッドと思う。
2chとwikipediaにも自動リンクしまくりで。