土日は「みさきニュース」を復活させます!

書いておかないとダラダラしそうなので、有言実行を自分に課す。
本来ならそのまま復活させるならソースがあるわけですが、


まずは、RSS取得にしようと思います
けれどもカトゆーさんも含めて、RSS配信をしてない個人ニュースサイトは多いですから、
個別対応もやりたいと思います。連邦ゲットニュースとか、rinrin王国さんとか。
RSSでやるんだったら、個別の1地ニュースサイトとか、BLOGから取得も考えられますね。
はてなAPIを試すのは、職場でやってみたことがあるんですが、
関連キーワードなんかはサンプルがさくっと動きました。ただ日本語の通し方がすぐにはわからなかったけど……
RSSだとUTF-8ユニコードなんで、そこがちょっと難しいですねえ。


キーになる言葉はやはり手動で用意して、そこに「はてなAPIで関連用語を補う」なんてやり方いいかなって思う。


あとは、従来はCSVで保存してましたが、このさいmySQLで行ってみようと思います。
とりあえずクローラー系をしっかり作って、
そこの成果に、形態素解析かけるなり、検索させるなり、APIを呼ぶなりで、加工した結果を出力させるというスタンスで
いきませう。


職場では担当している案件が、今日山場を越えた感じ。来週から内部的なチェック関門が二重、三重に待ってるんですが、
そこはサービス部門の方と一致協力して乗り切らねば……。せっかく書類を作っても実は読まれないという儀式へのお供え状態なのが……。
今回を乗り切ると、次回は広告配信が被さってくるらしいですが、
別のプロジェクトにも入ってて、そっちは冬にサービスインの予定。