自宅サーバーを立てる予定

misakiがx64に移行した関係で、HPのノートPCでコンパイルできないので、
自宅サーバーマシンにする予定。ノートなら静かだし。


2ch動的リンク集は、現在、その場で収集して保存するタイプだけど、
これだと4板ぐらいしか集計できないので、
2chスレ一覧クローラーで定期収集させようと思います。
コードはもう書いていて、あとは環境を構築するだけ。



来年になれば著作権法も改定されるし、この手のサービスも正面からやりやすくなるでしょう。
2chのスレって2万件ぐらいだから、MySQLでもこなせるぐらいの量だし、
速度重視するなら、ngram分割してfulltextで登録すれば速い(もしくはsennaを入れるか)
動的リンク集はlogin制にして、誰でも好きな処理を登録できるようにしたいと思います。


あとやってみたいのは、アニメ板のスレの頻出固有名詞を数えて、人気のあるアニメのランキング一覧を作るとか自然言語処理関係。
以前、2chスレの自動要約をやっていたので、TFを数えたりするのはやっていたし。
同じことをAV機器板でやってみても面白いだろう。


あと、困難だけど、これらの収集結果をインタラクティブに引き出せる自然言語な対話インタフェースが作りたい。
人工無能でマルコフ的にでたらめな会話ができても、役に立たないので、
役に立つ人工無能が欲しい。
考え方としては、時系列の質問を憶えておいて、暗黙の知識として使えるとか、関連語などを暗黙に使えるとか。