新chardio

http://misaki.mine.nu/chradio/s.cgi
はプログラム技術板の自然言語処理スレッドに宣伝で書いてみたら


>面白いけど………これって要約じゃなくて抽出じゃん 過去ログ嫁


とレスを頂きました(・∀・)


過去ログでは、GoogleNewsのグルーピングについてとか、検索エンジンの検索結果の話とか
あのスレは、奈良先端大とか言語関係の専門家の人が集まってそう……



要約結果(抽出でもいいけど)一番スコアの高い単文は、青字に大きな文字にしてみました。
最近の2chスレ紹介サイトは、こういう編集をよくされているので、
そのへんのマネをしてみました。
普通にレスのフィルタリングとしてもやってみてもいいかも。


今後の課題として、同じような書き込みをグループでまとめる。をやりたい


しかし、文面しか比較対照が無いので、類義語辞書とか持ってないと難しいんじゃないかと?
GoogleNewsの場合、見出しだけじゃなくて記事内容でも比較できるし。
さすがに類義語辞書を自動生成するのは、たいへんそうなんで、
自分で持つかな?(これなら旧みさきニュースもやってた)
類義語っていうか、関連語なら、ブログ検索すれば得られるが……(それも現在進行形の)