みさきニュース「注目記事ポイント制へ移行」

http://cgi.mediamix.ne.jp/~t5523/user-cgi/z/m.cgi?a=linked

 被リンク数ランキングですが、ただ被リンク数だけだと古い記事がいすわってしまうので、
 記事の取得時期に応じてバイアスをかけて得点制にしてみました。
 いまやってるのは、最近の1300件には+1point、最近の250件には+3point
 してます。
 単純な改良ですが、けっこういい感じに注目記事をピックアップしてるようです。


 このあとさらに改良を考えてます。
 クリック数の多い記事を形態素分解して、注目キーワードを取り出して、
 そのキーワードを記憶します。
 頻繁なキーワードはリストの最初に来るようにして、更新を繰り返して、
 全体で覚えるキーワード数の限界を決めておくと、
 左から順番に注目キーワードが並ぶように学習をすると思います。
 これで、今、はやっているコトが、キーワード的にわかるようになりそうです。
 そして、その注目キーワードを使って、注目記事をピックアップさせようと思います。
 この方法はかなり自動学習に近いので、面白そうです(しかしカテゴリ分類みたいなとこは難しそうですが)