みさきニュース「注目記事ポイント制へ移行」
http://cgi.mediamix.ne.jp/~t5523/user-cgi/z/m.cgi?a=linked
被リンク数ランキングですが、ただ被リンク数だけだと古い記事がいすわってしまうので、
記事の取得時期に応じてバイアスをかけて得点制にしてみました。
いまやってるのは、最近の1300件には+1point、最近の250件には+3point
してます。
単純な改良ですが、けっこういい感じに注目記事をピックアップしてるようです。
このあとさらに改良を考えてます。
クリック数の多い記事を形態素分解して、注目キーワードを取り出して、
そのキーワードを記憶します。
頻繁なキーワードはリストの最初に来るようにして、更新を繰り返して、
全体で覚えるキーワード数の限界を決めておくと、
左から順番に注目キーワードが並ぶように学習をすると思います。
これで、今、はやっているコトが、キーワード的にわかるようになりそうです。
そして、その注目キーワードを使って、注目記事をピックアップさせようと思います。
この方法はかなり自動学習に近いので、面白そうです(しかしカテゴリ分類みたいなとこは難しそうですが)