協調フィルタリング

　しばらくこの技術について勉強します。
　分かりやすく言うと、amazonで「こんな本を読んでます」を紹介する技術です。

　みさきニュースは「できあいの辞書」で分類しているだけで、はっきりいえば反射神経でやってるだけです。
　実用性はあると思うんですが、あまり「知的」とは言えません。研究テーマ的にも弱いので、
「適応」「学習」ができる方法で拡張したいと思います。
　そこで協調フィルタリングを調べてみます（ハイブリッドでやってみたい）

とりあえず後で読むとして検索して文献を探してみます

http://www.ipsj.or.jp/members/Journal/Jpn/4501/article029.html
http://www.hotwired.co.jp/webmonkey/2000/13/index4a_page2.html
http://www.dl.kuis.kyoto-u.ac.jp/lecture/doc/infosystem10.pdf
http://www-miya.ist.osaka-u.ac.jp/mm/document/H_11/asakawa/asakawa_dews2000.pdf
http://www.ieice.org/iss/de/DEWS/proc/2002/papers/C2-9.pdf
http://pitecan.com/bib/CollaborativeFiltering.html
http://www-kasm.nii.ac.jp/macc2001-proceedings/MACC2001-11.pdf

非常に明快な理論なんですが、
例えば、次のような表で「人気投票」をしたとする

うさだ
 でじこ
 ぷちこ
 ぴよこ
 蘭花
 ミルフィーユ
ヴァニラ
ミント

結果が次のような感じだとする

うさだ＿＿＿｜○｜＿｜＿｜
でじこ＿＿＿｜＿｜＿｜○｜
ぷちこ＿＿＿｜＿｜○｜＿｜
ぴよこ＿＿＿｜＿｜＿｜＿｜
蘭花＿＿＿＿｜＿｜＿｜＿｜
ミルフィーユ｜○｜＿｜○｜
ヴァニラ＿＿｜＿｜○｜＿｜
ミント＿＿＿｜＿｜○｜＿｜

ぷちこ好きには、ヴァニラとミントが勧められる
ミルフィーユ好きには、うさだ、でじこが勧められる

（後者は、1番目と3番目のユーザーの嗜好が反映されている）

統計的なクラスタリングなのである程度、母数を大きく与えてやれば
興味深い結果が得られると思う(amazonみたいに）
「言葉の字句」に関しては何も見て無いところに注意