協調フィルタリング

 しばらくこの技術について勉強します。
 分かりやすく言うと、amazonで「こんな本を読んでます」を紹介する技術です。

 みさきニュースは「できあいの辞書」で分類しているだけで、はっきりいえば反射神経でやってるだけです。
 実用性はあると思うんですが、あまり「知的」とは言えません。研究テーマ的にも弱いので、
「適応」「学習」ができる方法で拡張したいと思います。
 そこで協調フィルタリングを調べてみます(ハイブリッドでやってみたい)


とりあえず後で読むとして検索して文献を探してみます

http://www.ipsj.or.jp/members/Journal/Jpn/4501/article029.html
http://www.hotwired.co.jp/webmonkey/2000/13/index4a_page2.html
http://www.dl.kuis.kyoto-u.ac.jp/lecture/doc/infosystem10.pdf
http://www-miya.ist.osaka-u.ac.jp/mm/document/H_11/asakawa/asakawa_dews2000.pdf
http://www.ieice.org/iss/de/DEWS/proc/2002/papers/C2-9.pdf
http://pitecan.com/bib/CollaborativeFiltering.html
http://www-kasm.nii.ac.jp/macc2001-proceedings/MACC2001-11.pdf

非常に明快な理論なんですが、
例えば、次のような表で「人気投票」をしたとする

うさだ
でじこ
ぷちこ
ぴよこ
蘭花
ミルフィー
ヴァニラ
ミント


結果が次のような感じだとする


うさだ___|○|_|_|
でじこ___|_|_|○|
ぷちこ___|_|○|_|
ぴよこ___|_|_|_|
蘭花____|_|_|_|
ミルフィーユ|○|_|○|
ヴァニラ__|_|○|_|
ミント___|_|○|_|


ぷちこ好きには、ヴァニラとミントが勧められる
ミルフィーユ好きには、うさだでじこが勧められる


(後者は、1番目と3番目のユーザーの嗜好が反映されている)


統計的なクラスタリングなのである程度、母数を大きく与えてやれば
興味深い結果が得られると思う(amazonみたいに)
「言葉の字句」に関しては何も見て無いところに注意