ニコ動のデータ分析研究発表会

http://nicovideo.g.hatena.ne.jp/Yoshikawa/20090126/1232902342

ニコ動関連の分析研究発表会がGLOCOM大学であった模様


http://d.hatena.ne.jp/tasukuchan/20090126/nicovideo_tag_kai2_analysis
未来検索ブラジルのSeena全文検索エンジン作ってる人の発表


会社で読んでいた記事は、各スライドにリンクがあったんだけど、
ブックマークしてなかったんで、検索したらスライドが見つからずに困りました


結局hotdocを検索して興味深かった「タグの階層関係」のスライド
http://www.hotdocs.jp/file/178658
この中で、深さ優先探索を行っている
人工知能学会の知識データベース研究会から理論を持ってきているみたい


タグの階層関係を木と考えて、接点と枝で考えるやり方。
たとえば「アイドルマスター」のタグから、共起関係ネットワークを構築して
深さ優先探索するらしい
アイドルマスターにおける各キャラの強さや、コミュニティー分割ができるらしい
深さの深いところに野球関係のタグが多いんだけど、どういう意味?


直感的には、野球 セリーグ パリーグ 巨人 西武というタグで考えると
野球はすべてのタグから共有されやすいけど、巨人はパリーグや西武とは共有されない。
同様に西武はセリーグと巨人から共有されない。セリーグは巨人以外にも中日や阪神から共有される
みたいに、共有される多さで、階層関係を定義している?
ある意味、ページランクを連想する。タグランクか。参照される被リンクではなく、被共有タグ数みたいな感じ?


CytoSpaceって可視化ソフトを使っているけど、これはコンピュータ将棋の探索の可視化にも使えるかも