重要単語の判断

402res/h 【皇室】 天皇陛下、“喜寿”77歳のお誕生日…魚類研究者でもある陛下、会見ではクニマス発見の「さかなクン」らの功績讃える
http://2chradio.com/arc/newsplus1293066367.html

この記事をYahoo!キーワードAPIに送った場合のスコアの高いキーワードのトップ5

 天皇陛下
 さかなクン
 魚類研究者
 喜寿
 クニマス発見
 功績

見事!
なかなか天皇陛下をトップスコアにできないと思うんですよ
(一番左側にあるから重要とも言えるんでしょうけどw)
少なくともこの記事の中のTFだけ見ても、分からないでしょう。
ある時間系列的な問題として、単語の重要度を判断しないと
天皇陛下」「さかなクン」のツートップは難しいでしょう。
人名が重要である場合が多いというのは経験則としてわかりますが、
何をもって人名と判断するのか?
辞書持ってればできますが、自律的にできないと、
広大なWEB世界のトレンド情報には立ち向かえない。


Yahoo!キーワードAPIは、一般常識を持っている。
重要単語さえ抽出出来れば、関連記事抽出はほぼ終わったも同然。