groongaで構築された検索サービス

groonga使ってエロ動画検索サイト「sugokuii」を作ってみた
http://yusukebe.com/archives/002710.html


作られてるのはエロ動画検索サイトですが、
groongaを使われています。
mysqlに組み込んだんじゃなくて、
KVSストレージ+全文検索エンジンとしてのGroongaとして使われてる模様。
なかなかサイトもきびきび動いている
ゆーすけべーさんはいつも手が速いなあ。

つまりビデオAのURLを見つけ出したらそのURLを含むウェブページの情報を取得し、
 そこのタイトルやサマリーにはビデオAに関する文字列を含むだろうという
仮定の元に成り立っています。 これでそこそこの精度が出てます。 
最初の対象サイトのURLをひたすら集める際にはAV女優の辞書を使って
検索サービスのAPIに投げて拾っています。

検索エンジンをうまく活用しているのがいいですね。
情報爆発で、検索エンジンに情報は実はあるんだけど、
引き出せないぐらい膨大なので、
あらかじめ引き出しておいて、結果をキャッシュしておく
という考え方ですね。
サマリーもサムネイル画像も自分で作らないでいいし(^^;


人物のカテゴリを、アニメ声優とか将棋のプロ棋士とかに置き換えることで、
色々と似たスタンスで作れそうです