groongaで構築された検索サービス
groonga使ってエロ動画検索サイト「sugokuii」を作ってみた
http://yusukebe.com/archives/002710.html
作られてるのはエロ動画検索サイトですが、
groongaを使われています。
mysqlに組み込んだんじゃなくて、
KVSストレージ+全文検索エンジンとしてのGroongaとして使われてる模様。
なかなかサイトもきびきび動いている
ゆーすけべーさんはいつも手が速いなあ。
つまりビデオAのURLを見つけ出したらそのURLを含むウェブページの情報を取得し、 そこのタイトルやサマリーにはビデオAに関する文字列を含むだろうという 仮定の元に成り立っています。 これでそこそこの精度が出てます。 最初の対象サイトのURLをひたすら集める際にはAV女優の辞書を使って 検索サービスのAPIに投げて拾っています。
検索エンジンをうまく活用しているのがいいですね。
情報爆発で、検索エンジンに情報は実はあるんだけど、
引き出せないぐらい膨大なので、
あらかじめ引き出しておいて、結果をキャッシュしておく
という考え方ですね。
サマリーもサムネイル画像も自分で作らないでいいし(^^;
人物のカテゴリを、アニメ声優とか将棋のプロ棋士とかに置き換えることで、
色々と似たスタンスで作れそうです