文字化けがおきることがある

ブログクローラーrssを見に行ってますが、rssxmlなので文字コードutf-8なんですが
エントリーによって文字化けすることがあるようです。
なんで明示的にutf-8に変換すると多少マシになったんですが、
perlの場合、utf-8フラグというややこしいものがあって、
そのへんをやるとうまく行ってそうでもあり、でもrssによってはparserがエラーで落ちる(´Д`;)
とりあえず、
jugem、fc2をクロールするようにしました。が、予断は許されない。


今のところ保持エントリー数は約9000。