「たまに行う大量なバッチ処理」にはAmazon EC2のクラウドサービスを使う

http://www.hirax.net/techlog/2010/04/19.html#8994

同社では、社内のデータベースサーバを利用して、この処理を実施した場合、7000時間はかかると見積もった。
しかし、米AmazonのIaaS型のクラウドサービスであるEC2を活用し、50台のインスタンス(仮想マシン)を同時に立ち上げ、
分散処理のフレームワークである「Hadoop」を利用したところ、わずか30時間で完了した。

おそらくAmazoneEC2の活用としてはこういうのが一番うまいんだと思う。
そういう意味ではbonanzaメソッドの学習なんかも利用すべき(^^;
大学の研究室でクラスターがあるならいいけど、
個人の開発者なんかにはいいんでは。
ただ、PC数台で時間をかける分には電気代しかかからないけど(^^;


単に大規模webサービスで、スケールアウトを狙ってるだけなら、
国内にも安いVPSはいっぱいあるようだし。
Amazonの利点は1日だけとか時間貸しもできるところ。
さすがに一般のVPS時間貸しできるところは無いと思う。
(言葉は悪いけど、AmazonEC2は、サーバーの日雇い派遣を大規模人数でもやってくれる会社みたいな感じ)


AmazonEC2ですが、
会社でwestのsmallインスタンスを一台借りてます
phpMyAdminを入れてる所なんですが
なぜかテーブルが作れない(^^; 原因不明
/var/www/htmlじゃなくて、/home/webuser/helloworld以下にweb環境とかありました


イメージを用意してくれたネットワーク技術の方が、
たまたま選んだイメージがfedoraコアだったんですが、
職場は普段RHELまたはcentOSなんですね。
ただ、クラウドってなんかイメージでは凄い感じでしたが、
実際使ってみると、もっさりしてるただのレンタルサーバーだった(^^;
インスタンスを簡単に増やせるとか時間単位で課金できるとか、
 そういうamazonの用意する統合環境が凄いってこと)