グーグルとアマゾン、「DNA解析」を巡って熱戦 クラウドの最先端で起きていること
GoogleとAmazonが、それぞれよく知られている遺伝子データセットを無料でホストしていることからも、両社がこのビジネスをいかに重要視しているか、そして既存顧客を将来の顧客として獲得しようとしているかを窺い知ることができる。
両社はいずれも、保有している遺伝子データの量を発表していないが、アナリストや遺伝子科学者へのインタビュー、さらに両社の顧客に関する発表から考えると、Amazon Web Servicesの方が、データ規模が大きいと言えるだろう。
ヒトの1%以上にみられる遺伝的変異を特定した官民連携の国際的取り組み、「1000ゲノムプロジェクト」のデータは、AmazonとGoogleの両方で無料公開されている。そう語るのは、同プロジェクトのスポンサーの1つ、アメリカ国立衛生研究所(NIH)のキャシー・クラヴェディ氏だ。
Google派とAmazon派
さらに特殊な領域に関心を持ち、使用料を支払う他のクライアントはGoogle派とAmazon派に分かれている。
例えばGoogleは、自閉症の遺伝学的原理の手がかりを得るため、自閉症児1万名とその両親のゲノムを収集・分析するというオーティズム・スピークス基金のプロジェクトを獲得した。
チュート・ジェノミクスもGoogleの顧客だが、85億のDNA変異が登録されたそのデータベースでは、ある変異が発生する頻度、その変異と関連のある体質、さらにある変異を有する人々が特定の薬剤に対して示す反応を検索できる。
Amazonは、創薬ターゲットを特定するために、患者1000名の全ゲノム配列その他のデータを収集するという多発性骨髄腫研究基金(Multiple Myeloma Research Foundation: MMRF)のプロジェクトでホスティングを行った。Amazonはアルツハイマー病配列解析プロジェクト(Alzheimer's Disease Sequencing Project:ADSP)も獲得したが、このプロジェクトも同様の目標を掲げている。
1つの完全ヒトゲノムのデータ保管料は、Amazonが月額4ドル~5ドル、Googleが月額3ドル~5ドルだ。両社は、科学者が保管されたデータに解析ソフトを使用する際のデータ転送や計算時間にも料金を課している。
Amazonのデータベース解析ツール、Redshiftの使用料は1時間25セント、1テラバイトにつき年額1000ドル。1テラバイトは1兆バイトもしくは1000ギガバイトだが、これは高画質動画300時間を保存するのに十分な容量だ。