Google は病院や大学に「ゲノムはありますか?」という新たな売り文句でアプローチしています。保管してください。
検索巨人の DNA 時代に向けた最初の製品は Google Genomics である。これは同社が昨年 3 月に開始したクラウド コンピューティング サービスであるが、先月下旬に行われた突飛な計画に関する発表など、Google からの注目度の高い研究開発発表が相次ぐ中、ほとんど注目されることはなかった。ナノ粒子でがんと闘います。
Google Genomics は、これらのムーンショットよりも重要であることが判明する可能性があります。ゲノムを数千個、そして間もなく数百万個単位で接続して比較することが、今後 10 年間の医学的発見を推進することになります。誰がデータを保存するかという問題は、すでに Amazon、Google、IBM、Microsoft の間で競争が激化しています。
Googleは18カ月前にGoogle Genomicsの取り組みを開始し、科学者らと会合し、DNAデータを自社のサーバーファームに移動し、Webのインデックス付けや追跡のために作成したのと同じデータベーステクノロジーを使用してそこで実験できるインターフェース(API)を構築した。何十億ものインターネット ユーザー。
「生物学者が一度に 1 つのゲノムの研究から数百万のゲノムの研究に移行しているのを目の当たりにしました」と、この取り組みを主導したソフトウェア エンジニアで、以前はソーシャル ネットワーク Google+ のプラットフォーム エンジニアリング責任者を務めていたデイビッド グレーザー氏は述べています。 「チャンスは、この移行を支援するためにデータテクノロジーのブレークスルーをどのように適用するかです。」
[slug=機能的 DNA パーセンテージも参照]
一部の科学者は、ゲノムデータは依然として複雑すぎて Google には対応できないと嘲笑しています。しかし、大きな変化が来ると見る人もいる。スタンフォード大学の生物情報学の専門家であるアトゥル・ビュート氏は、グーグルが今年の計画を発表したのを聞いて、「旅行代理店がエクスペディアを見たときにどう感じたか」が理解できたと述べた。
研究室が DNA を解読するためのさらに高速な新しい機器を導入するにつれて、データの爆発的な増加が起こっています。たとえば、マサチューセッツ州ケンブリッジにあるブロード研究所は、10月中に32分ごとに1つのヒトゲノムに相当する量を解読したと発表した。これは、約 200 テラバイトの生データに相当します。
これは、大手インターネット企業が日常的に処理している量よりも少ないですが(2 か月かけて、Broad は 1 日で YouTube にアップロードされる量と同等の量を生成します)、生物学者が扱った量を上回ります。このため現在、データを中央の場所 (多くの場合は商業施設) に保存してアクセスする広範な取り組みが推進されています。国立がん研究所は先月、2.6ペタバイトのがんゲノムアトラスのコピーをクラウドに移行するために1900万ドルを支払うと発表した。数千人のがん患者から得たデータのコピーは、Google GenomicsとAmazonのデータセンターの両方に保管される。
シアトルのシステム生物学研究所の研究員シーラ・レイノルズ氏によると、そのアイデアは、科学者たちが情報を共有し、Web検索と同じくらい簡単に仮想実験を迅速に実行できる「がんゲノムクラウド」を構築することだという。 「誰もがペタバイトのデータをダウンロードしたり、データを処理するための計算能力を持っているわけではありません」と彼女は言います。
また、DNA データのクラウドへの移行を加速させるために、Google と Amazon の間で 1 年にわたる価格戦争が行われてきました。 Googleによれば、現在、ゲノムの保存には年間約25ドル、ゲノムの計算にはそれ以上の料金がかかるという。一人の人のゲノムを表す科学的な生データのサイズは約 100 ギガバイトですが、人の遺伝コードの洗練されたバージョンははるかに小さく、1 ギガバイト未満です。年間の費用はわずか 0.25 セントです。
クラウド ストレージは、Tute Genomics、Seven Bridges、NextCode Health などのスタートアップ企業に後押しを与えています。これらの企業は、病院や科学者が遺伝子データを探索するために使用できる「ブラウザ」を構築しています。 「グーグルやアマゾンはバックエンドだ。彼らは『我々のクラウドでゲノミクス企業を設立できるよ』と言っているのだ」とアマゾンのクラウドに1600人の研究者に代わってゲノムデータを保管しているセブン・ブリッジズのデニズ・クラル最高経営責任者(CEO)は言う。
彼によれば、より重要な点は、医療は間もなく、医師が検索できる一種の世界規模の DNA インターネットに依存するようになるということだ。 「私たちの鳥瞰図は、将来私が肺がんになった場合、医師は私のゲノムと腫瘍のゲノムを配列決定し、5,000万の他のゲノムのデータベースと照合することになるということです」と彼は言う。 「その結果は、『おい、これがあなたに最もよく効く薬だ』ということになるだろう。 」
Google では、生物学が「職人によるデータ生産から工場規模のデータ生産」に移行しようとしていることが明らかになったので、Google Genomics に取り組み始めたとグレーザー氏は述べています。彼は、ブロード大学のチーフ、エリック・ランダー氏が教えるオンラインクラス「生物学入門」を受講し、遺伝学を独学することから始めた。彼はまた、自分のゲノム配列を解読し、それをGoogleのクラウド上に置いた。
[slug=dna-altering-need-limits も参照]
Glazer氏はGoogle Genomicsの規模や現在顧客数については明らかにしていないが、公開プロジェクトからの少なくとも3,500のゲノムがすでにGoogleのサーバーに保存されている。同氏はまた、Googleのクラウドと、Googleが今年立ち上げた人間の寿命を延ばす方法を研究するCalicoと呼ばれる会社のような、ヘルスケア分野での投機的な取り組みとの間には、今のところ何の関連性もないと述べた。 「それらを結びつけているのは、テクノロジーが生命科学の最先端を進歩させることができるという認識が高まっているだけです」とグレイザー氏は言う。
スタンフォード大学最大の遺伝学データ用コンピュータークラスターを管理する物理学者のソマリー・ダッタ氏は、最近の値下げのせいで、現在ではグーグルやアマゾンでゲノムを保管するのにかかるコストは、自身のデータセンターに保管するのとほぼ同じになっていると語る。 「価格はようやくリーズナブルになりつつあり、今後も下がり続けると思われます」と彼女は言う。