「ビッグデータ」って、やっぱりすごそうだ 『データの見えざる手』を読む
ビッグデータの時代である。私が生業とする生命科学の分野も例外ではない。全遺伝情報を解析するゲノム(genome)や、タンパク(protein)の発現をまるごと解析するプロテオーム(proteome)など、オーム(-ome)がうるさく幅を利かせるこのごろだ。
『オーム解析』は、私のように古典的な生物学から研究をはじめ、手作業の分子生物学の時代にしか実験をしてこなかった者にとっては、いささか手強い相手である。生のデータを相手にするのではない。もちろん、元々は個々の生データなのであるが、それを一定のフレームで切り取り、膨大な数のデータをコンピューターで解析する。
そもそもビッグデータって?
昔の研究は、いってみればここ掘れワンワンみたいなものであって、運と勘、あるいは目利きといったものが必要であった。
しかし、ビッグデータをあつかう網羅的解析は違う。宝があるかどうかわからないけれど、とりあえずドカッとブルドーザーで掘って、ある程度の大きさの篩(ふるい)にかけるような方法だ。
小さな宝は相手にせず、篩で残ったある程度以上の宝だけを取りだして、さてさてと都合のいい方法で品定めするようなものである。
無料会員登録はこちら
ログインはこちら