全世界の本3000万冊を分析してわかったこと 文化をビッグデータで計測することは可能か

著者フォロー
ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

縮小

書名であるところのカルチャロミクスとは耳慣れない単語だが、Nグラム・ビューワーを用いた分析のように、歴史上の変化を定量的に示す、言語や文化、歴史の新たな研究手法のことをそう呼称しているようだ。

研究でわかったこと

本書は当然、その新手法で行われた研究とはいったいどのようなもので、それでどんなことがわかり、新しくできるようになるのかを紹介していく一冊になる。

“利用者が痕跡としてオンライン上に残す情報の急激な増大に後押しされて、新たな観測装置が毎日のように次から次に登場しており、歴史はもちろん、地理学、疫学、社会学、言語学、人類学、さらには生物学や物理学の分野でも、これまで表に現れてこなかった側面が明らかにされてきている。世界は絶えず変化している。さらに、そうした変化に対する見方もまた変わりつつある。”

上記で述べられているように、本書の事例はあらゆる分野に広がっている。たとえば人名の出現頻度から「名声」が定量化できるかを問うたり、リボルバーやジーンズといった「発明品」がどの程度の期間をおいてから一般に認知されていくのかを分析してみたり、ある事象(たとえば9.11テロとか)がどのような過程を経て忘却されていくのかを単語の出現頻度から導き出し、普遍的な「忘却曲線」が割り出せるかを実験してみたりとおもしろい例がざくざくと出てくる。

中でもおもしろかったのは検閲が行われる国家で起こる天安門事件のような「検閲対象の語句」の使用頻度分析だ。1989年の天安門事件発生直後、英語では天安門を意味する単語は急上昇しているのに比べ中国国内では一時的に関心が高まったものの、すぐに通常の状態に戻っている。実際の書籍が「本当に検閲されているのか」を人間が調査するとかなり手間であることを考えると、検閲が実際の書籍にどの程度の影響を与えているかを、それなりに確かな証拠で検証できることの意義は大きい。実用に耐えるかどうかは、とりあえずはまた別の話としても。

次ページ役に立つかはわからないがおもしろい例
関連記事
トピックボードAD
ライフの人気記事