Access Ranking
ウェブ時代に入り、新しい情報調査方法が注目されている。それがビッグデータや統計学を駆使したデータ分析の手法だ。かつてはプロフェッショナルであるデータ・アナリストやウェブエンジニアたちの独壇場であったが、スマホ、タブレット全盛の時代に入り、専門家たちだけの話ではなくなった。どのように本当の情報に辿りつくか、もはやビジネスマンにとっても至上命題となっている。そこで今回はデータ・アナリストとしてデータ分析の最前線に立つ工藤卓哉氏と、データを使った政治報道に取り組んできた朝日新聞政治部記者の松村愛氏に、ウェブ時代の情報の取り方、今直面している課題、そして本当の情報にするための情報の扱い方について聞いた。
あふれる情報の中で
どうすれば本当の情報をつかめるのか
松村 ウェブ時代となった今、様々な情報へのアプローチができるようになりましたが、私の場合は、やはり人からアプローチを始めます。とにかく取材となれば、締切りから逆算して、人や場所を思い浮かべて、自分が狙う情報に近い人たちや専門家にどれだけアポイントを入れて話を聞くことができるのか。現場に足を運ぶことができるのか。
新入社員だったころから、それは変わっていません。取材に行く前に、その人の最低限の情報を検索しますが、基本的にはそれほど予断を持たないようにしています。ウェブの情報は便利なのですが、結構論調が同じなんですね。最低限のデータを仕入れるためにウェブは使うけれど、それ以上のことは後からにしますね。
工藤 情報の質という意味では、やはり人が一番です。私も旬な情報を持っている専門家やITトレンドの最前線にいる人にアポを入れて、常にその分野で一番尖った人に会おうとしています。新聞記者と同じようなことをしているんです。
彼らと会う際は、事前にその人のバックグラウンドをチェックし、最低限話すネタを考えます。もしその人がTEDトークやYoutubeで語っているデータがあれば、どういうものを思考している人なのか、見て調べてから会うようにしています。
IT、コンサルの業界になると、日本国内の情報以外に、海外の動向や学術論文も重要になります。ニューヨーク・タイムズやCNNなど海外のメディアから、大学関連の学術情報まで得るようにしています。
新聞、雑誌、ネット、論文を使い分けていますが、人と会うときは確度の高い情報を得てから、ピンポイントで会うようにしています。
松村 私の場合、情報を仕入れる自分のデフォルト状態があって、毎朝、朝刊6紙(朝日、読売、毎日、日経、東京、産経)を比較して読み、7時のNHKニュースを見る。あとはネットのニュースを読んで初めて、自分の1日のデフォルト値ができるんですね。
そこから今日は何をプラスして、どういう紙面にしていこうかというのを朝出勤しながら考えています。会社に着いたら、英字紙なども読むようにしていますね。
工藤 私は仕事柄、最先端技術を常に追い続けないといけませんし、そこを周囲から期待されている。講演であれば、ありきたりな話なんて決してできません。
そのため、MITやスタンフォードのオープン・エデュケーションで毎日勉強するようにしています。ディスカッションに参加し、情報収集しながら世界各国の問題の解決策を考えるなど、毎日自分の包丁を研ぐようにしています。
新聞記者とコンサルタントは
いかにデータと向き合っているのか
松村 私がいる政治部の仕事は、ものすごく泥臭いんです。とにかく政治家や官僚に会って、現場に行って話を聞く。政治部に限らず、新聞記者の取材は、現場に足を運んで話を聞くのがまず原点です。
でも、10年ほど前から、我々が日々、定点観測している政治家や政党の政治理念や政策スタンスを分析することで、政治の現状を読み解けないか、また政局の先行きを見通せないか、ということで始まったのが、「朝日・東大共同調査」です。今で言えば、データ・ジャーナリズムの走りのようなものですね。
当時、東大法学部教授だった蒲島郁夫氏(現・熊本県知事)の研究室と朝日新聞が共同で始めました。朝日新聞は国政選挙のたびにすべての候補者に、氏名や所属政党、支援団体、出身校など選挙報道の基本データを提供してもらっていますが、これに加えて、政策アンケートもとるようにしたのです。「憲法を改正すべきだ」「原発の運転再開はやむを得ない」といった共通質問への賛否の度合いを自己申告で答えてもらい、それぞれの政策スタンスを東大と共同で分析し、記事にしています。
回答は政治家の肉声と同じですから、これはものすごいデータなんですね。これで何がわかったかというと、政党内の意見の散らばり、あるいは都市と地方の政治家の意識の差などがかたちとして見えるようになったのです。投票日前にすべての回答を朝日新聞デジタルや紙面上で公開しますから、有権者に投票の参考にもしてもらえます。私たちはこれを「政治家意識のオープンソース化」と呼んでいます。
この調査を継続することによって、政治家個人の政策のブレも見えるし、政党の意見のブレも見える。ほかにもいろんなかたちの分析ができる。こうした蓄積は、大手メディアならではのデータ・ジャーナリズムだと思いますね。
工藤 コンサルタントの世界では、これまで情報データの扱いは、コストリダクション(=コストを削減する領域)、つまり業務を改善することが中心でしたが、今はデータを使った攻めるための方法論をクライアントから求められることが多くなっています。
今トレンドになっているのは、アマゾンのレコメンデーションモデルのようなものです。なぜそのリクエストが多いのかといえば、それだけ各企業のデータが増えてきているからなんです。しかも、その増え方がすごい。これまでのPOSデータだけでなく、会員カード、携帯アプリ、ウェブから購入する方のデータも蓄積されると、お客様のプロファイリングとして動き方が可視化できてしまうのです。
もう一つのトレンドはセンサーデータを使った、新しい送客です。センサーデータの一つである画像解析も、完全一致は日本では法律で許されていないのですが、すでにニューヨークでは、自動車のナンバープレート読み取り機能を持つ4000個弱のサーベイランスカメラが市内各地や警察車両に設置されている。たとえばマンハッタンでは、ニューヨーク市警察のデータベースに登録されている犯罪者の車両や盗難車を検知した瞬間から追尾装置が起動し、検挙に繋げる仕組みがあります。日本でもこうした動きに興味をもっているお客様がたくさん出てきていることは事実ですね。
本当に使える情報は
人とデータのバランスから生まれる
松村 こうしたデータ分析を始めるとき、良いパフォーマンスを出すために必要なものというのは、システムやアルゴリズムの精度なのでしょうか。それとも何か人間の力が介在する部分はあるのでしょうか。
工藤 かつて大型計算機を使ってデータ処理に1日かかっていたものが、今なら普通のパソコンでも数秒ほどで結果が出るようになりました。それが当たり前となった今、勝負になるのはやはり人間の力量というところになるんですね。
例えば、統計専門家として有名なネイト・シルバー(『シグナル&ノイズ』の著者)はまさに力量がある、センスがいい人の代表例でしょう。
ただ、もちろんネイト・シルバーのような人がいれば心強いのですが、実際にそんなエキスパートは世の中にそれほど多くはいません。やはりネイト・シルバーの代わりになるようなシステムも必要なのです。
一方で、今ブームとなっているビッグデータや統計学はバズワード的になってきており、「統計なんて当たらない」と誤解している方もいる。私はこの事態を非常に懸念しています。統計データ解析も交互作用のような過去履歴から有意性を検定するなど、機械学習にできないことが可能ですが、決して万能ではなく、シーンによって使い分けて初めて効果がある。今のトレンドでは、統計で何でもできるように思われがちですが、やはりバランスが大事なのです。
松村 政治部の統計データ的な仕事として代表的なものが選挙の当落速報です。朝日新聞にも、ネイト・シルバーのような選挙分析を得意とする専門家がいるんです。
その重要な手がかりの一つが、投票所での出口調査です。当選速報は1分1秒の競争なので、データ収集と精密な解析にものすごく手間ひまをかけるのですが、そこで大事になってくるのは、システムの精度に加え、属人的な取材力と分析力になります。
いくら「当選は間違いない」と解析できたとしても、一定のバイアスはありますから、そこには事前取材による分析力が欠かせないのです。
その情報やデータが正確かどうか
インテグリティを確保する
工藤 興味深いのは取材力のところです。これは本当に重要ですね。あるとき、営業から「なかなか案件が取れない」という報告があったんです。なぜそうなのか、問題点を探るため、事前ブリーフィングをしてもらった。そのとき営業に「このお客様の売り上げはいくらなの」と聞いたら、困ったことに答えられないのです。しかも、決定権限のない担当者に営業をかけていることもわかった。取材でいえば、情報ソースとして信頼度が極めて低い人から「いいね、これ」と言われて喜んでいたわけです。
コンサルティングでは、お客様の規模、企業体力を事前に調べるのは当たり前です。我々は取材をヒアリングと言うのですが、そこで経営課題、ニーズを把握することが最優先です。ヒアリングせずに、経営指標の数字だけを財務資料から引っ張ってきても、本質から外れている可能性が高いのです。
分析の世界では「発射台」と「的」と言うのですが、要は肝心のミサイルも発射台がなければ飛びませんし、的がないとどこに飛ばしていいかわかりません。経営目標を的に例えて、発射台として、経営課題や今の事業の状態を調べることが大事なのです。
松村 新聞記者の情報の扱い方の基本は、まず疑うことです。やはり事実と現実は違う。例えば、政治家の発言をそのまま活字にするのも大事ですが、政治の世界では意図的に流れをつくるのは日常茶飯事。それが果たして正しい方向性なのかどうか、ものすごく吟味します。
しかも吟味は自分だけではできません。与党の見方、野党の見方もありますし、政権に近い人と遠い人の見方もそれぞれ違う。ですから、皆でいろんな見方を戦わせます。
情報を事実として判断する前に必ず疑って情報を叩く。そこから報道する中身が生まれていく。ウラを綿密にとる。言ったから書く、というだけでは政治記者の意味がありませんから。
工藤 情報の扱い方としては、全業界に言えることだと思いますが、まず情報を取ってきたあとに、きちんと引用元をつける、情報に間違いがないか繰り返し確認するんですね。
欧米の大学などの学術機関でも、引用するデータをごまかすと一発で退学なんですが、日本ではその意識が薄い。私は必ずプレゼン資料でも何でも引用元を付けるようにしているのですが、これをやらない人が意外と多いのです。
とくにコンサルの報告書はデータが命なので、データの正確性、引用元が明らかにできていなかったら、報告してはダメだと厳しく言っています。
ネット時代のデータの取り方として、そのデータ元の信頼性に対するインテグリティ(integrity、誠実性)の確保を必ずとるように仕事をしなければなりません。情報をどんな人から取っても、それは気をつけるようにしていますね。
(撮影:今祥雄)