AI活用で成功する職場、失敗する職場の「差」 AI活用で企業・個人の競争優位を築けるか
機械学習の導入を考える経営者・管理職は、まず「当社ではこんなに多様なデータが大量にある。このデータをできるだけ生かしたい」と素朴に考えるものです。たしかに手元にある膨大なデータを活用することで、データの取得にかかる費用は相当に削減でき、すぐ機械学習のモデリング作業を始められます。
ところが、「今あるデータ」は、「使えないデータ」である場合が多いのです。
膨大な日報データがあるといっても、そもそも機械学習モデルに活用することを念頭に置いていなかったため、手書きデータを電子化する必要であったり、人による記入ブレが多く含まれていたりして、数百万円かけてもまったく使い物にならなかった事例もありました。
故障検知の実例を見てみると、工場で働いている熟練工は直感で故障を判断できるケースが多い。その直感をよくヒアリングしてみると、機器を触ってみて、熱や振動、音で故障しているかどうかを判断する……、といった答えが返ってきました。これは、日報に詳細に書いてあるわけでもなく、どの工場でも取っているようなPLC時系列ログなどにもありません。
この場合、手元にあるデータで解析をスタートしてみても結果がでなければ、振動計や温度計を新たにつけて、データを取っていくことになります。
すべては紹介しきれませんが、落とし穴にはまった事例は、ほかにも山のようにあります。まずは、「使えるデータ」をとる覚悟を決めなければ、かえって損をする可能性があることを肝に銘じてください。
競争優位につながるデータ収集はコスパを生み出す
機械学習において、データの存在は十分条件ではなく必要条件です。つまり、性能を上げるためにデータは必要ですが、それだけでは不十分、ということです。機械学習は過去のデータからモデルを構築します。モデルをつくったあとも運用すればするほどデータが増える場合、こうしたデータも含めて再学習させることで、機械学習を使ってカバーできる範囲が増え、性能の継続的向上が期待できるのです。
一方、使えないデータばかりがたまる場合、そのままでは機械学習モデルをアップデートすることができません。そのため、使えないデータから使えるデータへ継続的な変換(アノテーションなど)を行う必要があり、ここに予想外の時間と労力、お金がかかることになるのです。
なお、機械学習モデルにはどれくらいのデータの量が必要になるでしょうか? 当然、プロジェクトに応じてケースバイケースになり、年単位で蓄積しないと使えるデータとは呼べないケースもあります。例えば四季の変化に影響されるデータなどは1年分のデータを蓄積して初めて意味があるデータと言えます。
そのような場合、1年分のデータを蓄積してから機械学習モデルをつくり込むのが妥当ですが、そのデータを蓄積する過程というのは、ただデータを観測・蓄積する過程ではなく、企業としては図のように、より競争優位に立てる過程とも捉えられます。
つまり、特定の機械学習モデルをつくるのに1年分以上のデータの蓄積を必須としたとき、競合他社が同一の機械学習モデルをまねしようとしてもそれ以上の時間がかかるため、1年以上の時間的競争優位を手にしたと同じと言えます。
無料会員登録はこちら
ログインはこちら