データサイエンティストが陥る機械学習の罠 過去データの過剰学習は将来予測には不適

拡大
縮小
(写真:wutzkoh/PIXTA)
データサイエンティストとは、データを単純に収集・整理・分析するだけではなく、データをビジネスに活用できる人を指します。本稿では『データサイエンティスト 基本スキル84』(野村総合研究所データサイエンスラボ編)より一部を抜粋・再構成のうえ、データサイエンティストに求められる能力について解説しています。

配送の問題を解決するデータサイエンティスト

インターネット通販の拡大などにより、トラックなどによる荷物の配送ルートの最適化が重要な課題になっています。移動に伴う最短経路を求める問題は「巡回セールスマン問題」などと呼ばれ、組み合わせ最適化として、以前から数学の代表的な問題でした。制約要因などが多く、簡単に解を求めることができませんでした。

物流量の増大や、物流の複雑化に伴い、物流業者においては、最適な配送ルートを算出し、物流コストを削減することが大きな課題となりました。制約要因が多く、計算は複雑ですが、データ・地図情報が整備されたことや、コンピューターのハード面での進化などにより、配送ルートの最適化が進みました。今では簡単なアプリを使って、配送ルートを効率化できるようなサービスも提供されています。

配送ルート最適化の最大の問題は「複雑さ」です。すべての組み合わせを総当たりで計算すれば、最適解を見つけることはできます。ただし、組み合わせの数が多すぎるため、高スペックのコンピューターでも現実的な時間では計算できません。毎日のように変わる条件で計算するとなると、なおさら不可能です。

そのため、ある条件を固定して問題を簡略化したり、効率的に近似解を見つけることが検討されています。データサイエンティストの力で配送ルートの最適化は進展しており、これからも改善されていくでしょう。

配送最適化では、食品にはそれぞれ賞味期限があったり、トラックに載せられる量に限りがあったりという制約条件が数多く存在します。存在するすべての制約条件を考慮して「いつ、何を、どれくらい届ければ、売上と利益が最大になるか」という現実の行動パターンをシミュレーションしようとすると、考えられるパターンは膨大な数になり、機械学習をもってしても計算することが困難になります。

そこで活用されるのが、機械学習で得られた予測値でシミュレーションを行い、意思決定を自動化する「数理最適化」です。現実の問題を数式に表現し、数々の制約条件を満たしながら、利益を最大化するような目的で使われます。

数理最適化は、IoT(モノのインターネット)化によって、計算に必要なデータが揃うようになったことに加え、安価に大規模な計算が可能なクラウド環境が整備されてきたことなどから、一段と注目されるようになってきています。

次ページ機械学習の罠「過学習」
関連記事
トピックボードAD
キャリア・教育の人気記事
トレンドライブラリーAD
連載一覧
連載一覧はこちら
人気の動画
日本の「パワー半導体」に一石投じる新会社の誕生
日本の「パワー半導体」に一石投じる新会社の誕生
TSUTAYAも大量閉店、CCCに起きている地殻変動
TSUTAYAも大量閉店、CCCに起きている地殻変動
【浪人で人生変わった】30歳から東大受験・浪人で逆転合格!その壮絶半生から得た学び
【浪人で人生変わった】30歳から東大受験・浪人で逆転合格!その壮絶半生から得た学び
【逆転合格の作法】「日本一生徒の多い社会科講師」が語る、東大受験突破の根底条件
【逆転合格の作法】「日本一生徒の多い社会科講師」が語る、東大受験突破の根底条件
アクセスランキング
  • 1時間
  • 24時間
  • 週間
  • 月間
  • シェア
会員記事アクセスランキング
  • 1時間
  • 24時間
  • 週間
  • 月間
トレンドウォッチAD
東洋経済education×ICT