データサイエンティストが陥る機械学習の罠 過去データの過剰学習は将来予測には不適
配送の問題を解決するデータサイエンティスト
インターネット通販の拡大などにより、トラックなどによる荷物の配送ルートの最適化が重要な課題になっています。移動に伴う最短経路を求める問題は「巡回セールスマン問題」などと呼ばれ、組み合わせ最適化として、以前から数学の代表的な問題でした。制約要因などが多く、簡単に解を求めることができませんでした。
物流量の増大や、物流の複雑化に伴い、物流業者においては、最適な配送ルートを算出し、物流コストを削減することが大きな課題となりました。制約要因が多く、計算は複雑ですが、データ・地図情報が整備されたことや、コンピューターのハード面での進化などにより、配送ルートの最適化が進みました。今では簡単なアプリを使って、配送ルートを効率化できるようなサービスも提供されています。
配送ルート最適化の最大の問題は「複雑さ」です。すべての組み合わせを総当たりで計算すれば、最適解を見つけることはできます。ただし、組み合わせの数が多すぎるため、高スペックのコンピューターでも現実的な時間では計算できません。毎日のように変わる条件で計算するとなると、なおさら不可能です。
そのため、ある条件を固定して問題を簡略化したり、効率的に近似解を見つけることが検討されています。データサイエンティストの力で配送ルートの最適化は進展しており、これからも改善されていくでしょう。
配送最適化では、食品にはそれぞれ賞味期限があったり、トラックに載せられる量に限りがあったりという制約条件が数多く存在します。存在するすべての制約条件を考慮して「いつ、何を、どれくらい届ければ、売上と利益が最大になるか」という現実の行動パターンをシミュレーションしようとすると、考えられるパターンは膨大な数になり、機械学習をもってしても計算することが困難になります。
そこで活用されるのが、機械学習で得られた予測値でシミュレーションを行い、意思決定を自動化する「数理最適化」です。現実の問題を数式に表現し、数々の制約条件を満たしながら、利益を最大化するような目的で使われます。
数理最適化は、IoT(モノのインターネット)化によって、計算に必要なデータが揃うようになったことに加え、安価に大規模な計算が可能なクラウド環境が整備されてきたことなどから、一段と注目されるようになってきています。