Pythonで不統一なExcelファイル繋ぐワザの神髄 シンプルな文法で書くプログラミングで効率化
データ構造の異なるファイルを1つにまとめる
さて、いよいよ本題に入ります。
全3回のうち1回目である今回は、形式が異なる複数のExcelファイルを、Pythonを使って1つに連結する方法を紹介します。
業務で複数の部署からExcel ファイルを集めて集計することになったが、いざファイルを集めてみると、それぞれの表の形式が微妙に違っていた、なんてことはよく聞く話です。
列名が異なっていたり、列の順番が変わっていたりした場合、機械的に連結したらめちゃくちゃなデータになってしまいます。
例えば、以下のようにいくつかの支店のExcelファイルを集めて連結しようとしたところ、列の並びがバラバラになっていたとします。
(外部配信先では画像や図表等を全部閲覧できない場合があります。その際は東洋経済オンライン内でお読みください)
ますは今回紹介するPythonプログラムがどのように働くのかを見せましょう。
①はじめに、仕上がりの列の並びを指定する「読み込み設定.xlsx 」を用意します。
②続いて、Pythonプログラムを実行します。
③すると以下の通り、各ファイルが連結されたExcelファイル(「統合表.xlsx」)が作成されます。
無料会員登録はこちら
ログインはこちら