まるやくんのブログ

使ってみて便利だと思ったモノやサービス、仕事やプライベートで学んでいる事を紹介します。

Python pandas マッピングによるデータ変換

こんばんは。まるやくんです。前回に引き続きデータの前処理について紹介します。今回はデータフレーム内の値に基づいて変換する方法について紹介します。具体例として個別の売上データがあるとします。これに所属するチーム名が入った列を追加して、チーム毎の売上合計や平均を算出しようと思います。

  • pandas のインポート
  • ディクショナリからデータフレーム作成
  • メンバー名がキーでチーム名がバリューの辞書を作成
  • team 列を作成して map メソッドでチーム名をマッピングする
  • groupby メソッドでチーム別の合計を算出
  • groupby メソッドでチーム別の平均を算出 

今回はディクショナリからマッピングしましたが、エクセル等でメンバー表を作成しておいてデータフレームにマージすることも可能です。ご自身の環境で使いやすい方法で試してみてください。チーム編成が変わってもメンバー表だけを更新すれば良いので便利です。