まるやくんのブログ

使ってみて便利だと思ったモノやサービス、仕事やプライベートで学んでいる事を紹介します。

Python pandas 集計1

こんばんは。まるやくんです。今日はpandasを使ってデータフレームの簡単な集計方法を紹介します。

  1. pandasのインポート
  2. データフレームの作成・表示
  3. sumメソッドで列ごとの合計を算出
  4. meanメソッドで列ごとの平均を算出
  5. describeメソッドで様々な統計量を一度に算出
  6. corrメソッドで相関を確認

今回は非常にシンプルなデータフレームで行いましたが、何千行のデータでもすぐにこれらの集計を行う事が出来ます。describeメソッドではちょっと見慣れない単語が並んでいますが、stdは標準偏差、50%はデータの平均値ではなく中央値が示されています。またcorrメソッドでは各データ間の相関係数を求めることが出来ます。今回の例は案件数と売り上げに負の相関があります。通常だと逆になると思いますが 適当なデータなのでご容赦ください。是非業務のデータなどを入れて確認してみて下さい。

今回のように手入力でデータを入力してデータフレームを作ることはほぼないと思います。通常はcsvやエクセルデータなどから取り込み、集計や分析を行うと思います。次回は様々な形式からデータを取り込みデータフレームを作成する方法を紹介します。