まるやくんのブログ

使ってみて便利だと思ったモノやサービス、仕事やプライベートで学んでいる事を紹介します。

Python pandas データフレームの重複削除

こんばんは。まるやくんです。前回に引き続きデータの前処理について紹介します。今回はデータフレームの結合から重複データの判定・削除までを紹介します。

  1. pandas のインポート
  2. ディクショナリを作成
  3. ディクショナリからデータフレーム作成
  4. 作成したデータフレームを結合
  5. 重複データの判定
  6. 重複データの削除
  7. インデックスの振り直し

 

pandas ではこのようにデータフレームを簡単に結合する事が出来ますが、例えばある期間毎のデータを集計した場合などデータが重複する事はよくあると思います。重複データがあると正しい集計・分析結果にならないので注意が必要ですね。次回も引き続きデータの前処理について紹介したいと思います。