まるやくんのブログ

使ってみて便利だと思ったモノやサービス、仕事やプライベートで学んでいる事を紹介します。

Python pandas エクセルファイルの読み込みと書き出し

こんばんは。まるやくんです。

今日はデータ分析を行う上で最初に必ず行うステップとして、データの読み込みについて紹介します。日々の集計や分析業務で取り扱うデータはエクセルやcsvファイルが多いと思います。もちろん定期的に決まったデータを集計するのであれば、エクセルvbaで十分だと思います。ただ例えば月の業績報告をすると上司や客先からはこの期間で見るとどうか?この項目に絞って見れないか?など様々な指摘をいただきます。そういった時にpandasはその場で様々な集計に対応出来るので非常に便利です。

  1. pandasのインポート
  2. エクセルファイルの読み込み
  3. 要約統計量の算出
  4. 3をエクセルに書き出す

 

 

 

In [1]:
# pandas のインポート
import pandas as pd
In [2]:
# エクセルファイルを読み込み
df = pd.read_excel(r'C:\Users\****\*****\デスクトップ\jupyter_notebook\ex1.xlsx')
df
Out[2]:
 
  a b c d menber
0 1 2 3 4 A
1 5 6 7 8 B
2 9 10 11 12 C
In [3]:
# 要約統計量を算出してデータフレーム(df2)を作成
df2 = df.describe()
df2
Out[3]:
 
  a b c d
count 3.0 3.0 3.0 3.0
mean 5.0 6.0 7.0 8.0
std 4.0 4.0 4.0 4.0
min 1.0 2.0 3.0 4.0
25% 3.0 4.0 5.0 6.0
50% 5.0 6.0 7.0 8.0
75% 7.0 8.0 9.0 10.0
max 9.0 10.0 11.0 12.0
In [4]:
# df2 をエクセルファイルに書き出し
df2.to_excel(r'C:\Users\****\*****\デスクトップ\jupyter_notebook\ex3.xlsx')

今回はエクセルファイルについて紹介しましたが、csvファイルの場合もほぼ同じです。読み込むときは read_csv として、書き出すときは to_csv とするだけです。補足としてwindows10環境だとファイルのパスを指定する際にパスの前に r をつけて下さい。他にも様々なデータを取り込む事が可能です。紹介しきれないので必要に応じて追加していきます。次回はデータの整形について紹介します。