pandasでのデータ分析の際のcsvファイルの読み込/保存方法について
共通設定
pandasのインポート
import pandas as pd
読み込み方法
標準的な読み込み方
pytyonのファイルと同じフォルダに入っているファイルを読み込む場合
DF = pd.read_csv('data.csv')
フォルダを指定して読み込む場合
DF = pd.read_csv('C:/Users/**/***/****/data.csv')
相対パスで読み込む場合
folder
┗folderA (pythonファイルの置き場所)
┗folderB (データファイルの置き場所)
DF = pd.read_csv('../folderB/data.csv')
EXCELで作成したCSVを読み込む場合
Excelで作成したCSVなど拡張文字情報を含む場合、encoding=’cp932’を指定する必要がある
DF = pd.read_csv('data.csv', encoding='cp932')
自由記述のアンケート結果などのcsvなどは拡張文字情報含んでいる場合が多いため、cp932でエンコーディングすることが多い
データ型を指定して読み込む場合
自動でデータ型を判別してくれますが、データ型を指定して読み込むこともできます
#すべて同じデータ型で読み込む場合
DF = pd.read_csv('data.csv', dtype=str ) #全て文字列として読み込み
#列を指定してデータ型を設定する場合
DF = pd.read_csv('data.csv',dtype = {'ID':'int','name':'object'})
保存方法
pandasでの作業後のcsvファイルの保存
#DF: 保存したいデータフレーム
#pythonファイルと同じフォルダに保存
DF.to_csv('Dataframe.csv')
#フォルダを指定して保存
DF.to_csv('C:/Users/**/***/****/Dataframe.csv')
ヘッダー、インデックスをつけずに保存
DF.to_csv('Dataframe.csv', header = False, index = False )
変数でファイル名を指定して保存
moji = 'Data_01'
DF.to_csv( moji + '.csv')
DF.to_csv('C:/Users/**/***/****/' + moji + '.csv')
# Data_01.csv が出力される
コメント