python

データ分析

PandasのDFを省略せずすべて表示する

Pandasのデータフレームを省略せず表示する方法をご紹介。設定をデフォルトに戻す方法も合わせてご紹介。
データ分析

2列の値を比較して大きい方の数字を抽出する

2つの列の値を比較して大きい方/小さい方の数字を新しい列に抽出する方法。数字型だけでなく日付型などにも対応しているので、2つの日付列のうち新しい方(古い方)などのデータ抽出も可能となります。
データ分析

Pandasで文字列を含む行を抽出する

Pandasにて特定の文字列を含む行を抽出する方法について
データ分析

フォルダ内のZIPファイルを全て解凍する

大量のログデータがZIPファイルで格納されている場合など、手作業で解凍するのは面倒なのでPythonで自動化するためのコードです
データ分析

PandasでNullの行を削除/抽出する

PythonのPandasでNullが含まれる行だけを抽出/削除する方法について
データ分析

Pandasでgroupbyでグループごとに計算する

Pandasのgroupbyでグループごとに計算する方法をご紹介。データ分析の際によく使う関数になります。
データ分析

行の多いCSVファイルをPythonで分割する

Pythonを使ってCSVファイルを分割する方法についてご紹介。縦に長いCSVファイルを一定の行数で分割してCSVファイルを出力することを想定。
データ分析

Python/Pandasでのデータ型確認と変換

python、pandas でのデータ型の確認方法と変換について
データ分析

機械学習を解釈する~PD(Partial Dependence)

機械学習は便利なツールである一方、結果の解釈や説明が難しいのがデメリットと一般的に言われています。そこで今回は機械学習を解釈する手法の1つであるPD(Partial Dependence)についてご紹介します。
データ分析

機械学習を解釈する~PFI(Permutation Feature Importance)

機械学習を解釈する手法の1つであるPFI(Permutation Feature Importance)についてご紹介。eli5でPFIを算出する方法やPFIの動作原理についてわかりやすく説明しています。