Pandasで文字列を含む行を抽出する

※当サイトはアフィリエイト広告を利用しています

データ分析

Pandasにて特定の文字列を含む行を抽出する方法について

コード

タイタニックのデータセットを利用

PassengerIdSurvivedPclassNameSexAge
103Braund, Mr. Owen Harrismale22.0
211Cumings, Mrs. John Bradley (Florence Briggs Th…female38.0
313Heikkinen, Miss. Lainafemale26.0
411Futrelle, Mrs. Jacques Heath (Lily May Peel)female35.0
503Allen, Mr. William Henrymale35.0
train.csv

“Name”に「Mrs.」を含む行を抽出する。

import pandas as pd

TRAIN = pd.read_csv('train.csv')
TRAIN [TRAIN ['Name'].str.contains('Mrs.')]
PassengerIdSurvivedPclassNameSexAge
211Cumings, Mrs. John Bradley (Florence Briggs Th…female38.0
411Futrelle, Mrs. Jacques Heath (Lily May Peel)female35.0
913Johnson, Mrs. Oscar W (Elisabeth Vilhelmina Berg)female27.0
1012Nasser, Mrs. Nicholas (Adele Achem)female14.0
1612Hewlett, Mrs. (Mary D Kingcome)female55.0

名前にMrs.を含む行だけが抽出できました。

解説

「TRAIN [‘Name’].str」Pythonの文字列のメソッドを適用

「.contains(‘Mrs.’)」で対象の文字を含んでいるかT/Fにて出力する

“含む”ではなく完全一致の場合

#性別でfemaleのみを抽出
TRAIN [TRAIN ['Sex']=='female']

この記事を読んだ人がよく見ています

タイトルとURLをコピーしました