본문 바로가기
Python/Pandas

[Python] Pandas DataFrame 문자열 포함, 제외 여부 확인 str.contains(), str.startswith()

by coding_su 2022. 11. 25.

📝파이썬 판다스 데이터프레임 문자열 포함, 제외 여부 확인하기

df['컬럼'].str.contains('a') : 데이터프레임의 해당 컬럼에 어떤 문자열(a)을 포함하고 있는지 True, False로 알려준다

※ 문자열 뒤에 아무것도 입력하지 않으면 디폴트값 case=True이 적용되고

 case=False값을 입력하면 대소문자 상관없이 가져온다

 

※ 앞에 물결(~) 표시 입력시 True 와 False 를 바꿔준다

※ 판다스 공식 홈페이지 참고하기

https://pandas.pydata.org/docs/reference/api/pandas.Series.str.upper.html

# 해당 문자열 포함 여부 확인
>>> df['컬럼'].str.contains('찾을 문자열', case=False)

# 해당 문자열을 제외한 나머지 확인
>>> ~df['컬럼'].str.contains('찾을 문자열', case=False)
# ~ 을 입력하면 True 와 False 를 바꿔준다

df['컬럼'].str.startswith('a') : 데이터프레임의 해당 컬럼에 특정 문자열(a)로 시작하는지 True, False로 알려준다

# 특정 문자열(a)로 시작하는지 확인
>>> df['컬럼'].str.startswith('a')

# 대소문자 구분없이 확인하고 싶다면 .str.lower()로 소문자로 만들어서 사용
>>> df['컬럼'].str.lower().str.startswith('a')

df['컬럼'].str.replace('a','b') : 문자열 a를 b로 변경해준다

※ 특정 문자열 제거할때도 사용가능 '$' ,'₩' …

# '$' 를 공백으로 변환
>>> df['컬럼'].str.replace('$','', regex= True)
# regex= True 입력 안할시 경고뜸

댓글