📝파이썬 판다스 데이터프레임 문자열 포함, 제외 여부 확인하기
df['컬럼'].str.contains('a') : 데이터프레임의 해당 컬럼에 어떤 문자열(a)을 포함하고 있는지 True, False로 알려준다
※ 문자열 뒤에 아무것도 입력하지 않으면 디폴트값 case=True이 적용되고
case=False값을 입력하면 대소문자 상관없이 가져온다
※ 앞에 물결(~) 표시 입력시 True 와 False 를 바꿔준다
※ 판다스 공식 홈페이지 참고하기
https://pandas.pydata.org/docs/reference/api/pandas.Series.str.upper.html
# 해당 문자열 포함 여부 확인
>>> df['컬럼'].str.contains('찾을 문자열', case=False)
# 해당 문자열을 제외한 나머지 확인
>>> ~df['컬럼'].str.contains('찾을 문자열', case=False)
# ~ 을 입력하면 True 와 False 를 바꿔준다
df['컬럼'].str.startswith('a') : 데이터프레임의 해당 컬럼에 특정 문자열(a)로 시작하는지 True, False로 알려준다
# 특정 문자열(a)로 시작하는지 확인
>>> df['컬럼'].str.startswith('a')
# 대소문자 구분없이 확인하고 싶다면 .str.lower()로 소문자로 만들어서 사용
>>> df['컬럼'].str.lower().str.startswith('a')
df['컬럼'].str.replace('a','b') : 문자열 a를 b로 변경해준다
※ 특정 문자열 제거할때도 사용가능 '$' ,'₩' …
# '$' 를 공백으로 변환
>>> df['컬럼'].str.replace('$','', regex= True)
# regex= True 입력 안할시 경고뜸
'Python > Pandas' 카테고리의 다른 글
[Python] Pandas DataFrame 유일한 값 찾기 unique(), nunique(), value_counts() (0) | 2022.11.25 |
---|---|
[Python] Pandas DataFrame 합치기 pd.concat(), pd.merge() (0) | 2022.11.25 |
[Python] Pandas DataFrame 정렬하기 sort_values(), sort_index() (0) | 2022.11.25 |
[Python] Pandas DataFrame 함수 적용하기 apply() (0) | 2022.11.25 |
[Python] Pandas DataFrame 조건 데이터 가져오기 loc[ ], isin() (0) | 2022.11.24 |
댓글