📝파이썬 판다스 데이터프레임 중복 데이터 그룹하기
카테고리컬 데이터(Categorical Date)의 경우 데이터 분석시 데이터별로 묶어서 데이터를 분석할 수 있다
df.groupby('컬럼') : 컬럼 중복 데이터를 그룹화 해준다
>>> df.groupby('컬럼')
# 그룹할 컬럼, 구할 컬럼 엑세스, 함수 입력하면 그룹화된 컬럼에서 원하는 컬럼값을 구할 수 있다
>>> df.groupby('그룹할 컬럼')['값을 구하고싶은 컬럼'].함수
df.groupby('컬럼').agg([함수, 함수]) : 집계함수를 한가지가 아닌 여러가지를 사용할때 사용한다
# 집계함수를 한가지가 아닌 여러가지를 사용할때 .agg를 사용한다
>>> df.groupby('컬럼').agg([함수, 함수])
df['컬럼'].value_counts() : groupby를 사용하지 않고도 해당 컬럼에 몇개의 중복 데이터가 있는지 알아볼 수 있다
>>> df['컬럼'].value_counts()
'Python > Pandas' 카테고리의 다른 글
[Python] Pandas DataFrame 함수 적용하기 apply() (0) | 2022.11.25 |
---|---|
[Python] Pandas DataFrame 조건 데이터 가져오기 loc[ ], isin() (0) | 2022.11.24 |
[Python] Pandas DataFrame 함수 숫자 데이터만 계산하기(numeric_only=True) (0) | 2022.11.24 |
[Python] Pandas DataFrame NaN값 처리하기 isna(), notna(), dropna(), fillna() (0) | 2022.11.24 |
[Python] Pandas csv 파일 불러오기 pd.read_csv() (0) | 2022.11.24 |
댓글