본문 바로가기
Python/Pandas

[Python] Pandas DataFrame 중복 데이터 그룹하기 groupby()

by coding_su 2022. 11. 24.

📝파이썬 판다스 데이터프레임 중복 데이터 그룹하기

카테고리컬 데이터(Categorical Date)의 경우 데이터 분석시 데이터별로 묶어서 데이터를 분석할 수 있다

 

df.groupby('컬럼') : 컬럼 중복 데이터를 그룹화 해준다

>>> df.groupby('컬럼')

# 그룹할 컬럼, 구할 컬럼 엑세스, 함수 입력하면 그룹화된 컬럼에서 원하는 컬럼값을 구할 수 있다
>>> df.groupby('그룹할 컬럼')['값을 구하고싶은 컬럼'].함수

df.groupby('컬럼').agg([함수, 함수]) : 집계함수를 한가지가 아닌 여러가지를 사용할때 사용한다

 

# 집계함수를 한가지가 아닌 여러가지를 사용할때 .agg를 사용한다
>>> df.groupby('컬럼').agg([함수, 함수])

df['컬럼'].value_counts() : groupby를 사용하지 않고도 해당 컬럼에 몇개의 중복 데이터가 있는지 알아볼 수 있다

 

>>> df['컬럼'].value_counts()

댓글