본문 바로가기
Python/Pandas

[Python] Pandas DataFrame 합치기 pd.concat(), pd.merge()

by coding_su 2022. 11. 25.

📝파이썬 판다스 데이터프레임 합치기

pd.concat( [df1, df2, df3] ) : 컬럼 이름이 동일하면 여러 데이터 프레임을 하나로 합칠 수 있다

# 리스트 안에 데이터 프레임 변수를 입력한다
>>> pd.concat([df1, df2, df3])
# df : 데이터프레임 약자

pd.merge(df, df, on= , how= ) : 두 데이터 프레임의 공통 컬럼이 있으면 이 컬럼을 기준으로 하나로 합칠 수 있다

※ 두 데이터 프레임에 공통으로 있는 데이터만 합쳐준다 (교집합)

 데이터 프레임 2개만 가능하다

# 합칠 데이터 프레임 두개 입력 후, on=뒤에 공통되는 컬럼명을 입력
>>> pd.merge(df1, df2, on= 'Employee ID')

# 마지막 how= 'left'를 입력해주면 왼쪽에 있는 데이터프레임 값은 다 나오게 하라는 것
# 'right' 입력시 오른쪽에 있는 데이터프레임 값은 다 나오게 하라는 것
>>> pd.merge(df1, df2, on= 'Employee ID', how= 'left')

댓글