본문 바로가기
인공지능/인공지능

Time Series 데이터를 처리할때 사용하는 resample 함수

by coding_su 2023. 1. 3.

📝Time Series 데이터를 처리할때 사용하는 resample 함수

그룹바이 함수를 이용해서는 날짜 데이터를 바로 년단위 월단위 일단위 시단위 등으로 묶어라 라고 할 수 없다
따라서 먼저 Date컬럼을 인덱스로 만들어 주어야 resample 함수를 사용할 수 있게 된다
resample 함수가 년단위 월단위 등등으로 데이터를 묶어서 처리가 가능하다

※ Date컬럼 = Dtype : datetime64[ns]

 

우선 사용할 컬럼의 데이터 타입을 알아보고 오브젝트일경우 데이트타임으로 바꿔준다

df['Date'].info()

# format=에 해당 컬럼에 날짜가 입력 되어있는 형식을 입력해준다
df['Date'] = pd.to_datetime( df['Date'], format= '%m/%d/%Y %I:%M:%S %p' )

 

리샘플하면 각 년도, 월, 분기, 일별로 몇개의 데이터를 가지고 있는지 확인이 가능하다

# 년도로 리샘플한 후, 각 년도별 몇개의 데이터를 가지고 있는지 확인
df_year = df.resample('YS').size()

# 월별 건수 확인
df_month = df.resample('M').size()

# 분기별 건수 확인
df_q = df.resample('Q').size()

# 일별 건수 확인
df_day = df.resample('D').size()

댓글