본문 바로가기

Python/Pandas25

[Python] Pandas read_csv ParserError 📝판다스에서 csv파일을 읽어오는데 ParserError 가 발생할때 csv파일을 읽어올때 ParserError가 발생하면 에러가 난 데이터 말고 정상적인 데이터는 가져오기 위해 아래 코드 처럼 error_bad_lines= False를 입력해준다 chicago_df_1 = pd.read_csv('Chicago_Crimes_2005_to_2007.csv', error_bad_lines= False) 2023. 1. 3.
[Python] Pandas 파이썬의 날짜형식 데이터 만들기 pd.date_range() 📝파이썬 판다스 파이썬의 날짜형식 데이터 만들기 pd.date_range('시작날짜', '종료날짜') : 시작 날짜와 종료날짜를 셋팅하면 날짜를 채워준다 # 시작 날짜와 종료날짜를 셋팅하면 1일 단위로 생성 >>> pd.date_range('2022-11-30', '2023-01-01') # 시간까지 입력가능(단위 지정 안할시 시작날짜 시간으로 1일 단위로 생성) >>> pd.date_range('2022-11-30 09:00', '2023-01-01 11:00') # 원하는 단위로 생성할시 freq= 입력 >>> pd.date_range('2022-11-30 09:00', '2023-01-01 11:00', freq= 'H') # 1시간 단위로 생성 2022. 11. 30.
[Python] Pandas 문자열 날짜형식으로 변환하기 pd.to_datetime() 📝파이썬 판다스 문자열 데이터 파이썬의 날짜형식으로 변환하기 pd.to_datetime : 문자열로 되어있는 날짜를 파이썬의 날짜형식으로 변환한다 # 문자열 리스트 파이썬의 날짜형식으로 변환하기 >>> pd.to_datetime(날짜 리스트 변수) # 데이터프레임 문자열 날짜 컬럼 파이썬의 날짜형식으로 변환하기 >>> pd.to_datetime(df['컬럼']) >>> pd.to_datetime(df['컬럼']).dt.weekday # 요일 숫자로 출력 >>> pd.to_datetime(df['컬럼']).dt.strftime('%a') # 요일 영문 3글자로 출력 2022. 11. 30.
[Python] Pandas DataFrame 피벗테이블 pd.pivot_table() 📝파이썬 판다스 데이터프레임 피벗테이블 만들기 피봇팅 한다 = 컬럼의 값을 인덱스로 만들되, 인덱스를 중복제거하여 유니크(유일)하게 만드는 방법 pd.pivot_table() : 피벗테이블 생성 # 인덱스 파라미터에는 유니크하게 만들고 싶은 컬럼의 이름을 적는다 # (기본값으로 수치 데이터를 다 합쳐서 나눈 평균값으로 표시된다) >>> pd.pivot_table(df, index= ['컬럼']) >>> pd.pivot_table(df, index= ['컬럼1','컬럼2']) # 기본값이 아닌 다른 함수 지정 aggfunc= >>> pd.pivot_table(df, index= ['컬럼'], aggfunc= 함수) >>> pd.pivot_table(df, index= ['컬럼'], aggfunc= [함수,.. 2022. 11. 30.
[Python] Pandas 데이터 프레임, 리스트로 변경하기 to_frame(), to_list() 📝파이썬 판다스 시리즈(1차원데이터)를 데이터프레임, 리스트로 변경하기 to_frame() : 변수 데이터값을 데이터 프레임으로 만들어준다 >>> 시리즈를 저장한 변수.to_frame() >>> df['컬럼'].value_counts().to_frame() to_list() : 변수 데이터값을 리스트로 만들어준다 >>> 시리즈를 저장한 변수.to_list() 2022. 11. 30.
[Python] Pandas DataFrame 컬럼 원하는 문자열 가져오기(문자열 슬라이싱) 📝파이썬 판다스 데이터프레임 문자열 슬라이싱 df['컬럼'].str[ ] : 해당 컬럼의 원하는 문자열을 슬라이싱한다 # 해당 컬럼의 원하는 문자열만 가져올 수 있다(슬라이싱) >>> df['컬럼명'].str[:-2+1] 결과값 : 중부서 > 중부 >>> '서울' + df['관서명'].str[:-2+1] + '경찰서' 결과값 : 중부서 > 서울중부경찰서 2022. 11. 30.
[Python] Pandas DataFrame 차트 만들기 plot() 📝파이썬 판다스 데이터프레임 차트 만들기 df. plot() : x축에 인덱스를 셋팅하고 y축에는 모든 컬럼의 데이터를 셋팅한 차트를 만들어준다 # 모든 컬럼을 차트로 만들기 >>> df.plot() # 특정 컬럼을 차트로 만들기 >>> df['컬럼'].plot() # 파라미터에 kind= 'bar' 입력시 bar모양 차트가 생성 >>> df['컬럼'].plot(kind= 'bar') # h를 추가 입력시 y축을 기준으로 차트 생성 >>> df['컬럼'].plot(kind= 'barh') 2022. 11. 29.
[Python] Pandas xls 파일 불러오기 pd.read_excel() 📝파이썬 판다스 xls 파일 불러오기 pd.read_excel('xls파일명') : xls파일 불러오기 ※ header= a a행 부터 가져온다 usecols= 'B, D, G, J, N' 해당 열만 가져온다 >>> pd.read_excel('xls파일', header= a, usecols= 'B, D, G, J, N') # header= a a행 부터 가져온다 # usecols= 'B, D, G, J, N' 해당 열만 가져온다 2022. 11. 29.
[Python] Pandas DataFrame 변경, 추가하기 📝파이썬 판다스 데이터프레임 데이터 변경, 추가하기 데이터값을 변경하고 싶을때는 데이터를 엑세스[ ] 해서 가져온 후 ' = ' 기호를 사용해 변경한다 새로운 컬럼을 만들어 데이터를 추가하고 싶을 때는 df 변수 뒤에 대괄호[ ]를 써준 뒤 그 안에 새로운 컬럼명, ' = ' 기호, 해당 컬럼에 들어갈 데이터를 작성하면 된다 df['새로운 컬럼명'] = ['해당 컬럼에 들어갈 데이터(values)'] 데이터(values)를 추가할때 = 행을 추가할때는 df.append를 사용한다 >>> df = df.append('추가하고싶은 데이터를 입력한 df') 2022. 11. 25.
[Python] Pandas DataFrame 행, 열 삭제하기 drop 📝파이썬 판다스 데이터프레임 행, 열 삭제하기 df.drop('인덱스 or 컬럼' , axis= ) : 삭제하고 싶은 인덱스나 컬럼을 입력하고 axis= 0, 혹은 1을 입력한다 ※ axis=0 : 행 / axis=1 : 열 >>> df.drop('인덱스', axis= 0 ) >>> df.drop('컬럼', axis= 1 ) 2022. 11. 25.