본문 바로가기

Python88

[Python] Numpy array 최대, 최소값 구하기 argmax, argmin 파이썬 넘파이 데이터 최대, 최소값 구하기 .argmax( ) : 최대값이 들어있는 인덱스를 반환 .argmin( ) : 최소값이 들어있는 인덱스를 반환 # 최대값이 들어있는 인덱스를 출력 >>> 변수.argmax( ) # 최소값이 들어있는 인덱스를 출력 >>> 변수.argmin( ) ※ 각 행이나 열별로 구하고 싶을때는 axis=() 사용 2022. 11. 25.
[Python] Pandas DataFrame 변경, 추가하기 📝파이썬 판다스 데이터프레임 데이터 변경, 추가하기 데이터값을 변경하고 싶을때는 데이터를 엑세스[ ] 해서 가져온 후 ' = ' 기호를 사용해 변경한다 새로운 컬럼을 만들어 데이터를 추가하고 싶을 때는 df 변수 뒤에 대괄호[ ]를 써준 뒤 그 안에 새로운 컬럼명, ' = ' 기호, 해당 컬럼에 들어갈 데이터를 작성하면 된다 df['새로운 컬럼명'] = ['해당 컬럼에 들어갈 데이터(values)'] 데이터(values)를 추가할때 = 행을 추가할때는 df.append를 사용한다 >>> df = df.append('추가하고싶은 데이터를 입력한 df') 2022. 11. 25.
[Python] Pandas DataFrame 행, 열 삭제하기 drop 📝파이썬 판다스 데이터프레임 행, 열 삭제하기 df.drop('인덱스 or 컬럼' , axis= ) : 삭제하고 싶은 인덱스나 컬럼을 입력하고 axis= 0, 혹은 1을 입력한다 ※ axis=0 : 행 / axis=1 : 열 >>> df.drop('인덱스', axis= 0 ) >>> df.drop('컬럼', axis= 1 ) 2022. 11. 25.
[Python] Pandas DataFrame 인덱스, 컬럼명 변경하기 rename() 📝파이썬 판다스 데이터프레임 인덱스, 컬럼명 변경하기 df.rename(index={'기존 인덱스' : '입력하고싶은 인덱스'}) : 기존에 있는 인덱스명을 변경한다 >>> df.rename(index={'기존 인덱스' : '입력하고싶은 인덱스'}) # 두가지 이상 변경할시 >>> df.rename(index={'기존 인덱스' : '입력하고싶은 인덱스', '기존 인덱스' : '입력하고싶은 인덱스'}) df.rename(columns={'기존 컬럼' : '입력하고싶은 컬럼'}) : 기존에 있는 컬럼명을 변경한다 >>> df.rename(columns={'기존 컬럼' : '입력하고싶은 컬럼'}) # 두가지 이상 변경할시 >>> df.rename(columns={'기존 컬럼' : '입력하고싶은 컬럼', '기존.. 2022. 11. 25.
[Python] Pandas DataFrame 인덱스 변경, 초기화 set_index(), reset_index() 📝파이썬 판다스 데이터 프레임 인덱스 변경, 초기화 df.set_index('컬럼') : 기존에 있는 컬럼의 값을 인덱스로 만든다 ※ 뒤에 써준 inplace=True는 메모리 자체를 변경한다는 뜻 >>> df.set_index('컬럼') # 메모리 자체를 변경할시 >>> df.set_index('컬럼', inplace=True) df.reset_index() : 인덱스를 원래대로(컴퓨터가 매기는 인덱스) 초기화 시킨다 >>> df.reset_index() 2022. 11. 25.
[Python] Pandas DataFrame 데이터 확인하기 head(), tail(), describe(), shape, columns, info() 📝파이썬 판다스 데이터프레임 데이터 확인하기 .head() : 데이터 프레임의 맨 윗부분 데이터를 5개 확인한다 (숫자를 입력시 해당 숫자만큼 보여준다) >>> df.head() # 숫자를 입력시 해당 숫자만큼 보여준다 >>> df.head(2) # 2개 출력 .tail() : 데이터 프레임의 맨 끝부분 데이터를 5개 확인한다 (숫자를 입력시 해당 숫자만큼 보여준다) >>> df.tail() # 숫자를 입력시 해당 숫자만큼 보여준다 >>> df.tail(2) # 2개 출력 .describe() : 데이터 프레임의 숫자데이터 통계치를 제공한다(문자열도 가능하다) >>> df.describe() .shape : 데이터 프레임의 데이터 행, 열 갯수를 확인한다 >>> df.shape .columns : 데이터.. 2022. 11. 25.
[Python] Pandas DataFrame 유일한 값 찾기 unique(), nunique(), value_counts() 📝파이썬 판다스 데이터프레임 유일한 값 찾기 unique() : 데이터에 유일한 값들이 어떠한 종류가 있는지 알려준다 >>> df['컬럼'].unique() nunique() : 데이터에 유일한 값들의 총 갯수를 알려준다 >>> df['컬럼'].nunique() value_counts() : 값별로 데이터의 수를 출력해준다 # 데이터 숫자가 큰 순서대로(내림차순) 정렬된다 >>> df['컬럼'].value_counts() 2022. 11. 25.
[Python] Pandas DataFrame 합치기 pd.concat(), pd.merge() 📝파이썬 판다스 데이터프레임 합치기 pd.concat( [df1, df2, df3] ) : 컬럼 이름이 동일하면 여러 데이터 프레임을 하나로 합칠 수 있다 # 리스트 안에 데이터 프레임 변수를 입력한다 >>> pd.concat([df1, df2, df3]) # df : 데이터프레임 약자 pd.merge(df, df, on= , how= ) : 두 데이터 프레임의 공통 컬럼이 있으면 이 컬럼을 기준으로 하나로 합칠 수 있다 ※ 두 데이터 프레임에 공통으로 있는 데이터만 합쳐준다 (교집합) 데이터 프레임 2개만 가능하다 # 합칠 데이터 프레임 두개 입력 후, on=뒤에 공통되는 컬럼명을 입력 >>> pd.merge(df1, df2, on= 'Employee ID') # 마지막 how= 'left'를 입력해주.. 2022. 11. 25.
[Python] Pandas DataFrame 문자열 포함, 제외 여부 확인 str.contains(), str.startswith() 📝파이썬 판다스 데이터프레임 문자열 포함, 제외 여부 확인하기 df['컬럼'].str.contains('a') : 데이터프레임의 해당 컬럼에 어떤 문자열(a)을 포함하고 있는지 True, False로 알려준다 ※ 문자열 뒤에 아무것도 입력하지 않으면 디폴트값 case=True이 적용되고 case=False값을 입력하면 대소문자 상관없이 가져온다 ※ 앞에 물결(~) 표시 입력시 True 와 False 를 바꿔준다 ※ 판다스 공식 홈페이지 참고하기 https://pandas.pydata.org/docs/reference/api/pandas.Series.str.upper.html # 해당 문자열 포함 여부 확인 >>> df['컬럼'].str.contains('찾을 문자열', case=False) # 해당 문자.. 2022. 11. 25.
[Python] Pandas DataFrame 정렬하기 sort_values(), sort_index() 📝파이썬 판다스 데이터프레임 정렬하기 df.sort_values('컬럼') : 데이터 프레임의 데이터(밸류)를 해당 컬럼을 기준으로 오름차순 정렬한다 ※ 컬럼 뒤에 ascending=False 입력시 내림차순 정렬 된다(ascending=False만 입력 가능) # 기준으로 정렬하고 싶은 컬럼만 입력시 오름차순 정렬 >>> df.sort_values('컬럼') # 컬럼 뒤에 ascending=False 입력시 내림차순 정렬 >>> df.sort_values('컬럼', ascending=False) # 컬럼을 두개 입력시 컬럼1으로 정렬 후, 컬럼2로 정렬 >>> df.sort_values( ['컬럼1','컬럼2'] ) # 컬럼1, 2를 내림차순 오름차순 각각 다르게 정렬할 경우 ascending=에 순서.. 2022. 11. 25.