📝트레이닝용(학습용)과 테스트용 데이터 나누기
from sklearn.model_selection import train_test_split
train_test_split() : 데이터셋을 학습용과 테스트용으로 나눠준다
train_test_split(X, y, test_size= 0.2, random_state=3)
# test_size= 0.2 테스트에 20% 사용하겠다
# 각 변수에 저장(순서대로 입력)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size= 0.2, random_state=3)
'인공지능 > 데이터 전처리' 카테고리의 다른 글
[데이터 전처리] 데이터 불균형 맞추기 SMOTE() (0) | 2022.12.02 |
---|---|
[데이터 전처리] 데이터 정규화, 표준화 Feature Scaling (0) | 2022.12.01 |
[데이터 전처리] 데이터 레이블 인코딩, 원핫 인코딩 하기 LabelEncoder(), OneHotEncoder() (0) | 2022.12.01 |
[데이터 전처리] 인공지능 만들기 전 준비과정 데이터 전처리하기 (0) | 2022.11.30 |
댓글