728x90
지도 학습 분류 문제
랜덤 포레스트 분류
- 환경 준비
- 데이터 준비
- 모델링
1. 환경준비 |
# 라이브러리 불러오기 from sklearn.ensemble import RandomForestClassifier |
2. 데이터 준비 |
data = pd.read_csv('데이터.csv') target = 'medv' # 데이터 분리 x = data.drop(target, axis=1) y = data.loc[:,target] # 학습용, 평가용 데이터 분리 from sklearn.model_selection import train_test_split x_train, x_test, y_train, y_test = train_test_split(x,y, test_size = 0.3, random_state = 2023) |
4. 모델링 |
# 선언하기 model = RandomForestClassifier(max_depth=5, random_state=1) # 학습하기 model.fit(x_train_s, y_train) # 예측하기 y_pred = model.predict(x_test) # 평가하기 print(confusion_matrix(y_test, y_pred)) print(classification_report(y_test, y_pred)) |
728x90
'데이터 - 머신러닝 지도 학습' 카테고리의 다른 글
지도 학습] 회귀 KNeighborsRegression (0) | 2023.09.23 |
---|---|
지도 학습] 분류 - LogisticRegression (0) | 2023.09.21 |
지도 학습] XGBClassifier (0) | 2023.09.21 |
지도 학습] 모델 저장 (0) | 2023.09.21 |
지도 학습] 분류 - 결정트리 DecisionTreeClassifier (0) | 2023.09.20 |