[ML] 10. 앙상블

데이터 분석/머신러닝

[ML] 10. 앙상블 - Boosting

eunnys 2023. 11. 23. 16:53

▶ Boosting - Regressor

from sklearn.datasets import load_diabetes
from sklearn.ensemble import GradientBoostingRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score
import numpy as np
import pandas as pd

from sklearn.preprocessing import MinMaxScaler

x, y = load_diabetes(return_X_y=True)
x = MinMaxScaler().fit_transform(x)
x_train, x_test, y_train, y_test = train_test_split(x, y, train_size=0.8, random_state=10)

# 모델 생성 및 학습
gb_r = GradientBoostingRegressor(random_state=10, alpha=0.9, n_estimators=40, max_depth=3) 
# 회귀모형 40개
gb_r.fit(x_train, y_train)

# 예측 및 평가
y_hat = gb_r.predict(x_test)

print(f'결정계수: {r2_score(y_test, y_hat):.3f}')

결정계수: 0.486

▶ Boosting - Classifier

from sklearn.datasets import load_breast_cancer
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, precision_score, recall_score, roc_curve, roc_auc_score, confusion_matrix 
from sklearn.model_selection import train_test_split
import pandas as pd

breast = load_breast_cancer()

df = pd.DataFrame(breast.data, columns=breast.feature_names)
df['target'] = breast.target
data_x = breast.data
data_y = breast.target

x_train, x_test, y_train, y_test = train_test_split(data_x, data_y, train_size=0.8, random_state=10, stratify=data_y)

# 모델 생성 및 학습
gb_c = GradientBoostingClassifier(random_state=10)
gb_c.fit(x_train, y_train)

# 예측 및 평가
y_hat = gb_c.predict(x_test)

print(f'정확도: {accuracy_score(y_test, y_hat):.3f}')
print(f'AUC: {roc_auc_score(y_test, gb_c.predict_proba(x_test)[:,1]):.3f}')

정확도: 0.956
AUC: 0.996

'데이터 분석 > 머신러닝' 카테고리의 다른 글

[ML] 비지도학습 알고리즘 - 군집분석 (0)	2023.11.23
[ML] 데이터 분석 실습 (비행기 연착 추측 분류) (0)	2023.11.23
[ML] 9. 앙상블 - Voting (0)	2023.11.23
[ML] 8. 앙상블 - Bagging (0)	2023.11.22
[ML] 7. KNN (0)	2023.11.22

현재글[ML] 10. 앙상블 - Boosting

비전공자와 함께 데이터분석 뿌시기!

map, 컴파일옵션, 최적화함수, 혼동행렬, text_mining, 보스톤집값예측, 평가지표, 비용함수, 군집분석, 최근접이웃협업필터링, 파이썬, 문서_군집화, 원핫인코딩, 교차검증, 붓꽃품종예측, 나이브베이즈, 전방_후방_탐색, 유방암판별예측, 추천알고리즘, 라벨인코딩,

Today :
Yesterday :

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

같이 데이터분석 공부할 사람 ༼ つ ◕_◕ ༽つ

[ML] 10. 앙상블 - Boosting

'데이터 분석 > 머신러닝' 카테고리의 다른 글

'데이터 분석/머신러닝'의 다른글

티스토리툴바

[ML] 10. 앙상블 - Boosting

'데이터 분석 > 머신러닝' 카테고리의 다른 글

'데이터 분석/머신러닝'의 다른글

관련글

티스토리툴바