이론공부/머신러닝

앙상블: 에다부스트

넹넹선생님 2024. 4. 8. 09:34
728x90
반응형

   2. Boosting ()

   다양한 알고리즘 존재

 

- 에다 부스트(Adaboost)

: 스텀프 모델들을 이용하여 성능주의적 예측

스텀프: 주로 50%보다 조금 나은 성

 

잘 맞출수록/ 못 맞출수록 성능을 기하급수적으로 늘림/줄임

 

 

- 중요도를 이용하여 스텀프 추가하기

 

- 실

from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.ensemble import AdaBoostClassifier

import pandas as pd

# 데이터 셋 불러 오기
cancer_data = load_breast_cancer()

# 챕터 1 유방암 데이터 준비하기 과제에서 쓴 코드를 갖고 오세요
X = pd.DataFrame(cancer_data.data, columns=cancer_data.feature_names)
y = pd.DataFrame(cancer_data.target, columns=['class'])
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, random_state=5)
y_train = y_train.values.ravel()

# 여기에 코드를 작성하세요
model = AdaBoostClassifier(n_estimators=50, random_state=5)
model.fit(X_train, y_train)
predictions = model.predict(X_test)
score = model.score(X_test,y_test)

# 테스트 코드
predictions, score

728x90
반응형