2. Boosting ()
다양한 알고리즘 존재
- 에다 부스트(Adaboost)
: 스텀프 모델들을 이용하여 성능주의적 예측
- 중요도를 이용하여 스텀프 추가하기
- 실
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.ensemble import AdaBoostClassifier
import pandas as pd
# 데이터 셋 불러 오기
cancer_data = load_breast_cancer()
# 챕터 1 유방암 데이터 준비하기 과제에서 쓴 코드를 갖고 오세요
X = pd.DataFrame(cancer_data.data, columns=cancer_data.feature_names)
y = pd.DataFrame(cancer_data.target, columns=['class'])
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, random_state=5)
y_train = y_train.values.ravel()
# 여기에 코드를 작성하세요
model = AdaBoostClassifier(n_estimators=50, random_state=5)
model.fit(X_train, y_train)
predictions = model.predict(X_test)
score = model.score(X_test,y_test)
# 테스트 코드
predictions, score
'이론공부 > 머신러닝' 카테고리의 다른 글
데이터 전처리: one-hot encoding (0) | 2024.04.09 |
---|---|
데이터 전처리: standardization (0) | 2024.04.09 |
데이터 전처리: feature scaling (0) | 2024.04.04 |
앙상블-결정트리, bagging (RandomForest), boosting (Adaboost) (0) | 2024.04.03 |
결정 트리, gini impurity, (0) | 2024.04.01 |