앙상블: 에다부스트

이론공부/머신러닝

앙상블: 에다부스트

넹넹선생님 2024. 4. 8. 09:34

728x90

2. Boosting ()

다양한 알고리즘 존재

- 에다 부스트(Adaboost)

: 스텀프 모델들을 이용하여 성능주의적 예측

- 중요도를 이용하여 스텀프 추가하기

- 실

from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.ensemble import AdaBoostClassifier

import pandas as pd

# 데이터 셋 불러 오기
cancer_data = load_breast_cancer()

# 챕터 1 유방암 데이터 준비하기 과제에서 쓴 코드를 갖고 오세요
X = pd.DataFrame(cancer_data.data, columns=cancer_data.feature_names)
y = pd.DataFrame(cancer_data.target, columns=['class'])
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, random_state=5)
y_train = y_train.values.ravel()

# 여기에 코드를 작성하세요
model = AdaBoostClassifier(n_estimators=50, random_state=5)
model.fit(X_train, y_train)
predictions = model.predict(X_test)
score = model.score(X_test,y_test)

# 테스트 코드
predictions, score

728x90

'이론공부 > 머신러닝' 카테고리의 다른 글

데이터 전처리: one-hot encoding (1)	2024.04.09
데이터 전처리: standardization (0)	2024.04.09
데이터 전처리: feature scaling (0)	2024.04.04
앙상블-결정트리, bagging (RandomForest), boosting (Adaboost) (1)	2024.04.03
결정 트리, gini impurity, (0)	2024.04.01

현재글앙상블: 에다부스트

데싸 되기

250x250

데이터프레임, 엑셀 매클, 백준, RAG, columns, lilysai, 자동화, topological data analytics, 코드, excel macrow, 파이썬, 항상고정, dataframe, 매크로, 코테, llm, 최신llm, chatGPT, logit계산, Python,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

데싸 되기