728x90
반응형
- Min-max normalization
- 계산의 편의를 위해 평균 제곱 오차를 2로 나눠줌 -> 손실 함수
실습:
# 필요한 도구 import
from sklearn import preprocessing
import pandas as pd
PATIENT_FILE_PATH = './datasets/liver_patient_data.csv'
pd.set_option('display.float_format', lambda x: '%.5f' % x)
# 데이터 파일을 pandas dataframe으로 가지고 온다
liver_patients_df = pd.read_csv(PATIENT_FILE_PATH)
# Normalization할 열 이름들
features_to_normalize = ['Total_Bilirubin','Direct_Bilirubin', 'Alkaline_Phosphotase', 'Alamine_Aminotransferase']
# 여기에 코드를 작성하세요
scaler = preprocessing.MinMaxScaler()
normalized_data=scaler.fit_transform(liver_patients_df[features_to_normalize])
normalized_df = pd.DataFrame(normalized_data, columns=features_to_normalize)
# 테스트 코드
normalized_df.describe()
728x90
반응형
'이론공부 > 머신러닝' 카테고리의 다른 글
데이터 전처리: standardization (0) | 2024.04.09 |
---|---|
앙상블: 에다부스트 (0) | 2024.04.08 |
앙상블-결정트리, bagging (RandomForest), boosting (Adaboost) (0) | 2024.04.03 |
결정 트리, gini impurity, (0) | 2024.04.01 |
LASSO, grid search (0) | 2024.04.01 |