데이터 전처리: feature scaling

이론공부/머신러닝

데이터 전처리: feature scaling

넹넹선생님 2024. 4. 4. 16:01

728x90

- Min-max normalization

- 계산의 편의를 위해 평균 제곱 오차를 2로 나눠줌 -> 손실 함수

실습:

# 필요한 도구 import
from sklearn import preprocessing
import pandas as pd

PATIENT_FILE_PATH = './datasets/liver_patient_data.csv'
pd.set_option('display.float_format', lambda x: '%.5f' % x)

# 데이터 파일을 pandas dataframe으로 가지고 온다
liver_patients_df = pd.read_csv(PATIENT_FILE_PATH)

# Normalization할 열 이름들
features_to_normalize = ['Total_Bilirubin','Direct_Bilirubin', 'Alkaline_Phosphotase', 'Alamine_Aminotransferase']

# 여기에 코드를 작성하세요
scaler = preprocessing.MinMaxScaler()
normalized_data=scaler.fit_transform(liver_patients_df[features_to_normalize])
normalized_df = pd.DataFrame(normalized_data, columns=features_to_normalize)
# 테스트 코드
normalized_df.describe()

728x90

'이론공부 > 머신러닝' 카테고리의 다른 글

데이터 전처리: standardization (0)	2024.04.09
앙상블: 에다부스트 (0)	2024.04.08
앙상블-결정트리, bagging (RandomForest), boosting (Adaboost) (0)	2024.04.03
결정 트리, gini impurity, (0)	2024.04.01
LASSO, grid search (0)	2024.04.01

현재글데이터 전처리: feature scaling

데싸 되기

250x250

chatGPT, 엑셀 매클, 파이썬, columns, Python, lilysai, 데이터프레임, dataframe, RAG, logit계산, 항상고정, 코드, excel macrow, llm, 매크로, 자동화, topological data analytics, 백준, 최신llm, 코테,

Today :
Yesterday :

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

데싸 되기