Preprocessing Label encoder 이름으로 되어있는 것들을 숫자로, 혹은 그 반대로 변환해줌 One hot encoder 가변수 (dummy variable) 범주형 변수를 0 또는 1값을 가진 하나 이상의 새로운 특성으로 바꾼 것. 예를 들어, '성별' 이라는 특성이 있었다면 여성, 남성 이라는 특성을 만들고 각 데이터별로 여성이면 여성1, 남성0, 남성이면 반대. 이런식으로 데이터를 변경해준단 뜻인듯 Standardization 특성들이 모두 비슷한 영향력을 행사하도록 값을 변환해주는 기술 ex) 1000 점 만점인 시험에서 90점과 100점 만점인 시험에서 90점은 다르다는 것 cf) Normalization: 값의 범위를 0~1로 옮긴다. 표준화는 정규분포의 표준화 공식을 이용한다..