■ 주성분 분석 (PCA, Principal Component Analysis) 주성분 분이란 변수가 가지고 있는 정보의 손실을 최소화 하면서 변수의 차원을 축소하는 분석 기법이다. ■ 차원 축소의 필요성 설명 변수(feature)가 많으면 학습 속도가 느려진다. 의미 없는 feature들로 인해서 과적합이 되거나 학습이 제대로 되지 않는다. 차원을 축소하면 데이터를 시각화로 표현하기 쉽다. ■ 차원의 저주 ■ 주성분 분석의 필요성 데이터의 feature가 늘어날 때마다 차원은 증가한다. 차원이 증가할수록 공간의 부피가 기하급수적으로 증가하면서 데이터의 밀도가 매우 낮아진다. 1차원에서는 데이터의 밀도가 3/10으로 전체 데이터의 약 30%를 포함 2차우너에서는 데이터의 밀도가 1/10으로 전체 데이터의..