■ 다중공선성(multicollinearity) - 독립 변수의 일부가 다른 독립 변수의 조합으로 표현될 수 있는 경우이다. - 독립 변수들이 서로 독립이 아니라 상호상관관계가 강한 경우에 발생한다. ■ 다중공선성 여부 판단 기준 - 독립변수간 상관계수 r >= 0.9 - 각 변수의 분산팽창지수(VIF, Variance Inflation Factor) >= 10 ■ 다중공선성 문제 해결방법 - 다중공선성을 가지는 변수 중 하나를 제거 (제거 시 R^2가 유지되는 변수를 제거) - VIF 값이 가장 높은 독립변수를 하나씩 제거하여 모든 VIF 값이 10 이하가 되도록 한다. - PCA 를 이용한 변수 축소 - 정규화(Regulation) ※ 다중공산성 문제가 없다면 변수 선택 과정으로 넘어간다. ■ 변수 ..