■ 분류 분석(Classification Analysis) * 정의 - 종속변수가 범주형인 데이터에 대해 데이터의 유사성(특이성이 비슷한)이 높은 것들을 같은 종류로 분류가 되도록 하는 분석방법 * 용도 - 종속변수가 미리 결정된 범주 중 하나에 속할 가능성 또는 확률을 예측 - 미래 데이터 세트에서 동일한 패턴(유사한 시퀀스, 단어 또는 감정)을 찾고자 할 때 사용 - 이메일 스펨 분류, 고객의 유형 분류 등 종속변수가 범주형 값을 갖는 데이터를 예측하는데 주로 활용 * 종류 - 로지스틱 회귀분석 : 종속변수가 범주형 변수일 때 사용하는 회귀분석 - 의사결정트리 : 나무 형태의 그래프로 의사 결정을 표현하여 데이터를 분류하는 알고리즘 - 나이브베이즈 : 데이터 집합의 예측 변수가 독립적으로 가정하는 분..