■ K-평균 군집 (K-Means Clustering) 군집 (Clustering) 데이터를 여러 개의 군집으로 묶는 분석 방법 유사한 개체들을 군집으로 그룹화하여 각 집단의 성격을 파악 같은 군집에 속하는 데이터는 다른 군집에 속하는 데이터들보다 유사성이 높다 주어진 데이터를 k개의 군집으로 묶는 알고리즘으로, means는 각 데이터로부터 그 데이터가 속한 클러스터의 중심까지의 평균 거리이고 이 값을 최소화하는 것이 알고리즘의 목표 데이터가 연속형일 때 사용한다 (명목형 데이터는 직선 거리를 구할 수 없기 때문) 군집 수행 과정 Step-1 : k개의 임의의 중심점(centroid)을 배치, 각 데이터들에 대해 중심점과의 거리 계산 (유클리드 거리) Step-2 : 모든 데이터를 가장 가까운 군집 중심..