■ K-Nearest Neighbors (K-최근접 이웃) 새로운 입력 데이터를 받으면 기존 클러스터에서 모든 데이터와 유클리드 기반 거리를 측정 후 가장 많은 속성을 가진 클러스터에 할당하는 분류 알고리즘 학습 단계에서 학습된 데이터를 벡터 공간성에 위치시킨 후, 추론 단계에서 새로운 데이터를 같은 공간에 배치한 후 새 데이터가 어떤 카테고리에 속하는지 알기 위해서는 가까이에 있는 k개의 정답 데이터를 보고 추론 ■ KNN의 원리 - k = 2인 경우 가장 가까운 이웃이 각각 하나씩 나오기 떄문에 어떤 값으로 분류를 해야할지 알 수 없음 - 따라서, k의 값을 동등한 값이 나오지 않도록 하기 위해 홀수로 지정하는 것이 바람직하다 - 가장 최적의 k를 구하는 것이 관건