[ML] 추천 알고리즘

데이터 분석/머신러닝

eunnys 2023. 11. 27. 15:27

■ 최근접 이웃 협업 필터링

사용자가 아이템에 매긴 평점 정보나 상품 구매 이력과 같은 사용자 행동 양식을 기반으로 추천
User-Item Matrix Concept
- 사용자가 평가한 다른 아이템을 기반으로 사용자가 평가하지 않은 아이템의 예측 평가를 도출하는 방식

■ 아이템 기반 최근접 이웃 협업 필터링

최근접 이웃 협업 필터링을 통한 개인화된 영화 추천은 개인이 아직 관람하지 않은 영화를 추천하는 방식
아직 관람하지 않은 영화에 대해 아이템 유사도와 기존에 관람한 영화의 평점 데이터를 기반으로 새롭게 모든 영화의 예측 평점을 계산한 후 높은 예측 평점을 가진 영화를 추천하는 방식

■ 잠재 요인 협업 필터링

■ 잠재 요인 협업 필터링 - 특이값 분해 (SVD)

각 3개의 행렬은 다음과 같은 조건을 만족한다,

- U : m x m 직교행렬

- V : n x n 직교행렬

- E : m x n 직사각 대각행렬

SVD는 NaN 값이 없는 행렬에만 적용할 수 있다. 하지만 R 행렬(사용자-영화 평점 행렬)에는 아직 평점되지 않은 많은 Null 값이 있기 때문에 P와 Q행렬을 일반적인 SVD 방식으로 분해할 수 있다.
이러한 경우에는 확률적 경사 하강법 방식을 이용해 SVD를 수행한다.

■ CountVectorizer

■ 코사인 유사도 (Cosine Similarity)

영화정보에 대해 장르 기준으로 콘텐츠 기반 필터링을 수행하려면 영화 데이터의 개별 레코드에 대해 가장 장르 유사도가 높은 순으로 다른 레코드를 추출해야 한다.
이를 위해 코사인 유사도 행렬의 기준 행렬로 비교 대상이 되는 행의 유사도 값이 높은 순으로 정렬된 행렬의 위치 인덱스 값을 추출한다.

비전공자와 함께 데이터분석 뿌시기!

text_mining, 나이브베이즈, 원핫인코딩, 컴파일옵션, 라벨인코딩, 혼동행렬, 전방_후방_탐색, 최근접이웃협업필터링, 추천알고리즘, 군집분석, 보스톤집값예측, 최적화함수, 문서_군집화, 유방암판별예측, 붓꽃품종예측, 비용함수, 교차검증, 평가지표, map, 파이썬,

같이 데이터분석 공부할 사람 ༼ つ ◕_◕ ༽つ