[ML] 개념 및 종류

데이터 분석/머신러닝

eunnys 2023. 11. 15. 10:14

■ 머신러닝의 정의

기계가 일일이 코드로 명시하지 않은 동작을 데이터로부터 학습하여 실행할 수 있도록 알고리즘을 개발하는 연구분야 (아서 사무엘)

- 데이터로부터 유용한 규칙, 지식 표현 또는 판단 기준 등을 추출한다는 점에서 데이터 마이닝이나 통계 및 수학적 최적화 문제와 관련이 깊음

▶ 학습(Learning)

- 인간 : 대부분의 사람들은 순식간에 인식

- 컴퓨터 : 각 숫자를 구분하는 법칙이나 알고리즘을 찾아야 함 (숫자를 나누는 기준 정립)

■ 머신러닝의 종류

■ 지도학습(Supervised Learning)

목표변수(y)의 값이 존재하는 데이터를 학습하는 학습방법
표식이 있는 자료, 또는 해답이 있는 자료를 대상으로 입력자료 x로부터 y의 예측을 학습하는 방법
y를 예측하기 위한 모형 도출
y는 레이블, 정답, 타겟, 종속변수
분류학습(Classification) y가 범주형 데이터인 경우 : 스펨필터, 손글씨 인식, 얼굴인식, x-ray 질병유무 판별
회귀학습(Regression) y가 연속형 변수인 경우 : 주식예측, 특정 제품 선호 소비자 연령 예측, 기온 예측
대표적 분석 알고리즘 : Decision Tree, KNN, Linear Regression, Neural Network, Logistic Regression, Support Vector Machine(SVM)

■ 비지도학습(Unsupervised Learning)

목표변수(y)의 값이 존재하지 않는 데이터를 학습하는 학습방법
자료에 숨겨진 구조를 찾고자 하는 학습방법
y가 없기 때문에 찾아낸 구조나 패턴이 얼마나 정밀한지에 대한 검증 불가
데이터 내에서 구조의 특징을 정의하기 위한 모형 도출
군집학습(Clustering) x의 유사성을 이용해 몇개의 그룹으로 분류 : 고객특성분류, 음향/영상 주제별 분류
잠재요인추출(Latent Factor extraction) x에서 관측되지 않은 잠재 요인을 추출 : 주성분분석, 선형판별분석, 커널방법
대표적인 분석 알고리즘 : K-means, Neural Network, PCA

■ 강화학습(Reinforcement Learning)