머신러닝
[머신러닝] 최근접 이웃 알고리즘 kNN (k-NearestNeighbors) algorithm
RightHot
2018. 12. 21. 00:42
최근접 이웃 알고리즘 kNN (k -NearestNeighbors) algorithm
상단의 그래프에 있는 녹색별은 액션영화
인지 로맨틱영화
인지 구분하기 모호한 영화이다. 그렇다면 이 영화가 액션영화
인지 로맨틱영화
인지 어떻게 하면 구분할 수 있을까?
( 파란동그라미와 하트는 각각 액션영화와 로맨틱영화들로, 각각의 영화에서 등장한 Kick
과 Kiss
의 값을 가지고 있다. )
영화에서 Kick
의 등장 횟수와, Kiss
의 등장횟수의 데이터
를 가지고 다른 영화와 비교하여 kNN 알고리즘을 사용해 알아보자.
k : 최근접점을 몇개까지 볼것인가? (보통 홀수를 사용)
k = 3
으로 설정하고 예측값을 알아보자.
각 영화간의 거리를 피타고라스의정의
로 구한 뒤 비교하면 예측값을 구할 수 있다.
원본 출처 <머신러닝이론-파이썬실습> (해당 포스팅은 아래 출처를 통해 공부한 내용입니다.)