목록머신러닝 (2)
바르고 뜨겁게
의사결정트리 (DecisionTree) 의사결정트리 진행순서DefineProblem, CollectTrainingData - 문제인식,데이터수집ExtractData, Build a tree - 분류, 트리생성DeployMachineTest분류 트리생성효율적으로 많은 분류가 되도록 생성한다. (InformationGain을 높게 생성한다.)entropy : 혼잡도 InformationGain = base entropy - new entropy 원본 출처 (해당 포스팅은 아래 출처를 통해 공부한 내용입니다.)https://www.inflearn.com/course/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D%EC%9D%B4%EB%A1%A0-%ED%8C%8C%EC%9D%B4%EC%8D%A..
최근접 이웃 알고리즘 kNN (k -NearestNeighbors) algorithm 상단의 그래프에 있는 녹색별은 액션영화인지 로맨틱영화인지 구분하기 모호한 영화이다. 그렇다면 이 영화가 액션영화인지 로맨틱영화인지 어떻게 하면 구분할 수 있을까?( 파란동그라미와 하트는 각각 액션영화와 로맨틱영화들로, 각각의 영화에서 등장한 Kick 과 Kiss의 값을 가지고 있다. )영화에서 Kick의 등장 횟수와, Kiss의 등장횟수의 데이터를 가지고 다른 영화와 비교하여 kNN 알고리즘을 사용해 알아보자.k : 최근접점을 몇개까지 볼것인가? (보통 홀수를 사용)k = 3으로 설정하고 예측값을 알아보자. 각 영화간의 거리를 피타고라스의정의로 구한 뒤 비교하면 예측값을 구할 수 있다. 원본 출처 (해당 포스팅은 아래 ..