목록머신러닝 (3)
취미와 밥줄사이
KNN (K-Nearest 0Neighbors) 새로운 데이터 생겼을 때, 이를 어디로 분류해야 할까요? 왜 빨간색으로 분류를 했을까요? KNN 알고리즘 ** - 내 주위에 몇 개의 이웃을 확인해 볼 것인가를 결정한다. == > K** 새로운 데이터 발생 시, Euclidean distance에 의해서, 가장 가까운 k개의 이웃을 택한다. K개의 이웃의 카테고리를 확인한다. 카테고리의 숫자가 많은 쪽으로, 새로운 데이터의 카테고리를 정해버린다.
Regression 성능평가 (Regression Metrics) Mean Squeared Error (MSE) Root Mean Squared Error (RMSE) Mean Absolute Error (MAE) R Squared (R**2) Adjusted R Squared (R**2) Mean Square Percentage Error (MSPE) Mean Absolute Percentage Error (MAPE) Root Mean Squared Logarithmic Error (RMSLE) 분류의 문제에서의 성능 평가 방법 성능측정 True Positive(TP): 실제 True인 정답을 True라고 예측 (정답) False Positive(FP): 실제 False인 정답을 True라고 예측 (오..
Supervised Learning 우리는 iris꽃의 곷잎의 길이와 넓이, 꽃받침의 길이와 넓이 데이터를 가지고 있다. 이 데이터를 가지고, Iris 꽃 (붓꽃)의 품좀을 분류할 수 있는 분류기를 만들 수 있다. 따라서, 새로운 꽃잎의 길이와 넓이, 꽃받침의 길이와 넓이에 대한 데이터를 입력하면, 이 붓꽃이 어떤 품종인지 분석이 가능하다. 이렇게 분류할 수 있는 분류기(classifier)를 만들기 위해서는 데이터가 필요하며, 학습을 하기 위해서는, 이 데이터 뿐만 아니라 품종이라는 결과를 학습 시키기 위해서 데이터와 매핑된 품종 데이터도 함께 필요하다. 즉 품종에 대한 데이터를 Lable이라고 한다. 이러한 레이블이 있는 데이터를 학습시키는 것이 지도학습이다. 레이블 가지고 학습시키는 방법을 지도 학..