ROC curve
-
ROC Curve를 해석하는 방법Programming & Machine Learning/Mathematics & Statistics 2018. 6. 17. 23:42
머신 러닝에 대한 본격적인 공부를 시작한지 꽤 오랜 시간이 되어가고 있다. 하지만 그 동안 수 없이 접했던 평가에 대한 방법론은 언제나 어렴풋이 이해하는 정도였다. 특히나 ROC curve가 그랬다. 데이터 마이닝이나 통계학 전공자가 아닌 나로서는 이 방법론에 대한 수식적 이해도 전무했으며, 인터넷 어디에서도 속을 시원하게 긁어주는 설명을 찾기 힘들었다. 단지 원인과 결과만을 나열한 문서들 뿐이었다. 언젠가 해법을 찾아야지 하고 미뤄두던 도중, 우연히 제대로 설명된 글을 읽게 되었다. 물론 아직까지도 100% 이해했다고 장담할 순 없지만, 나와 비슷한 사람들을 위해 현재까지 이해한 내용을 정리하고 공유하고자 한다. 분류문제를 학습한 모델을 평가할 때 빠지지 않는 단어가 바로 Confusion Matrix..
-
Confusion Matrix를 통한 분류 모델의 평가Programming & Machine Learning/Mathematics & Statistics 2017. 11. 18. 15:38
분류 모델을 학습하는 것의 목적은, 주어진 데이터를 의도에 맞게 잘 분류해내기 위한 것이다.그렇다면 이러한 모델을 평가하는 기준이 필요할 것이다.모델을 평가할때는 모델이 얼마나 정밀한지, 얼마나 실용적인 분류를 해내었는지, 얼마나 정확한 분류를 했는지를 평가해야 한다.이러한 내용들을 모두 포함하고 있는 것이 Confusion Matrix이다. 1. Confusion Matrix 레이블 0,1을 가진 데이터를 분류한다고 할 때 관심 범주를 1이라고 한다. True Positives : 1인 레이블을 1이라 하는 경우를 True Positives라고 한다. -> 관심 범주를 정확하게 분류한 값.False Negatives : 1인 레이블을 0이라 하는 경우를 False Negatives라고 한다. -> 관심..