본문 바로가기

데이터 분석

ADP) 데이터 분석 개요: 데이터 마이닝 평가 기준

데이터 마이닝 분야에서 모델의 성능을 평가하는 데는 다음과 같은 요소들이 활용된다.

 

 

1. 정확도

 

정확도란 모델이 예측한 결과 중 True를 True라고 답한 빈도와 False를 False라고 답한 값의 빈도를 합한 것이다.

 

 

2. Lift Chart

x축 = 사용된 데이터 셋의 비율, y축 = 타겟에 대한 예측도

모델의 예측이 100%에 도달하기 위해 필요한 데이터셋의 비율을 시각적으로 보여주는 차트. 위 그림에서 진한 파란색이 이상적인 모델의 그림을 나타낸다.

 

3. Detect Rate(= recall, 검출율)

예측하고자 하는 바를 얼마나 잘 예측하였는지에 대한 지수

 

일반적으로 검출율이 높을수록 정확도가 낮다. 애매한 것들도 다 True라고 반환하기 때문에 False를 잘 못잡아내기 때문.

 

 

참고

sumniya.tistory.com/26

 

 

 

다음 시간

데이터 처리 구조, EDA 4가지 주제