대립가설
-
가설의 검정과 p-valueProgramming & Machine Learning/Mathematics & Statistics 2017. 11. 18. 14:57
지도학습의 영역에서 모델을 학습할 때, 가장 중요한 것은 "어떤 변수를 학습에 포함할 것인가?" 라는 질문이라고 할 수 있다.이 질문에 대한 답은 반드시 수치적 해석과 검증을 통한 것이어야 한다.그래서 필요한 것이 변수에 대한 가설의 설정, 이에 대한 검정과 판단이다.변수가 의미있는 변수일 것이란 가설을 세운 뒤 이를 통계적인 방법으로 검정해야 한다. 1. p-value의 의미에 대하여 통계학적 관점에서 가설을 검증하는 방법이다. 어떤 자료에 대한 수치적 특성, 이를테면 평균 같은 것을 구한다고 하자. 하지만 실제의 집단(모집단)은 전수조사 할 수 없기 때문에 주어진 자료는 샘플링된 자료이고, 샘플링이라는 것을 통해 실제 집단의 수치적 특성을 추론해야 한다. 예를 들어 실제 모집단의 평균이 50, 분산이..