[통계 기초의 모든것 올인원] 메타코드 강의 후기 - 검정
https://mcode.co.kr/video/list2?viewMode=view&idx=94
가설검정 정리
일반적으로 제 1종 오류가 더 중요하다.
신약을 예시로 들면 좀 더 이해하기 편하다.
귀무가설이 "신약이 기존 약과 큰 약효의 차이가 없다"라고 했을 때,
제 1종 오류를 범한다면 신약이 약효가 있음에도 없다고 하는 것이 된다. 비즈니스적으로는 불리한 점이 생기지만 치명적인 문제는 생기지 않게 된다.
검정 - 요소
p-value는 데이터에서 계산하는 것이다.
미리 지정해둔 값 알파보다 계산된 p-value가 크다면 귀무가설을 기각한다.
예시) 알파가 0.05라면, p-value가 0.05 미만으로 나온 상황에서는 귀무가설을 기각한다.
기각역과 채택역에서는 검정통계량의 관측값이 어디에 속하는지 확인하고, 기각역에 속한다면 귀무가설을 기각한다.
검정의 종류
양측 검정에서는 양쪽에 있는 너비의 합이 알파가 되도록 한다.
즉, 각각의 영역의 너비는 ( 알파 / 2)이다.
단측 검정에서는 한 쪽에 있는 영역의 너비가 알파가 되도록 한다.
양측 검정에서는 같지 않다, 단측 검정에서는 크다 혹은 작다로 부등호를 정한다.
검정 - 모평균 검정, 표본의 크기가 큰 경우
표본의 크기가 크다면, 모분산을 알든 모르든 Z 검정 통계량을 사용할 수 있다.
다만, 모분산을 아냐 모르느냐에 따라 모평균(시그마)를 사용할지 표본평균(S)를 사용할지는 나뉘게 된다.
표본이 크기 때문에 x bar 자체는 정규분포를 따르게 된다.
계산된 Z 값을 아래의 표에 따라 적용하면 귀무가설을 채택할지 기각할지를 정할 수 있다.
검정 - 모비율 검정 예제
발병률이 3%인데, 100명( n=100 )을 대상으로 조사하니 2명으로 확률보다 더 낮게 나온 상황이다.
이 문제는 이항검정법으로 접근한다.
알파가 0.05로 나왔으니, 임계값 c를 찾는 것이 목표이다.
e 위에 지수가 3인 이유는 np로 계산하기 때문이다. n = 100이고, p = 0.03이므로 계산 결과는 3이 된다.
모비율 검정
"p0", "q0"는 귀무가설이 맞다는 가정에서의 값을 말한다.
분자에서는 P에 대한 기댓값이 "p0"라는 가정으로 빼는 과정을 수행하는 것이다.
분모에서도 마찬가지 논리로 Standard Error를 계산하는 것이다.
예시로는, "상대방 말이 맞다는 전제 하에서 논리를 전개해보고 오류가 생기는지 확인하는 것이다"를 들어주었다.
'통계 - 메타코드' 카테고리의 다른 글
[메타코드 강의 후기] 통계 기초의 모든것 올인원 - 대응비교, 모비율, 모분산 비교_240616 (0) | 2024.06.16 |
---|---|
[메타코드 강의 후기] 통계 기초의 모든것 올인원 - 모분산, 두 집단 비교_240616 (1) | 2024.06.16 |
[통계 기초의 모든것 올인원] 메타코드 강의 후기 - 구간추정/표본크기결정, 검정 (0) | 2024.05.29 |
[통계 기초의 모든것 올인원] 메타코드 강의 후기 - 점추정/구간추정 (1) | 2024.05.26 |
[통계 기초의 모든것 올인원] 메타코드 강의 후기 - t분포/F분포, 점추정/구간추정 (0) | 2024.05.26 |