[통계 기초의 모든것 올인원] 메타코드 강의 후기 - 연속확률분포
https://mcode.co.kr/video/list2?viewMode=view&idx=94
표본분포
표본분포는 통계량의 확률분포이다.
통계량에는 평균, 표준편차, 분산, 중위값 등이 있다.
평균의 확률분포와 같은 개념을 의미한다.
전수 조사가 어려울 경우, 샘플링을 한다. 이때, 샘플링 과정을 여러 번( ex 1,000번 )한다.
이러한 과정을 진행하면 샘플링한 값들의 평균에 대한 확률분포를 구할 수 있다.
중심극한정리
임의의 모집단 => 내가 그 집단이 어떠한 성질을 가지고 있는지 모른다.
만약 샘플 사이즈 n이 충분히 크다면 근사적으로 정규분포를 따르는 것을 말한다.
어떠한 집단이 정규분포인지 정하는 것이 매우 중요하다.
따라서, 이 중심극한정리를 통하여 집단의 특성을 정하는 것은 매우 유용하게 된다.
카이제곱 분포
카이제곱 분포, t 분포는 표본분포에서 나온 개념이다.
통계량에 대한 분포를 의미한다.
카이제곱은 이 통계량 중에서 표본분산에 대한 분포를 말한다.
확률변수가 각각 표준정규분포를 따르고 독립일 때, 이들의 제곱합이 자유도 k인 카이제곱 분포를 따른다.
자유도 k만 알면 카이제곱 분포의 모양을 결정할 수 있게 된다.
카이제곱 분포는 원래 치우친 모양을 나타낸다.
카이제곱 분포 특징 정리
단봉분포는 하나의 봉우리만 가진다는 것을 의미한다.
오른쪽에 긴 꼬리를 가지는 Positive Skew 형태를 나타낸다. 즉, 양의 이상치 값을 갖는다.
정규분포를 따르는 각각의 확률변수 Z의 갯수만큼 자유도를 가진다.
이때, 이 자유도가 커질수록 정규분포에 가까워지게 된다.
표본분산만 가지고 있을 때 모분산을 추정하고 싶은 경우에 활용한다.
연속확률분포 예제 1
확률변수에 대하여 상수가 붙어있다면 제곱이 붙어서 나오게 되므로 이 경우에는 분모에 n^2이 생기게 된다.
확률표본이므로 X1부터 Xn까지 각각 독립이 된다.
따라서, 각각이 Var이 붙어서 연결된다.
동일한 모집단에서 나왔으므로 각각 시그마 제곱이므로 nσ^2이 되고 최종적으로 계산하면 σ^2/n이 된다.
연속확률분포 예제 2
이전 문제까지는 확률에 대해서 계산을 하다가 이번 문제는 학생 숫자에 대해서 물어보고 있다.
x가 60점에서 80점 사이에 있을 확률을 구한다.
(60-70) / 70 = -1이 되고, (80-70) / 70 = 1이다.
파란색 부분이 0.159에 해당하는 정규분포이므로 양쪽이 Bell 모양에 해당한다.
따라서 0.159 X 2 = 0.318이 된다.
100 * ( 1 - 0.318 )을 계산하면 정답에 해당한다.
'통계 - 메타코드' 카테고리의 다른 글
[통계 기초의 모든것 올인원] 메타코드 강의 후기 - 통계적 추정 (1) | 2024.05.19 |
---|---|
[통계 기초의 모든것 올인원] 메타코드 강의 후기 - 연속확률분포, 통계적 추정 (0) | 2024.05.19 |
[통계 기초의 모든것 올인원] 메타코드 강의 후기 - 이산확률분포 (0) | 2024.05.12 |
[통계 기초의 모든것 올인원] 메타코드 강의 후기 - "2강 확률과 확률변수" (0) | 2024.05.05 |
[통계 기초의 모든것 올인원] 메타코드 강의 후기 - "1강 통계량" (0) | 2024.05.04 |