출처: https://astrocosmos.tistory.com/202 [ASTROCOSMOS:티스토리] '통계량' 태그의 글 목록 :: 하나둘셋넷
728x90

[통계 기초의 모든것 올인원] 메타코드 강의 후기 - 구간추정/표본크기결정, 검정

https://mcode.co.kr/video/list2?viewMode=view&idx=94

 

메타코드M

AI / 빅데이터 강의 플랫폼 & IT 현직자 모임 플랫폼 | 메타코드 커뮤니티 일원이 되시기 바랍니다.

www.metacodes.co.kr

 

모평균의 구간추정

- 표본 크기가 크지 않은 경우에,

만약 모분산을 안다면, 모분산 시그마와 Z 통계량을 사용한다.

모분산을 모르는 상황이라면 표본분산 S와 t 통계량을 사용해야 한다.

 

- 표본 크기가 크다면,

모분산을 안다면 모분산 시그마와 Z 통계량을 사용한다.

모분산을 모른다면 표본분산 S를 사용하는 것은 위와 동일하나 Z 통계량을 사용한다는 점에서 차이가 있다.

 

모비율의 구간추정

- B(1, p) 형태

 Binomial 분포에서 n이 1인 경우가 베르누이 분포이다.

 

- 근사신뢰구간

 앞에 비율에 대한 내용이 나오고, 그 뒤에 플러스(+), 마이너스(-) 연산을 하여 신뢰구간을 구한다.

 Bell Shaped이기 때문에 Z 통계량은 하나만 알면 된다.

 

추정 - 표본크기 결정

모비율 추정

- 만약 p에 대한 사전직이 없는 경우 보통 "1/2" 로 한다.

 밑의 식이 p를 "1/2" 로 계산하여 만든 식이다.

 두 번째 식의 경우에는 사전지식이 있는 경우로 p와 q의 곱으로 계산함을 확인할 수 있다.

 

검정

앞에서 수업한 대로 통계에서는 신뢰구간을 많이 사용한다.

가설 검정의 경우에는 두 집단 간의 차이가 있을 때, 어느 정도 수준부터 유의미한 차이가 있다고 봐야하는지 결정하는데에 사용한다.

통계적 검증 결과에 따라 귀무가설과 대립가설 중에서 어떤 것을 채택할지 결정한다.

강의에서는 출생률, 승률을 예시로 하였다.

 

가설의 종류

가설의 종류에는 귀무가설과 대립가설이 존재한다.

검정 과정에서는 귀무가설을 채택할 것인지, 기각할 것인지 정한다.

귀무 가설에서는 등호를 사용하는 것이 중요하다.

 

- 밑의 예시에서는

평균(뮤)가 0.6 이하인 것이"귀무가설", 0.6보다 크다는 것이 "대립가설"에 해당하며 등호를 사용한 것에 주목한다.

 

가설 설정의 오류

- 제 1종 오류는 귀무가설을 채택해야  했지만, 기각한 경우를 말한다.

 즉, 입증하고자 하는 내용이 맞았지만 기각했음을 말한다.

 예시) 신약이 효과가 없다는 가설을 채택해야 했는데, 기각한 경우

 

- 제 2종 오류는 귀무가설을 기각해야 했지만, 채택한 경우를 말한다.

 즉, 제 1종 오류의 반대의 경우를 말한다.

728x90
728x90

[통계 기초의 모든것 올인원] 메타코드 강의 후기 - 통계적 추정

https://mcode.co.kr/video/list2?viewMode=view&idx=94

 

메타코드M

빅데이터 , AI 강의 플랫폼 & IT 현직자 모임 플랫폼ㅣ메타코드 커뮤니티 일원이 되시기 바랍니다.

mcode.co.kr

메타코드의 "통계 기초의 모든 것 올인원[1편, 2편]"에 대한 수업 후기입니다.

메타코드에는 통계 강의를 포함하여 데이터 분석, 인공지능 등 다양한 강의를 제공하니 데이터 분석 혹은 인공지능 분야에 관심이 있다면 이용해보시길 추천드립니다.

 

구간 추정

모수 세타가 a와 b 사이에 있을 확률을 (1 - 알파)라고 한다면,

모수 세타에 대한 신뢰구간은 100 X ( 1 - 알파 )[%]가 된다.

즉, 신뢰구간은 모수를 포함할 것으로 추정한 구간을 의미한다.

신뢰수준은 신뢰구간이 모수를 포함할 확률로 ( 1 - 알파 )가 된다.

 

모평균의 구간추정

모분산을 아는 경우에는 Z 통계량을 사용한다.

Z 값을 사용하기 위해서는 표준화를 하는 과정이 필요한다.

구간추정을 하기 위해서는 먼저 신뢰수준을 정하는 것이 필요하다.

몇 %로 신뢰수준을 정할 것인지에 따라 Z 값이 달라진다.

 

통계적 추정 예제

모집단은 우리나라 대학생이 해당하며, 샘플 사이즈는 100명이 된다.

샘플 X의 평균 값은 30만원이 되며, 모집단의 표준편차 시그마는 12만원으로 주어졌다.

신뢰수준이 90%이므로 0.05일 때의 Z 값을 사용하면 된다.

Z = 1.64이기 때문에 ( 시그마 / 루트 n ) 식을 곱한 뒤에 X의 평균값에 더하면 된다.

 

모평균의 구간추정 - 모분산을 모르는 경우

모분산을 모르는 경우에는 t 통계량을 사용한다.

Z 통계량을 구하는 것과 유사한 모습을 보인다.

모표준편차 시그마를 사용하는 것과 달리 표본 표준편차 S를 쓰는 대신 t 통계량을 쓰는 것이 차이점이다.

단, 표본 크기가 클 경우에는 Z 통계량을 사용하게 된다.

 

통계적 추정 - 예제

표본의 평균은 30만원, 표본의 숫자는 16명, 표본의 표준편차 S는 10만원으로 주어졌다.

신뢰구간은 90%로 주어졌으므로, t가 0.05인 경우의 값을 확인하면 된다.

식을 계산하기 위하여 t 확률분포표를 확인하는 과정이 필요하다.

해당하는 t 값은 1.71이며, 나머지 값들을 넣어서 계산을 진행하면 답이 된다.

 

통계적 추정 - 예제 2

표본의 숫자는 10명, 표본의 평균 X는 150만원으로 주어졌다.

모집단에 대한 정보인 모표준편차는 10만원으로 주어졌고, 정규분포를 따른다는 조건 또한 주어졌다.

모평균에 대한 신뢰구간을 구할 때, 모분산을 안다면 Z 값을 사용할 수 있게 된다.

신뢰수준은 95%로 설정하였으므로 0.025일 때의 Z 값인 1.96을 사용하면 된다.

728x90

+ Recent posts