[메타코드 강의 후기] 통계 기초의 모든것 올인원_회귀분석_Part1_240629
안녕하세요 메타코드 서포터즈 5기로 활동하고 있는 송주영입니다.
날씨가 더워짐에 따라 더욱 공부하기가 힘들어지고 있네요ㅠ
이번주에는 "통계 기초의 모든 것 올인원" 강의 완강을 앞두고 있어서 뿌듯함을 느끼고 있습니다.
서포터즈 활동을 하지 않았더라면 이렇게 꾸준히 강의를 들을 수 있었을지 모르겠네요
아래부터는 "회귀분석_Part1"에 대해 정리한 내용을 올릴게요
회귀분석이란
첫 번째 예시인 기업의 시가총액, 투자활동과 주식 수익률은 변수가 두 개이므로 다중 회귀분석에 해당한다.
만약, 10년 데이터로 주식 수익률을 예측했는데, 예측률이 높다고 해서 현재의 주식 수익률을 예측할 수 있는 것은 아니다.
과거 예측은 과거에 빈 데이터가 있는 경우에 예측을 통하여 그 데이터를 채울 수 있음을 말한다.
회귀분석의 종류 중에서 이 강의에서는 다중선형회귀분석에 대해 배울 것이다.
회귀분석 종류
단순선형 회귀 모형에서는 추정해야 하는 대상이 “베타 0”와 “베타 1” 두 가지이다.
다중선형회귀 모형으로 넘어간다면 식에서 볼 수 있듯이 추정해야 하는 대상이 더 증가하게 된다.
비선형 회귀 모델은 분수 형태와, exponential 형태인 것이 특징이다.
다변량 회귀모델은 종속변수 Y가 여러 개인 것을 말한다.
회귀분석 - 단순회귀
추정해야 하는 것은 “베타 0”와 “베타 1” 두 가지이다.
추정 단순회귀식에서는 “입실론” term은 없어야 한다. 위 식은 모델에 대한 내용이므로 오차인 “입실론”이 필요한 것이다.
오차항에 대한 가정은 잔차에 대한 진단을 수행하는 것이다.
오차항에 대한 기댓값이 없다는 내용은 outlier가 없음을 의미한다.
회귀분석 - 종속변수 분포
식에 있는 “입실론”은 확률변수이므로 y 또한 당연히 확률변수이다.
기댓값 식에서, 오차항의 기댓값은 0이므로 “입실론” 항은 사라지게 된다.
Variance 식에서는 “베타0”, “베타1”은 값이 실제로 있는 것이기 때문에 Variance에 영향을 받지 않고, “입실론” 항만 남게 된다.
종속변수 yi 에대한 분산은 “시그마 제곱”으로 떨어지기 때문에 정규분포를 따른다.
회귀분석 - 최소제곱법
회귀계수를 추정하는 방식 중 “최소제곱법”에 대해 배운다.
기본 식에서 입실론을 제외한 항을 반대편으로 넘기면 “입실론”에 대한 식을 얻을 수 있다.
오차의 제곱합이 최소가 될 수 있도록 하는 선을 찾는 방법아 “최소제곱법”이다.
최소제곱법을 푸는 방식 중에서 편미분을 활용하는 방법이다.
편미분을 활용한 최소제곱법의 해
앞의 최소제곱법에 대해 자세하게 풀어보는 과정이다.
“베타 0”와 “베타 1”에 대한 편미분을 수행하여 식을 두 개 만들었다.
이렇게 만들어진 두 식에 대해 뺄셈을 수행한다.
베타를 기준으로 좌우 식을 정리하고 최종식을 도출한다.
이상으로 이번 강의에 대한 내용은 모두 정리했습니다.
수업을 들으면서, 데이터 분석에 앞서 갖춰야 할 통계 지식의 난이도가 높다고 느꼈어요
편미분을 활용하여 최소제곱법의 해를 구할 때는, 대학교 시절에 배웠던 편미분에 대한 지식을 끄집어 내는 과정도 필요했네요
대학교에서 배운 내용과 더불어 이러한 강의들을 꾸준히 들으며 데이터를 보다 정확하고 의미있게 분석할 수 있는 능력을 키워야겠다고 다짐했습니다.
글 읽어주셔서 감사합니다!!!
'통계 - 메타코드' 카테고리의 다른 글
[메타코드 강의 후기] 통계 기초의 모든것 올인원_회귀분석_Part2_240630 (0) | 2024.06.30 |
---|---|
[메타코드 강의 후기] 통계 기초의 모든것 올인원 - 이원배치 분산분석_240623 (0) | 2024.06.23 |
[메타코드 강의 후기] 통계 기초의 모든것 올인원 - 일원분산분석_240623 (0) | 2024.06.23 |
[메타코드 강의 후기] 통계 기초의 모든것 올인원 - 대응비교, 모비율, 모분산 비교_240616 (0) | 2024.06.16 |
[메타코드 강의 후기] 통계 기초의 모든것 올인원 - 모분산, 두 집단 비교_240616 (1) | 2024.06.16 |