출처: https://astrocosmos.tistory.com/202 [ASTROCOSMOS:티스토리] '회귀' 태그의 글 목록 :: 하나둘셋넷
728x90

[메타코드 강의 후기] 메타코드 머신러닝 입문 부트캠프 - "강좌 소개 ~ 기초 수학"

메타코드M (metacodes.co.kr)

 

머신러닝 입문 부트캠프ㅣKAIST AI 박사과정

 

www.metacodes.co.kr

안녕하세요 메타코드 서포터즈 5기로 활동하고 있는 송주영입니다.

SQL과 Python을 연결한 데이터 분석 강의를 마치고 이번에는 머신러닝 입문 강의를 시작했습니다.

인공지능을 배울 때는 기초가 중요하다고 생각해서 만약에 이 분야에 관심이 있으시다면 이러한 입문 강의를 들어보시길 추천드려요!!

강의 리뷰 시작하겠습니다

 

강의목차

인공지능 학습에는 크게 지도 학습과 비지도 학습이 있습니다.

지도 학습은 다시 회귀와 분류 모델로 분류할 수 있습니다.

회귀 모델은 하나의 값을 예측하는 것으로, 입력된 값에 대해 연속형 값을 예측합니다.

분류 모델은 입력된 데이터를 이산형 데이터로 분류합니다.

 

회귀 모델, 분류 모델

회귀 모델과 분류 모델에 대한 보다 자세한 설명입니다.

회귀 모델과 분류 모델 모두 연속값, 이산값을 입력값으로 가질 수 있습니다.

회귀 모델은 출력값이 연속값, 분류 모델은 출력값이 이산값이라는 차이를 갖습니다.

분류의 경우 이진 분류이냐 다중 분류이냐에 따라 사용하는 함수가 각각 시그모이드 함수, 소프트맥스 함수로 나뉩니다.

 

용어 정리 - Feature, Label

데이터는 Feature와 Label로 구성됩니다.

Feature는 데이터의 특징으로 예시를 보면 혈압, 몸무게, 나이 등이 해당합니다.

라벨은 각 데이터에 대한 예측값을 의미합니다. 질병 예측으로 생각해보면, O와 X가 될 수 있습니다.

Feature와 Label은 독립 변수와 종속 변수로도 표현할 수 있습니다.

 

용어 정리 - 입출력, 모델

Input은 모델에 입력되는 값으로 데이터의 Feature 부분입니다.

Output은 모델로부터의 출력값으로 예측 결과를 말합니다.

모델에는 선형 회귀 모델과 비선형 회귀 모델이 있습니다.

비선형 회귀 모델식을 보면 선형 결합식으로 표현이 불가능함을 보입니다.

 

미분, 최솟값

미분은 함수에서 해당 지점의 순간 변화율을 의미합니다.

손실함수는 $(y- \hat{y})^2$ 형태로 표현될 수 있습니다.

손실함수에서 손실값을 최소로 하는 것이 목표입니다.

미분의 성질을 활용한다면 손실함수에서의 최솟값을 구할 수 있습니다.

 

자연상수 e

자연 상수를 이해하기 위하여 1원이 1년 뒤에 + 1원의 성장을 한다는 예시를 보여주셨습니다.

성장 구간을 쪼개지 않았을 때는 최종적으로 2원이 되고, 성장 구간을 한 번 쪼갠다면 2.25원이 됨을 볼 수 있습니다.

마찬가지의 과정을 무한히 수행한다면 값이 2.718에 수렴합니다.

수학에서 중요한 무리수 중 하나이므로 값과 값의 의미를 잘 이해해두어야 합니다.

 

이상으로, 강의 리뷰 마치겠습니다.

이번 수업에서는 인공지능 코딩에 앞서 기초 개념을 다지는 단계였습니다.

인공지능에 대한 깊은 이해를 위해서는 수학이 필수적임을 느낄 수 있는 수업이었습니다.

 

읽어주셔서 감사합니다!!

 

 

 

728x90
728x90

[메타코드 강의 후기] 통계 기초의 모든것 올인원_회귀분석_Part1_240629

메타코드M (metacodes.co.kr)

 

통계 기초의 모든것 올인원 [ 1편, 2편 ]ㅣ18만 조회수 검증

 

www.metacodes.co.kr

안녕하세요 메타코드 서포터즈 5기로 활동하고 있는 송주영입니다.

날씨가 더워짐에 따라 더욱 공부하기가 힘들어지고 있네요ㅠ

 

이번주에는 "통계 기초의 모든 것 올인원" 강의 완강을 앞두고 있어서 뿌듯함을 느끼고 있습니다.

서포터즈 활동을 하지 않았더라면 이렇게 꾸준히 강의를 들을 수 있었을지 모르겠네요

 

아래부터는 "회귀분석_Part1"에 대해 정리한 내용을 올릴게요

 

 

회귀분석이란

첫 번째 예시인 기업의 시가총액, 투자활동과 주식 수익률은 변수가 두 개이므로 다중 회귀분석에 해당한다.

만약, 10년 데이터로 주식 수익률을 예측했는데, 예측률이 높다고 해서 현재의 주식 수익률을 예측할 수 있는 것은 아니다.

과거 예측은 과거에 빈 데이터가 있는 경우에 예측을 통하여 그 데이터를 채울 수 있음을 말한다.

회귀분석의 종류 중에서 이 강의에서는 다중선형회귀분석에 대해 배울 것이다.

 

회귀분석 종류

단순선형 회귀 모형에서는 추정해야 하는 대상이 “베타 0”와 “베타 1” 두 가지이다.

다중선형회귀 모형으로 넘어간다면 식에서 볼 수 있듯이 추정해야 하는 대상이 더 증가하게 된다.

비선형 회귀 모델은 분수 형태와, exponential 형태인 것이 특징이다.

다변량 회귀모델은 종속변수 Y가 여러 개인 것을 말한다.

 

회귀분석 - 단순회귀

추정해야 하는 것은 “베타 0”와 “베타 1” 두 가지이다.

추정 단순회귀식에서는 “입실론” term은 없어야 한다. 위 식은 모델에 대한 내용이므로 오차인 “입실론”이 필요한 것이다.

오차항에 대한 가정은 잔차에 대한 진단을 수행하는 것이다.

오차항에 대한 기댓값이 없다는 내용은 outlier가 없음을 의미한다.

 

회귀분석 - 종속변수 분포

식에 있는 “입실론”은 확률변수이므로 y 또한 당연히 확률변수이다.

기댓값 식에서, 오차항의 기댓값은 0이므로 “입실론” 항은 사라지게 된다.

Variance 식에서는 “베타0”, “베타1”은 값이 실제로 있는 것이기 때문에 Variance에 영향을 받지 않고, “입실론” 항만 남게 된다.

종속변수 yi 에대한 분산은 “시그마 제곱”으로 떨어지기 때문에 정규분포를 따른다.

 

회귀분석 - 최소제곱법

회귀계수를 추정하는 방식 중 “최소제곱법”에 대해 배운다.

기본 식에서 입실론을 제외한 항을 반대편으로 넘기면 “입실론”에 대한 식을 얻을 수 있다.

오차의 제곱합이 최소가 될 수 있도록 하는 선을 찾는 방법아 “최소제곱법”이다.

최소제곱법을 푸는 방식 중에서 편미분을 활용하는 방법이다.

 

편미분을 활용한 최소제곱법의 해

앞의 최소제곱법에 대해 자세하게 풀어보는 과정이다.

“베타 0”와 “베타 1”에 대한 편미분을 수행하여 식을 두 개 만들었다.

이렇게 만들어진 두 식에 대해 뺄셈을 수행한다.

베타를 기준으로 좌우 식을 정리하고 최종식을 도출한다.

 

이상으로 이번 강의에 대한 내용은 모두 정리했습니다.

수업을 들으면서, 데이터 분석에 앞서 갖춰야 할 통계 지식의 난이도가 높다고 느꼈어요

 

편미분을 활용하여 최소제곱법의 해를 구할 때는, 대학교 시절에 배웠던 편미분에 대한 지식을 끄집어 내는 과정도 필요했네요

대학교에서 배운 내용과 더불어 이러한 강의들을 꾸준히 들으며 데이터를 보다 정확하고 의미있게 분석할 수 있는 능력을 키워야겠다고 다짐했습니다.

 

글 읽어주셔서 감사합니다!!!

728x90

+ Recent posts