출처: https://astrocosmos.tistory.com/202 [ASTROCOSMOS:티스토리] 'AIVLE' 태그의 글 목록 :: 하나둘셋넷
728x90

KT Aivle School 에이블스쿨 기자단] 1.15(월) ~ 수료

 

호평이 쏟아지는 우리 조 Big Project 작품

 
ZEP 메타버스 환경에서 서로 다른 조 부스를 다니면서 구경을 하고 패들렛에 의견을 남겨주었다.
 
메타버스 환경에서 자기 부스에 사람들을 많이 오도록 하기 위해 다들 바쁘게 움직였다.
 
우리 조는 시간대를 나누어 부스를 지킬 시간을 정하여 부스가 비어있는 없도록 했다.
 

 
주변에 돌아다니는 에이블러들에게 꾸준히 홍보를 했다.
 
우리 조 부스는 입구쪽에 위치해서 새로 오는 사람들에게  홍보를 하기에 유리한 부분이 존재했다.
 

우수기자단 선정

다른 에이블 기자단 글들을 보며, 우수 기자단 선정에 대한 기대감이 줄어들기도 했는데,
 
운이 좋게도 이런 결과를 얻을 수 있어서 에이블 수료식을 기분 좋게 마무리할 수 있었다.
 
갑작스럽게 앞에 나가서 소감을 발표하게 되어 정신이 없었는데,
 
 "블로그를 처음 운영했는데, 기자단을 시작할 때 세웠던 한 달에 최소 3개 이상 글 업로드를 하겠다는 원칙을
 
지키다 보니 이런 결과를 얻을 수 있었다. 꾸준히 노력하면 어떤 형태로든 보상을 받는다는 것을 느낄 수 있었다."
 
라는 내용으로 소감을 말했다.
 

SQL 스터디 모집

에이블스쿨 수료 이후에도 데이터분야에 관심이 있는 에이블러들과 힘께 SQL 스터디를 하며 실력을 늘리고 싶어서, 에이블 단체 톡방에 채팅을 남겼다.
 
다행이도 관심을 가져준 에이블러들이 생각보다 많아서 원활하게 모집을 마무리 할 수 있었고, 마감 이후에도 신청을 하는 인원들이 있어서 우선 대기 인원으로 기록해두고, 결원이 생기면 연락드리기로 했다.
 

직접 만든 SQL 스터디 노션 페이지 중 일부이다.
 
에이블스쿨 기간 동안에 Python 스터디, SQL 스터디를 운영해보며
 
팀즈, zep 메타버스를 활용해보며 각 플랫폼의 장단점을 알 수 있었고,
 
이번에 새로운 SQL 스터디를 운영할 때는 노션 + 팀즈 조합으로 스터디를 운영하기로 계획을 세웠다.

728x90
728x90

KT Aivle School 에이블스쿨 기자단] 1.8(월)~ 1.12(금) 빅프 마무리

 

발표자료 완성

 

 빅프로젝트를 진행하면서 때로는 어려움을 겪기도 했지만 꺾이지 않고 꾸준히 하다보니 결국 마침표를 찍을 수 있었다.

 

그동안 배웠던 기획안 작성, IT 인프라 구성도, Streamlit을 통한 대시보드 제작, Python을 통한 다양한 기능 구현들을 실제로 해보니 난이도는 높았지만 Mini Project를 진행할 때와는 비교가 되지 않을 정도로 성취감을 느낄 수 있었다.

 

프로젝트를 완수하는 데에 있어 매주 진행되었던 그룹코칭이 도움이 되었다고 느낀다.

 

발표를 하면 지적을 받는 일이 대부분이었지만 이 과정을 통해 완성도 있게 프로젝트를 마무리 할 수 있었다고 느낀다.

 

Streamlit을 통한 대시보드 제작

 

대시보드를 제작하는 과정에서는 수업 중에 배운 Streamlit을 활용하였다.

 

Python 환경에서 간단하게 데이터 기반으로 웹 어플리케이션을 제작할 수 있도록 하는 라이브러리이다.

 

인공지능 모델, Python을 통해 구현한 함수를 통해 동적으로 반응하는 대시보드를 제작하고 이에 대해 시연 영상을 찍으며 머릿 속에 생각하던 아이디어를 구현했다는 것에 뿌듯함을 느꼈다.

 

활용 데이터

 

데이터 분석 및 전처리를 담당하며 공공포털들을 돌아다니며 데이터를 수집하고 가공하다 보니 이정도 양의 데이터가 쌓이게 되었다.

 

데이터를 다루면서 어렵게 느껴졌던 부분은 데이터마다 excel, csv 등 형식이 달랐고 담고 있는 내용도 조금씩 달랐기 때문에 데이터를 통합하는 과정에서 데이터 간에 공통된 요소를 찾고 이 중에서 필요한 부분을 선택하는 과정에 시간이 소요되었다.

 

csv 파일이더라도 파일마다 인코딩 형식이 다른 경우도 존재했다. 또한, 파일 형태가 아닌 API를 통해 정보가 제공되는 경우에도 시간 소요가 발생했다.

 

KT 빅프로젝트 관리 시스템

 

그동안 Teams를 통해 조별모임, 그룹코칭, 과제 제출 및 공지사항들을 안내받았다.

 

이러한 관리 시스템을 통해 체계적으로 과제들을 수행할 수 있었다고 생각한다.

 

앞으로 어떤 과업을 수행하게 된다면 빅프로젝트 과정에서 했듯이 계획을 확실하게 세우고 이를 진행시키려고 한다.

 

빅프로젝트 발표 일정

 

빅프로젝트의 발표는 15일에 사전점검을 마친 이후에 16일부터 진행될 예정이다.

 

빅프로젝트 발표회의 경우 "ZEP" 메타버스 환경에서 진행된다.

 

팀마다 부스를 부여받고, 캐릭터를 통해 이동하면서 다른 팀의 부스에 방문하여 작품들을 구경하고 에이블러들과 소통하는 시스템이다.

 

지금까지 해보지 못한 방식의 발표 진행방식이라 이 부분에 흥미가 생겼고, 어떻게 부스를 운영해야 할 것인지도 생각할 필요성을 느꼈다.

728x90
728x90

KT Aivle School 에이블스쿨 기자단] 12.18(월)~ 12.24(일) 빅프 진행, 산출물 제출, 컨설팅 진행

 

꾸준히 쌓여가는 산출물

 

매주 금요일에는 산출물에 대해 보고서를 제출하고 있다.

 

이번주는 데이터분석, 환경분석서 페이지를 작성하여 제출하는 것이었다.

 

데이터분석의 경우 현재 주제의 모델링 목적, 사용 알고리즘, 모델링 순서 등에 대해 작성하는 내용이었고 환경 분석의 경우에는 고객사, 시장 동향 등의 환경에 대해 작성하는 내용이었다.

 

말로 간단하게 대화를 나눌 때에는 쉽게 생각이 되었지만 글을 직접 작성하는 과정에서 부족한 부분을 찾고 보완할 수 있었던 점이 좋게 느껴졌다.

 

 

12.21(목) 컨설팅 진행

 

 

목요일에는 우리 조가 컨설팅을 진행하는 일자였기 때문에 과제를 진행하면서 중간중간 상담을 진행했고, 나는 3시 15분에 상담을 진행했다.

 

나의 경우 돌아오는 수요일에 면접 일정이 있었기 때문에 원래는 자소서에 대한 상담이 주로 진행되어야 했지만 현재 상황을 말씀을 드림으로써 면접에 대한 상담을 받을 수 있었다.

 

두괄식으로서 표현하는 것과, 1분 자기소개를 할 때 적정 시간과 담아야 할 내용에 대해 배울 수 있었고 예상 인성질문 및 이에 대한 답변의 방향성을 배울 수 있었다.

빅프 진행 중에 도움이 되는 나의 정리본들

 

빅프로젝트를 진행함에 있어서, 빠르게 일을 처리하면서 다음으로 넘어가고 싶은 마음이 있는데 그럴 때마다 내가 현재까지 블로그에 정리해둔 글들이 크게 도움이 되고 있다.

 

두서 없이 짧게 작성된 부분들이 있지만 정말 필요한 내용만 깔끔하게 담겨 있기 때문에 과제 진행에 큰 힘이 되고 있다.

728x90
728x90

KT Aivle School 에이블스쿨 기자단] 12.11(월)~ 12.17(일) 빅프 시작, 개인과제 공유, 조별 코칭

 

빅프 시작, 개인 과제 공유

 

빅프로젝트 기간이 시작되고 각자 프로젝트 주제에 대해 생각해본 아이디어를 공유해보는 시간을 가졌다.

 

공유를 하다보니 혼자서는 고려하지 못한 부분들을 떠올릴 수가 있어서 좋았고 팀 단위로 일할 때의 장점을 느낄 수 있었다.

 

조별로 아이디어를 공유하고 코치님에게 피드백을 받았는데, "기존에 비슷한 아이디어가 존재한다", "전 기수에서 비슷한 아이디어를 했었다."는 피드백을 받았고 이후 새로운 아이디어를 도출하려는데 알아보면 알아볼수록 세상에 이미 존재하는 상품들이 많은게 어려움으로 다가왔다.

 

교육장 방문, 과제 구체화 워크숍

 

화요일은 "과제 구체화 워크숍"이 있어서 예약 없이 교육장을 방문했고, 13일, 14일은 따로 예약을 신청했다.

 

워크숍에서는 각자의 과제에 대해 발표하는 시간을 가졌고, 전 기수에서 우수한 성과를 바탕으로 KT에 입사한 수료생 분에게 빅프로젝트에 대한 조언을 들을 수 있었다.

 

패들렛을 통해 익명으로 질문을 할  수 있었고 이에 대한 답변들은 앞으로 어떻게 취업 시장을 준비해야 할 것인지, 방향성을 잡는 데에 도움이 되었다.

 

전 기수 참고자료

 

빅프로젝트 아이디어를 정하는 데에 참고가 될 수 있도록 전 기수들의 프로젝트 자료들을 홈페이지를 통해 제공하였다.

 

다른 기수들의 프로젝트를 보며 아이디어를 떠올리고 앞으로 과제를 어떻게 진행해야 할 지에 도움이 되기도 했고, 한편으로는 "이런 아이디어도 이미 했었네?"라는 부분을 확인할 때는 큰 좌절을 주기도 했다.

 

데이콘 공모전

 

개인적으로 빅프 전에, "데이콘 분석 아이디어 경진대회" 공모전에 같은 반 에이블러들과 함께 참여하고 있었다.

 

1차 평가에 통과하여 2차 평가 자료를 13일까지 제출해야 했는데 생각보다 빅프로젝트로 에너지와 시간을 많이 뺏겨서 힘듦이 있었지만, 팀원들이랑 함께 하니 어려움을 덜을 수 있었다.

728x90
728x90

KT Aivle School 에이블스쿨 기자단] 11.27(월)~ 12.03(일) "제안전략 수립, 제안서 작성"

내용

(1) 7차 미니프로젝트 대면 예약

(2) 제안전략 수립(~수요일)

(3) 제안서 작성(~금요일)

(4) 월간 데이콘 - DACON 데이터 분석 아이디어 경진대회 공모전

 

7차 미니프로젝트 대면 예약

 

 

 그동안 2번만 미니 프로젝트에 대면으로 참석하기도 했고, 이번 프로젝트는 대면을 희망하는 인원들이 꽤 있어서 수요일로 강의실 예약을 신청했다. 수요일에는 회식 또한 진행할 예정이라 좋은 추억을 만들지 않을까 싶다.

 당일로 왕복하려면 새벽에 일찍 일어나야 하지만, 미래의 내가 알아서 잘하겠지란 생각하고 있다.

 

 

제안 전략 수립(~수요일)

 

세분화

 

ㆍ 고객가치를 정의하기 위해서는 "세분화" 과정이 필요함을 배웠고 예시를 들으니 쉽게 이해할 수 있었다.

ex) 어린이가 좋아하는 것은?(X) → 다문화 가정의 어린이가 좋아하는 활동은?

 

포지셔닝

 

ㆍ 포지션이란 고객의 마음 속에 제품이나 기업이 점하는 위치를 말하며, 포지셔닝이란 기업이 고객의 마음 속에 원하는 위치름 점하기 위한 일련의 과정을 말한다.

 

효과적 포지셔닝?

      (1) 3C( 고객, 경쟁사, 자사 ) 고려

      (2) 가능한 비교우위 파악 "솔루션 차별화" -> "상품 차별화", "서비스 차별화", "이미지 차별화", "인적 차별화"

      (3) 포지셔닝의 유형 "속성/효익(Benefit) 포지셔닝", "사용현황 포지셔닝", "제품사용자 포지셔닝", "경쟁자 포지셔닝",

          "제품군 포지셔닝" 

 

ㆍ 포지셔닝을 통한 차별화

      (1) 상품/제품 차별화

      (2) 서비스 차별화

      (3) 이미지 차별화

 

 

마케팅 4P Mix

 

ㆍ "제품", "가격", "유통", "프로모션"

 

(역)가치사슬

 

ㆍ "가치사슬" : 기업에서 경쟁전략을 세우기 위해, 자신의 경쟁적 지위를 파악하고 이를 향상시킬 수 있는 지점 찾기(Reference point)

 

고객의 추구 가치

 

ㆍ"기능", "사용", "정서", "경제"

 

제안서 작성(~금요일)

 

청자 중심의 보고서 작성 PREP

(1) 강조(Point)

(2) 이유(Reason)

(3) 예시(Example)

(4) 강조(Point)

 

4 Box Tool

(1) Summary ( 주제 요약 )

(2) Introduction ( 개요 )

(3) Body ( 본문 )

(4) Review ( 요약 )

 

핵심 차별화 요소

 

(1) 고객의 중요 니즈 

 

(2) 경쟁사 대비 우위점

 

이번 주 수업을 통해 느낀 점

이번 주 수업을 통해 느낀 점은 평소에 뉴스를 꾸준히 보고 정리하며, 자신이 관심 있는 분야를 포함하여 다양한 분야의 지식이 중요함을 배웠다. 실습 보고서를 작성하면서 어려웠던 점은 사실 방법보다는 보고서를 작성하고자 하는 분야에 대한 지식 부족이었기 때문에 이러한 생각을 갖게 되었다. 이런 어려움을 다음에 겪지 않도록 하기 위해 티스토리에 비공개 카테고리를 만들어 두고, 개인적으로 꾸준히 기사를 스크랩하고 이에 대한 생각을 정리해두는 습관을 가져야겠다는 목표를 세웠다.

 

 

월간 데이콘 - DACON 데이터 분석 아이디어 경진대회 공모전

 

 이번에 DACON에서 진행하는 데이터 분석 아이디어 공모전에 참가하기로 결정했다. 같은 분반 에이블러 2명과 함께 팀을 결성하였다. 공모전 조원을 모집할 때마다, 에이블스쿨 에이블러로서의 편리함을 느끼고 있다.

 그동안, 에이블스쿨의 커리큘럼을 정신없게 따라오며 초기에 진행했던 데이터 분석( p-vale 분석 ) 개념이 흐릿해졌었는데 이렇게 공모전을 나가니 복습을 할 수 있어서 좋았다.

 유튜브를 통해 데이터 분석가 로드맵에 대해 검색을 해보며, "프로젝트 기반 학습" 방법을 추천해주었는데, 이번 공모전을 통해 이 학습법의 효과를 체감할 수 있었다.

 

 

 

 

"팀즈"를 이용하니 데이터분석 공모전에 대해 의견을 나누고 파일을 주고 받을 때 편리했다.

지금까지 팀즈를 이용하여 공모전들에 참여했고, 현재는 "백준 문제 풀이 스터디,", "SQL 문제 풀이 스터디"를 리더로서 진행하면서 활용하고 있는데, 게시판을 통해 팀원들에게 공지사항을 알려주고 회의를 시작할 때는 모임 개설 버튼을 통해 간단하게 진행 가능하다는 점이 큰 장점으로 다가왔다.

 

728x90
728x90

범주형 feature -> 수치형 target

 

카이제곱 검정, ttest, ANOVA 검정에서의 p_value의 의미 

 

  t-검정

 

- 귀무가설 : 집단의 평균 간에 차이가 없을 것이다.

- p-value < 0.05 : 귀무 가설 기각, 집단 간의 평균에 유의미한 차이가 있다.

 

  카이제곱 검정

 

- 귀무가설 : 두 집단의 빈도 분포가 독립적이다.

- p-value < 0.05 : 귀무 가설 기각, 두 집단의 빈도 분포가 독립적이지 않을 것이다.

 

  ANOVA 

 

- 귀무가설 : 집단(세 개 이상)의 평균 간에 차이가 없을 것이다.

- p-value < 0.05 : 귀무 가설 기각, 집단 간의 평균에 유의미한 차이가 있다.

 

 

(1) Gender

plt.figure(figsize = (15,8))
sns.barplot(x='Gender', y='Score_diff_total', data = base_data)
plt.grid()
plt.show()

 

 

## 범주 데이터 확인 : value_counts()
base_data['Gender'].value_counts()

 

 

## 평균 분석 : ttest_ind

t_male = base_data.loc[base_data['Gender']=='M', 'Score_diff_total']
t_female = base_data.loc[base_data['Gender']=='F', 'Score_diff_total']

spst.ttest_ind(t_male, t_female)

 

 

3-2-2) 학습목표

 

# 그래프 분석 : barplot

plt.figure(figsize = (15,8))
sns.barplot(x='학습목표', y='Score_diff_total', data = base_data)
plt.grid()
plt.show()

 

 

## 범주 데이터 확인 : value_counts()
base_data['학습목표'].value_counts()

## 분산 분석 : f_oneway

anova_1 = base_data.loc[base_data['학습목표']=='승진', 'Score_diff_total']
anova_2 = base_data.loc[base_data['학습목표']=='자기계발', 'Score_diff_total']
anova_3 = base_data.loc[base_data['학습목표']=='취업', 'Score_diff_total']

spst.f_oneway(anova_1, anova_2, anova_3)

 

 

3-2-3) 학습방법

 

## 그래프 분석 : barplot

plt.figure(figsize = (15,8))
sns.barplot(x='학습방법', y='Score_diff_total', data = base_data)
plt.grid()
plt.show()

 

 

## 범주 데이터 확인 : value_counts()
base_data['학습방법'].value_counts()

 

 

## 분산 분석 : f_oneway

anova_1 = base_data.loc[base_data['학습방법']=='온라인강의', 'Score_diff_total']
anova_2 = base_data.loc[base_data['학습방법']=='오프라인강의', 'Score_diff_total']
anova_3 = base_data.loc[base_data['학습방법']=='참고서', 'Score_diff_total']

spst.f_oneway(anova_1, anova_2, anova_3)

 

 

  3-2-4) 강의 학습 교재 유형

 

## 그래프 분석 : barplot

plt.figure(figsize = (15,8))
sns.barplot(x='강의 학습 교재 유형', y='Score_diff_total', data = base_data)
plt.grid()
plt.show()

 

 

 

## 범주 데이터 확인 : value_counts()
base_data['강의 학습 교재 유형'].value_counts()

 

 

## 분산 분석 : f_oneway

anova_1 = base_data.loc[base_data['강의 학습 교재 유형']=='일반적인 영어 텍스트 기반 교재', 'Score_diff_total']
anova_2 = base_data.loc[base_data['강의 학습 교재 유형']=='영상 교재', 'Score_diff_total']
anova_3 = base_data.loc[base_data['강의 학습 교재 유형']=='뉴스/이슈 기반 교재', 'Score_diff_total']
anova_4 = base_data.loc[base_data['강의 학습 교재 유형']=='비즈니스 시뮬레이션(Role Play)', 'Score_diff_total']

spst.f_oneway(anova_1, anova_2, anova_3, anova_4)

 

 

 3-2-6) 취약분야 인지 여부

 

## 그래프 분석 : barplot

plt.figure(figsize = (15,8))
sns.barplot(x='취약분야 인지 여부', y='Score_diff_total', data = base_data)
plt.grid()
plt.show()

 

 

## 범주 데이터 확인 : value_counts()

base_data['취약분야 인지 여부'].value_counts()

 

## 평균 분석 : ttest_ind

t_yes = base_data.loc[base_data['취약분야 인지 여부']=='알고 있음', 'Score_diff_total']
t_no = base_data.loc[base_data['취약분야 인지 여부']=='알고 있지 않음', 'Score_diff_total']

spst.ttest_ind(t_yes, t_no)

 

 

728x90
728x90

11.20(월)~ 11.26(일) 미프 6차, 기획서

미니 프로젝트 6차 진행

 

 

ㆍ 6차 미니 프로젝트에서는 클라우드, IT 인프라에서 배운 내용들을 종합하여 직접 인프라 구성도를 작성하였다.

 

 이번 미니 프로젝트에서 조장을 맡았는데, 유난한 이번 프로젝트는 중간중간 튜터님께 발표를 하는 것도 많았고,

 

 화요일에는 예상 밖으로 갑자기 우리 조에 관심이 쏠려, 조장으로서 발표 또한 진행하였다.

 

 사실, 이번 주에는 신경 쓸 일들이 많아서 클라우드 수업 시간에 강하게 집중하지 못해서 미니 프로젝트를 진행하며 어려움을 겪기도 했다.

 

 힘들긴 했지만, 미니 프로젝트를 조장으로서 책임감을 갖고 수행하다보니 클라우드에 대한 이해도를 보다 높일 수 있는 기회였다고 생각한다.

 

발표에 좋은 반응을 보여준 조원들

 

 

예상 밖으로 발표를 하게되었지만, 저번에 발표를 했듯이, 차분하게 생각들을 풀어나가니 어렵지 않게 마무리 할 수 있었고 조원들에게도 좋은 반응을 얻을 수 있어 기분이 좋았다.

 

부족한 내용은 그날 바로 복습

 

 

 

ㆍ 위와 같이 프로젝트를 진행하다가 어렵게 느껴지는 부분이 있었던 날에는 수업 끝나고 바로 부족한 내용에 대해 공부를 하고 티스토리에 정리를 하였다.

 

 

제안서 작성 시작

 

DX 컨설턴트로서 중요한 덕목 중 하나인 제안서 작성 방법에 대한 수업을 목요일부터 시작하였다.

 

직접 제안서를 작성하려다 보니, 평소에 뉴스를 많이 봐두는 것이 중요하다고 생각하였다.

 

좋은 아이디어를 떠올린다는 것이 어떻게 보면, 코딩보다 어렵게 느껴지기도 했다.

 

나는 고객사를 통신사로 설정하였고, 고령화 사회에서 통신사는 사업 전략을 어떻게 세우는 것이 합리적인지 고민하고 있다.

728x90
728x90

KT 에이블스쿨 5기 모집

 

https://aivle.kt.co.kr/home/main/indexMain

 

KT 에이블스쿨

KT가 직접 설계, 교육, 코칭, 채용

aivle.kt.co.kr

 

모집일정

 

 

지원자격

 

 

우대사항에 있는 AICE 자격증이란?

AICE 자격증은 KT 개발하고 한국 경제와 함께 주관하는 인공지능 능력시험입니다.

현재, AICE 자격증 없더라도 AIVLE School에서 교육을 받으신다면, ASSOCIATE 자격 응시 기회를 주고, 불합격 시에는 1회 재시험 기회 또한 부여하고 있습니다.

https://aice.study/info/aice

 

AICE

KT가 개발하여 한국경제신문과 함께 주관하는 인공지능 능력시험입니다.

aice.study

 

 

혜택

 

ㆍ KDT 교육비 최대 31.6만원 지급

: 결석 없이 교육에 성실히 참여하실 경우 최대 31.6만원의 지원금을 받으며 공부하실 수 있습니다.

 교육비가 무료인데 추가로 지원금도 받을 수 있으니 좋은 기회라고 생각했어요.

 

 

현재까지 후기

 

ㆍ AIVLE School에 참여하면서 좋았던 점 중에서 하나는 스터디원들을 구하기 쉽다는 것입니다.

 

 

저는 개인적으로 "백준 문제풀이", "SQL 프로그래머스 문제풀이" 스터디장을 맡아서 매주 스터디를 진행하고 있습니다.

에이블스쿨이라는 기회가 없었다면, 이렇게 좋은 스터디원들을 만나기 힘들었을 거라고 생각하고 있어요.

 

ㆍ 또한, 공모전에 나가고 싶을 때도 사람들을 모집하기 쉽다는 점 또한 있습니다.

 

 

위 사진은 공모전 회의를 할 때 모습입니다. Teams를 통해 자료들을 간편하게 주고 받으니 공모전을 원활하게 할 수 있었어요. 에이블스쿨에서 처음으로 진행했던 공모전이라 기억에 많이 남네요. 이때, 에이블스쿨 수업 중 "데이터 다루기", "데이터 다듬기"에서 배운 내용을 많이 활용하였고 실력을 키울 수 있는 좋은 기회였습니다. 

 

친구 추천 이벤트

 

 

지금 Aivle School 5기 친구 추천 이벤트에 참여하시면 커피 쿠폰도 나눠드리고 있으니 참고해주세요!!

728x90
728x90

house price 예측하기

 

라이브러리 불러오기

import pandas as pd

 

데이터 읽기

df = pd.read_csv('kc_houseprice.csv')
display(df.columns)
df.head()

 

컬럼 이름과 데이터 정보를 확인하였다.

 

df.info()

현재 데이터에서 date는 object 타입이다.

 

# 현재 date의 데이터만 object 타입임을 확인할 수 있다.

 

데이터 전처리

# 위에서 date 열을 보면 20141209T~~~~ 형식으로 되어있어서 활용하기 어렵다.

# 따라서 분석에 유효한 앞에 4글자만 가져오도록 한다.

# 이후에는 float 타입으로 변환

버릴 데이터를 찾아보자

df['date'] = df.loc[:,'date'].str[:4]
df['date'] = df.loc['date'].astype(float)
display(df.info())
display(df)

데이터에서 object 형이 없음을 확인했다.
문제 조건에 따라서 sqft_living15, sqft_lot15 열을 삭제하였고 확인

 

타겟 데이터 분리

target = 'price'
x = df.drop(['sqft_living15', 'sqft_lot15' ,target], axis = 1)
y = df[target]

display(x)
display(x.columns)
display(y)

 

훈련용 데이터 분리하기

from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.2, random_state = 2023)

 

데이터 스케일링

from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
x_train = scaler.fit_transform(x_train)
x_val = scaler.transform(x_val)

 

모델 설계

nfeatures = x_train.shape[1]

from keras.backend import clear_session
clear_session()

from keras.layers import Dense, Dropout
from keras.models import Sequential

model_DNN = Sequential()
model_DNN.add(Dense(18, input_shape = (nfeatures, ), activation = 'relu') )
model_DNN.add(Dropout(0.3) )
model_DNN.add(Dense(4, activation = 'relu'))
model_DNN.add(Dense(1) )

model_DNN.summary()

 

Param # 

출력 노드 * ( 입력노드 + 1 ) = Param

 

18 * ( 입력차원 + 1 ) = 18 * 19 = 342

4 * ( 입력차원 + 1 ) = 4 * 19 = 76

1 * ( 입력차원 + 1 ) = 1 * 5 = 5

 

따라서, 342 + 76 + 5 = 423

Total params : 423과 일치한다.

 

모델 컴파일 및 학습

from keras.optimizers import Adam

model_DNN.compile(optimizer = Adam(learning_rate = 0.01), loss = 'mse')
hist = model_DNN.fit(x_train, y_train, epochs = 50, validation_split = 0.2).history

 

 

검증

from sklearn.metrics import *

pred = model_DNN.predict(x_val)

print(mean_squared_error(y_val, pred, squared = False) ) # RMSE
print(mean_absolute_error(y_val, pred)

 

 

 

728x90

+ Recent posts