미니프로젝트 1회 진행
암기할 코드
데이터 프레임 합치기
- -- Concat() with axis = 1
- -- outer
- -- inner
- -- Concat() with axis = 0
- -- Join
수치형 vs 수치형
- -- 시각화 산점도
- -- 시각화 pairplot
- -- 시각화 jointplot
- -- 시각화 heatmap 히트맵
- -- 상관계수 표현
수치형 단변량
- -- 히스토그램 작성 histplot
- -- 밀도함수 그래프 그리기 kde
- -- 히스토그램 + 밀도형
- -- 시각화 heatmap 히트맵
- -- 시각화 박스플랏 Boxplot
데이터프레임 조작
- -- 데이터프레임 열의 데이터 타입 확인
- -- 데이터프레임 열 추가
- -- 시리즈 -> 데이터프레임 형 변환
- -- 평균 계산
데이터프레임 합치기
Concat() with axis = 1
outer
# 가로로 합치므로 axis = 1 옵션 지정
# join = 'outer' 는 기본 옵션
pd.concat( [ 데이터프레임1, 데이터프레임2 ], join = 'outer', axis = 1)
inner
pd.concat( [ 데이터프레임1, 데이터프레임2], join = 'inner', axis = 1)
Concat() with axis = 0
inner
axis = 0 옵션을 지정해 세로로 합치기 ( 기본값 )
pop = pd.concat( [ 데이터프레임1, 데이터프레임2, join = 'inner', axis = 0 ] )
데이프레임 조인(merge)
# merge() 함수를 사용하여 두 프레임을 지정한 키 값을 기준으로 병합
pd.merge( 데이터프레임1 , 데이터프레임2, on = '컬럼명', how = 'inner' )
pd.merge( 데이터프레임1, 데이터프레임2, on= '컬럼명', how = 'outer' )
수치형 vs 수치형
시각화 산점도
sns.scatterplot(x='수치형 컬럼', '수치형 컬럼', data = 데이터프레임)
시각화 pairplot
sns.pairplot( 데이터프레임, kind= 'reg')
시각화 jointplot
sns.jointplot( x = '수치형 컬럼', y = '수치형 컬럼', data = 데이터프레임)
시각화 heatmap 히트맵
sns.heatmap( 데이터프레임.corr(),
annot = True, # 숫자(상관계수) 표기 여부
fmt = '.3f' # 숫자 포맷 : 소수점 3자리까지 표기
cmap = 'RdYlBu_r',
vmin = -1, vmax=1)
상관계수 표현
spst.데이터프레임( 데이터프레임['숫자형 컬럼'], temp['숫자형 컬럼'])
수치형 단변량
히스토그램 작성
plt.histplot( 데이터프레임[' 수치형 컬럼'], bins = 숫자, edgecolor = '컬러')
밀도함수 그래프 그리기
sns.kdeplot( 데이터프레임[' 수치형 컬럼'] )
히스토그램 + 밀도형
sns.histplot( 데이터프레임['수치형 컬럼'], kde = True )
박스 플롯 boxplot
plt.boxplot( 데이터프레임 ['수치형 컬럼'] )
plt.boxplot( x = 데이터프레임['수치형 컬럼'] )
plt.boxplot( y = 데이터프레임['수치형 컬럼'] )
데이터프레임 조작
데이터프레임 열의 데이터 타입 확인
데이터프레임['컬럼이름'].dtypes
데이터프레임 열 추가
데이터프레임 [ '새로운 열이름' ] = 0
# 0으로 이루어진 열 추가
시리즈 -> 데이터프레임 형 변환
데이터프레임[' 컬럼명 '].to_frame()
평균 계산
데이터프레임 ['수치형 컬럼'].sum() / 데이터프레임['수치형 컬럼'].count()