미니프로젝트 1회 진행

 

암기할 코드

 

데이터 프레임 합치기

 

  • -- Concat() with axis = 1
  • -- outer
  • -- inner
  • -- Concat() with axis = 0
  • -- Join

 

수치형 vs 수치형

 

  • -- 시각화 산점도
  • -- 시각화 pairplot
  • -- 시각화 jointplot
  • -- 시각화 heatmap 히트맵
  • -- 상관계수 표현

 

수치형 단변량

 

  • -- 히스토그램 작성 histplot
  • -- 밀도함수 그래프 그리기 kde
  • -- 히스토그램 + 밀도형
  • -- 시각화 heatmap 히트맵
  • -- 시각화 박스플랏 Boxplot

 

데이터프레임 조작

 

  • -- 데이터프레임 열의 데이터 타입 확인
  • -- 데이터프레임 열 추가
  • -- 시리즈 -> 데이터프레임 형 변환
  • -- 평균 계산

 

데이터프레임 합치기

 

Concat() with axis = 1

 

 

outer

 

# 가로로 합치므로 axis = 1 옵션 지정

# join = 'outer' 는 기본 옵션

pd.concat( [ 데이터프레임1, 데이터프레임2 ], join = 'outer', axis = 1)

 

inner

 

pd.concat( [ 데이터프레임1, 데이터프레임2], join = 'inner', axis = 1)

 

Concat() with axis = 0

 

 

inner

 

axis = 0 옵션을 지정해 세로로 합치기 ( 기본값 )

pop = pd.concat( [ 데이터프레임1, 데이터프레임2, join = 'inner', axis = 0 ] )

 

데이프레임 조인(merge)

 

# merge() 함수를 사용하여 두 프레임을 지정한 키 값을 기준으로 병합

pd.merge( 데이터프레임1 , 데이터프레임2, on = '컬럼명',  how = 'inner' )

pd.merge( 데이터프레임1, 데이터프레임2, on= '컬럼명', how = 'outer' )

 

수치형 vs 수치형

 

시각화 산점도

 

 

sns.scatterplot(x='수치형 컬럼', '수치형 컬럼', data = 데이터프레임)

 

시각화 pairplot

 

 

sns.pairplot( 데이터프레임, kind= 'reg')

 

시각화 jointplot

 

 

sns.jointplot( x = '수치형 컬럼', y = '수치형 컬럼', data = 데이터프레임)

 

시각화 heatmap 히트맵

 

 

sns.heatmap( 데이터프레임.corr(),
                       annot = True,                # 숫자(상관계수) 표기 여부
                       fmt = '.3f'                       # 숫자 포맷 :  소수점 3자리까지 표기
                       cmap = 'RdYlBu_r',
                       vmin = -1, vmax=1)

 

상관계수 표현

 

spst.데이터프레임( 데이터프레임['숫자형 컬럼'], temp['숫자형 컬럼'])

 

수치형 단변량

 

히스토그램 작성

 

 

plt.histplot( 데이터프레임[' 수치형 컬럼'], bins = 숫자, edgecolor = '컬러')

 

밀도함수 그래프 그리기

 

sns.kdeplot( 데이터프레임[' 수치형 컬럼'] )

 

히스토그램 + 밀도형

 

 

sns.histplot( 데이터프레임['수치형 컬럼'], kde = True )

 

박스 플롯 boxplot

 

plt.boxplot( 데이터프레임 ['수치형 컬럼'] )

plt.boxplot( x = 데이터프레임['수치형 컬럼'] )

plt.boxplot( y = 데이터프레임['수치형 컬럼'] )

 

데이터프레임 조작

 

데이터프레임 열의 데이터 타입 확인

 

데이터프레임['컬럼이름'].dtypes

 

데이터프레임 열 추가

 

데이터프레임 [ '새로운 열이름' ] = 0

# 0으로 이루어진 열 추가

 

시리즈 -> 데이터프레임 형 변환

 

데이터프레임[' 컬럼명 '].to_frame()

 

평균 계산

 

데이터프레임 ['수치형 컬럼'].sum() / 데이터프레임['수치형 컬럼'].count()

 

+ Recent posts