출처: https://astrocosmos.tistory.com/202 [ASTROCOSMOS:티스토리] '데이터 - 시각화' 카테고리의 글 목록 (2 Page) :: 하나둘셋넷
728x90

내용

  • 평균 : numpy , pandas
  • Maplotlib 시각화 : 히스토그램, 박스플랏, plot
  • seaborn : kde 밀도함수, 히스토그램 + kde 밀도 함수 한 번에 그리기, 하나의 그래프에 두 개의 kde

 

평균(산술평균)

 

1. 넘파이 함수 이용

np.mean(데이터프레임['컬럼명'])

 

2. 판다스 mean 메서드 이용

데이터프레임['컬럼명'].mean()

 

히스토그램 작성

plt.hist(데이터프레임.컬럼명, bins = 숫자, edgecolor = '색상명')

plt.title('제목')

plt.ylabel('y 라벨명')

plt.show()

 

 

Boxplot 그리기

plot.boxplot(데이터프레임['컬럼명'])

옆으로 그리려면,

plt.boxplot(데이터프레임['컬럼명'], vert=False)

plt.grid()

plt.show()

 

plot 차트 이용

plt.plot(데이터프레임['컬럼명'])

 

 

밀도함수 그리기 <kdeplot>

sns.kdeplot(데이터프레임['컬럼명'])

plt.show()

 

히스토그램 + 밀도함수 합쳐서 그리기 <hisplot+kde></hisplot+kde>

sns.hisplot(데이터프레임['컬럼명'], ked=True)

 

하나의 그래프에 두 개의 밀도함수그래프 그리기 <kde+kde>

sns.kdeplot(x='컬럼명'1, data = 데이터프레임, label = '라벨이름')

sns.kdeplot(x='컬럼명2, data = 데이터프레임, label = '라벨이름')

plt.legend()

plt.gride()

plt.show()

 

728x90
728x90

Pandas Profiling 활용

 

import pandas as pd
import numpy as np

import pandas_profiling

from pandas_profiling import ProfileReport

h = pd.read_csv('housing_data.csv')

h.profile_report()

 

 

원본 데이터

728x90

+ Recent posts