출처: https://astrocosmos.tistory.com/202 [ASTROCOSMOS:티스토리] 데이터 전처리 set_index, reset_index, index] :: 하나둘셋넷
728x90

reset_index

# 단지 코드를 index로 전용면적 구간을 컬럼(열)으로 하여 전용면적별세대수 구하기(pivot)
# 결과를 result_5_1 저장
# 단지 코드를 index --> 컬럼으로 변경하기 : reset_index, drop = False, inplace = True

result_5_1 = group_5_1.pivot(index='단지코드', columns ='전용면적구간', values = '전용면적별세대수')
result_5_1.reset_index(inplace = True, drop = False)
display(result_5_1.head())
type(result_5_1)

 

컬럼 -인덱스 변환

## save_check 데이터 프레임의 ['model_name', 'valid_data'] 컬럼을 지정하여 인덱스로 설정해 줍니다.

## 변환한 값은 result_comp 변수에 할당해 주세요.

## 참고함수: set_index

result_comp = save_check.set_index(["model_name","valid_data"])

result_comp

 

# reset_index 원본 데이터

path = 'https://raw.githubusercontent.com/Jangrae/csv/master/pop_simple.csv'
pop = pd.read_csv(path) 
pop.set_index('year', inplace = True)
pop.index.name = None


# 확인
pop.head()

 

 

인덱스 초기화

# pop.reset_index(drop=False)
pop.reset_index(drop=False,inplace=True)


# 확인
pop.head(10)

 

 

# reset_index 활용 drop

# 데이터 읽어오기
import pandas as pd
path = 'https://raw.githubusercontent.com/Jangrae/csv/master/tips.csv'
pop = pd.read_csv(path) 
tip = pd.DataFrame(pop)

tip_top10 = tip.sort_values(by='total_bill',ascending=False)
tip_top10

 

기본 상태

 

drop = Flase 설정

tip_top10 = tip.sort_values(by='total_bill',ascending=False)
tip_top10.reset_index(drop=True, inplace = True)

tip_top10

 

 

drop = True 설정

tip_top10 = tip.sort_values(by='total_bill',ascending=False)
tip_top10.reset_index(drop=True, inplace = True)

tip_top10

data.index.name 활용_데이터 확인 

import numpy as np
import pandas as pd
import os
import csv
import matplotlib.pyplot as plt

data = pd.read_csv('./csv/교원+1인당+학생수(구별)_20230820151017.csv',index_col=0)

data

 

data.index.name = None 적용

import numpy as np
import pandas as pd
import os
import csv
import matplotlib.pyplot as plt

data = pd.read_csv('./csv/교원+1인당+학생수(구별)_20230820151017.csv',index_col=0)
data.index.name = None

data

 

data.index.name = None 적용

import pandas as pd

path = 'https://raw.githubusercontent.com/Jangrae/csv/master/pop_simple.csv'
pop = pd.read_csv(path) 
pop.set_index('year', inplace = True)
pop.index.name = None

# 인덱스 초기화
pop.reset_index(drop=False,inplace=True)


# 확인
pop.head(10)

 

 

728x90

+ Recent posts