728x90
데이터 전처리] 1,234 등 숫자에서 쉼표를 제거하고 숫자형으로 형식 변경, 빈 칸 np.nan으로 대체 및 제거, str.replace(',', '').astype(float), np.nan, subset
seoul_monthly_2023['대여건수'] = seoul_monthly_2023['대여건수'].str.replace(',', '').astype(float)
seoul_monthly_2023['반납건수'] = seoul_monthly_2023['반납건수'].str.replace(',', '')
seoul_monthly_2023['반납건수'] = seoul_monthly_2023['반납건수'].str.replace(' - ', '')
seoul_monthly_2023['반납건수'].replace('', np.nan, inplace = True)
seoul_monthly_2023.dropna(subset=['반납건수'], inplace= True)
seoul_monthly_2023['반납건수'] = seoul_monthly_2023['반납건수'].astype(float)
728x90
'데이터 - 전처리' 카테고리의 다른 글
데이터 전처리 날짜, date, Date] (0) | 2024.01.05 |
---|---|
데이터 전처리 파일 다루기] (0) | 2024.01.05 |
데이터 전처리 가변수화] one-hot encoding, pd.get_dummies (0) | 2023.12.02 |
데이터 전처리] 데이터 파싱, xml.etree.ElementTree, bs4, Beautiful Soup Parsing, pprint (0) | 2023.11.18 |
데이터 전처리 그룹] (0) | 2023.09.08 |