데이터 전처리 날짜, date, Date]
변경 - timedelta 형식의 시리즈열 데이터 유형을 days로 변경
display(df_competition['진행기간'][0])
display(df_competition['진행기간'][0].days)
df_competition['진행기간'] = df_competition['진행기간'].apply(lambda x: x.days)
df_competition['진행기간']
lambda 함수를 사용하면 pandas 시리즈의 각 요소에 대해 주어진 함수를 적용
변경 - pd.to_datetime
import datetime
# '날짜' 열을 datetime 형식으로 변환
df_participate['일자'] = pd.to_datetime(df_participate['일자'])
# 월별 열 생성
df_participate['월별'] = df_participate['일자'].dt.to_period('M')
df_participate.head()
조회 - 오늘 날짜 출력
from datetime import datetime
print(datetime.today())
print(datetime.today().strftime("%Y-%m-%d %H:%M:%S"))
print(datetime.today().strftime("%Y-%m-%d"))
조회 - 오늘 날짜의 일 단위만 조회
from datetime import datetime
# 오늘 날짜만 조회
today_date = today_date.day
today_date
조회 - timedelta, 2년 전 날짜 조회
from datetime import datetime
from datetime import timedelta
print(datetime.today())
print(datetime.today().strftime("%Y-%m-%d %H:%M:%S"))
print(datetime.today().strftime("%Y-%m-%d"))
two_years_ago = datetime.today() - timedelta(days = 2*365)
print(two_years_ago.strftime("%Y-%m-%d"))
조회 - timedelta에서 원하는 요소만 추출
display(df_competition['진행기간'][0])
df_competition['진행기간'][0].days
변경 - 여러 행에 메서드를 적용 lambda, days
display(df_competition['진행기간'][0])
display(df_competition['진행기간'][0].days)
df_competition['진행기간'] = df_competition['진행기간'].apply(lambda x: x.days)
df_competition['진행기간']
'데이터 - 전처리' 카테고리의 다른 글
데이터 전처리 삭제, 제거] (0) | 2024.01.06 |
---|---|
데이터 전처리 결측치] (0) | 2024.01.06 |
데이터 전처리 파일 다루기] (0) | 2024.01.05 |
데이터 전처리] 1,234 등 숫자에서 쉼표를 제거하고 숫자형으로 형식 변경, 빈 칸 np.nan으로 대체 및 제거, str.replace(',', '').astype(float), np.nan, subset (0) | 2023.12.16 |
데이터 전처리 가변수화] one-hot encoding, pd.get_dummies (0) | 2023.12.02 |