프로젝트 진행중 맞이한 문제..
상황은 이렇다!
TIP
1.시계열이라고 해서 꼭 굳이 lstm, 대신 lgbm을! 갓gbm
2.lag feature를 다양하게, 길게(꼭 특정 a시간이 아닌 24(시간)+ a)
잠깐! lag feature란 시차, 시간 위아래로 댕기는 것
3.rolling feature 쓰기(이동평균 추천)
print('Rolling feature 만들기') for i in [7,10,14]: print('Rolling period:', i) all_df['rolling_mean_'+str(i)] = all_df.groupby(['store_id'])[TARGET].transform(lambda x: x.shift(SHIFT_DAY).rolling(i).mean()) all_df['rolling_std_'+str(i)] = all_df.groupby(['store_id'])[TARGET].transform(lambda x: x.shift(SHIFT_DAY).rolling(i).std())
'머신러닝' 카테고리의 다른 글
[혼공머신] 2주차_knn 최적의 k값 찾기 시각화 (0) | 2024.01.14 |
---|---|
[혼공머신] 1주차_머신러닝이란 (0) | 2024.01.07 |
군집화와 k-means(데이터 마이닝) (0) | 2023.09.21 |
머신러닝 알고리즘 빠르게 훑어보기! (0) | 2023.09.11 |
다중 회귀모델의 규제 : 라쏘, 릿지, 엘라스틱넷 (0) | 2023.09.10 |