머신러닝
lag feature, rolling feature
주니코니
2023. 10. 5. 20:40
프로젝트 진행중 맞이한 문제..
상황은 이렇다!
TIP
1.시계열이라고 해서 꼭 굳이 lstm, 대신 lgbm을! 갓gbm
2.lag feature를 다양하게, 길게(꼭 특정 a시간이 아닌 24(시간)+ a)
잠깐! lag feature란 시차, 시간 위아래로 댕기는 것
3.rolling feature 쓰기(이동평균 추천)
print('Rolling feature 만들기') for i in [7,10,14]: print('Rolling period:', i) all_df['rolling_mean_'+str(i)] = all_df.groupby(['store_id'])[TARGET].transform(lambda x: x.shift(SHIFT_DAY).rolling(i).mean()) all_df['rolling_std_'+str(i)] = all_df.groupby(['store_id'])[TARGET].transform(lambda x: x.shift(SHIFT_DAY).rolling(i).std())