머신러닝

lag feature, rolling feature

주니코니 2023. 10. 5. 20:40

프로젝트 진행중 맞이한 문제..

 

상황은 이렇다!

 

TIP 

1.시계열이라고 해서 꼭 굳이 lstm, 대신 lgbm을! 갓gbm

2.lag feature를 다양하게, 길게(꼭 특정 a시간이 아닌 24(시간)+ a)

잠깐! lag feature란 시차, 시간 위아래로 댕기는 것 

3.rolling feature 쓰기(이동평균 추천)

print('Rolling feature 만들기') for i in [7,10,14]: print('Rolling period:', i) all_df['rolling_mean_'+str(i)] = all_df.groupby(['store_id'])[TARGET].transform(lambda x: x.shift(SHIFT_DAY).rolling(i).mean()) all_df['rolling_std_'+str(i)] = all_df.groupby(['store_id'])[TARGET].transform(lambda x: x.shift(SHIFT_DAY).rolling(i).std())