[머신러닝 전략] 실무와 비슷한 시계열 데이터 실습
#2023.08.23 빅리더 프로젝트 인턴십 #신백균 멘토님 수업
(참고로 본문에 사용된 이미지는 멘토님께서 현장에서 공유해주신 ppt/코드 자료의 일부임을 밝힙니다.)
주제
- 2013년 1월부터 2015년 10월까지의 판매 데이터 바탕으로 2015년 11월 판매량 예측
목차
- 1.eda(Tip 시계열 데이터 교차 검증법)
- 2.베이스 모델링(경우의 수 조합, 가비지 컬렉션, Tip 범주형 데이터 )
- 3.모델링
현재 진행중인 연습용 대회에 참여해보겠습니다~!
Predict Future Sales | Kaggle
www.kaggle.com
1.eda
lecture - [ch9] EDA
Explore and run machine learning code with Kaggle Notebooks | Using data from Predict Future Sales
www.kaggle.com
Tip 시계열 데이터 교차 검증법 따로 있다!('시간순'이라 일반적 교차 검증법 사용 불가)
=> 더 과거/가까운 과거 활용(최신데이터는 있지만 가려진 상태)
cf 일반 교차 검증법 : 시계열에 사용 경우, 미래(최신) 데이터로 과거 데이터를 예측하는 셈
2.베이스라인 코드
lecture - [ch9] Baseline
Explore and run machine learning code with Kaggle Notebooks | Using data from Predict Future Sales
www.kaggle.com
-경우의 수 조합
-가비지 컬렉션(쓰레기 수집)
단, 개인 pc에서는 별 상관없겠지만 위 코딩 작업은 캐글(ram)에서 진행했으니 권장(코랩에서도 권장!)
범주형 데이터 Tip
3. 모델링
lecture - [ch9] Modeling
Explore and run machine learning code with Kaggle Notebooks | Using data from Predict Future Sales
www.kaggle.com