캐글

[머신러닝 전략] 실무와 비슷한 시계열 데이터 실습

주니코니 2023. 8. 23. 16:21

#2023.08.23 빅리더 프로젝트 인턴십 #신백균 멘토님 수업 

(참고로 본문에 사용된 이미지는 멘토님께서 현장에서 공유해주신 ppt/코드 자료의 일부임을 밝힙니다.)

 

주제 

  • 2013년 1월부터 2015년 10월까지의 판매 데이터 바탕으로 2015년 11월 판매량 예측  

목차

  • 1.eda(Tip 시계열 데이터 교차 검증법)
  • 2.베이스 모델링(경우의 수 조합, 가비지 컬렉션, Tip 범주형 데이터 ) 
  • 3.모델링

현재 진행중인 연습용 대회에 참여해보겠습니다~!

 

Predict Future Sales | Kaggle

 

www.kaggle.com

1.eda 

 

lecture - [ch9] EDA

Explore and run machine learning code with Kaggle Notebooks | Using data from Predict Future Sales

www.kaggle.com

Tip 시계열 데이터 교차 검증법 따로 있다!('시간순'이라 일반적 교차 검증법 사용 불가)

=> 더 과거/가까운 과거 활용(최신데이터는 있지만 가려진 상태)

 

cf 일반 교차 검증법 : 시계열에 사용 경우, 미래(최신) 데이터로 과거 데이터를 예측하는 셈

평균내어 마무리(최종 평가점수)


2.베이스라인 코드 

 

lecture - [ch9] Baseline

Explore and run machine learning code with Kaggle Notebooks | Using data from Predict Future Sales

www.kaggle.com

-경우의 수 조합


-가비지 컬렉션(쓰레기 수집)

단, 개인 pc에서는 별 상관없겠지만 위 코딩 작업은 캐글(ram)에서 진행했으니 권장(코랩에서도 권장!)


범주형 데이터 Tip


3. 모델링

 

 

lecture - [ch9] Modeling

Explore and run machine learning code with Kaggle Notebooks | Using data from Predict Future Sales

www.kaggle.com