머신러닝
[혼공머신] 1주차_머신러닝이란
주니코니
2024. 1. 7. 02:01
본 게시글은 혼공학습단 11기로, 복습 차원에서 책 내용을 제 스타일대로 요약한 내용입니다.
#챕터1~2 #주니코니 #힘내랏
목차🐻
- 주차별 미션
- 피처(feature)
- fit()
- knn 장단점
- numpy
- score, predict()
- 손코딩 실습 파일
1. 피처(feature)
-데이터의 특징, 특성(feature)를 의미
-2개의 특성을 사용해 그래프를 그린다면 2차원 그래프
2. fit() 메서드
-사이킷런 패키지 내 함수로, (알고리즘을) 훈련함을 의미
-모델에 데이터를 전달하여 규칙을 학습하는 과정을 '훈련'이라 함
3. knn 장단점
-knn이란 k-Nearest Neighbors 알고리즘, 가장 가까운 k개의 데이터를 보고 다수결의 원칙을 따름
-장점 : 명확하고 간단한 설명.(새로운 데이터에 대해 예측시 가장 가까운 직선거리에 어떤 데이터가 있는지 살피면 됨)
-단점 : 큰 데이터에 적용 어려움(계산 시간)
4. numpy : 배열 관련 라이브러리!
-> 다양한 기능이 있다.
.shape
array() : 넘파이 배열화
shuffle()
5. score, predict()
fit() : 훈련 -> 모의고사
train data : 훈련(공부 자료)
test data : 테스트(시험 자료)
score() : 예측한 후 정답이 있을 때 비교해서 성능 측정
predict() : 예측 (새 데이터로)
1주차 손코딩 실습파일
도미와 빙어 knn 분류