머신러닝

[혼공머신] 1주차_머신러닝이란

주니코니 2024. 1. 7. 02:01

본 게시글은 혼공학습단 11기로, 복습 차원에서 책 내용을 제 스타일대로 요약한 내용입니다.

#챕터1~2 #주니코니 #힘내랏

 

목차🐻

- 주차별 미션

- 피처(feature)

- fit() 

- knn 장단점

- numpy

- score, predict()

- 손코딩 실습 파일  


주차별 미션 뀨

1. 피처(feature)

-데이터의 특징, 특성(feature)를 의미

-2개의 특성을 사용해 그래프를 그린다면 2차원 그래프


2. fit() 메서드

-사이킷런 패키지 내 함수로, (알고리즘을) 훈련함을 의미

-모델에 데이터를 전달하여 규칙을 학습하는 과정을 '훈련'이라 함


3. knn 장단점

-knn이란 k-Nearest Neighbors 알고리즘, 가장 가까운 k개의 데이터를 보고 다수결의 원칙을 따름

-장점 : 명확하고 간단한 설명.(새로운 데이터에 대해 예측시 가장 가까운 직선거리에 어떤 데이터가 있는지 살피면 됨)

-단점 : 큰 데이터에 적용 어려움(계산 시간)

여기서 새 데이터(세모)는 주변 데이터 k개의 다수결 원칙에 따라 파란 원 그룹에 해당된다.


4. numpy : 배열 관련 라이브러리!

-> 다양한 기능이 있다.

.shape

array() : 넘파이 배열화

shuffle()


5. score, predict()

fit() : 훈련  -> 모의고사 

train data : 훈련(공부 자료)

test data : 테스트(시험 자료)

score() : 예측한 후 정답이 있을 때 비교해서 성능 측정

predict() : 예측 (새 데이터로)


1주차 손코딩 실습파일

_1_bream_and_smelt.ipynb
0.08MB

 

도미와 빙어 knn 분류