머신러닝
[혼공머신] 5주차_k-means, PCA
주니코니
2024. 2. 1. 03:48
본 게시글은 혼공학습단 11기로, 복습 차원에서 책 내용을 제 스타일대로 요약한 내용입니다.
#챕터6 #주니코니 #힘내랏❤️
목차
-k-means 알고리즘 작동 방식
-PCA(주성분 분석)
k-means 클러스터링 :
k-means 알고리즘이란 지정한 k-개의 평균값을 가지고 클러스터링하는 것을 의미한다.
작동 방식은 간략히 말하자면 다음과 같다.
1. 임의로 중심점을 찍고 그룹화 한다
2. 데이터 포인트마다 중심점에서 가깝게 재분류된다
3. 재분류된 그룹 내 관측치들의 평균값을 토대로 중심점을 (재)계산한다(평균값-> 중심점)
4. 클러스팅이 잘되기까지 2번부터의 과정을 반복!
그림으로 말하자면
👍🏻
PCA(주성분 분석) :
주성분 분석이란 Principal Component Analysis의 약자로, 차원축소의 한 방법이다.
차원축소란 데이터의 특성을 줄여서 데이터를 더 단순화 시켜, 모델의 저장 공간을 줄이고 계산 속도를 향상시킬 수 있다. (+ 시각화도 가능-데이터 파악, 다중공선성 문제 해결)
그래서 PCA란
인데, 자세한 내용은 위 이미지 출처이자 설명이 괜찮은 아래 블로그를 참고하자