머신러닝

[혼공머신] 5주차_k-means, PCA

주니코니 2024. 2. 1. 03:48

본 게시글은 혼공학습단 11기로, 복습 차원에서 책 내용을 제 스타일대로 요약한 내용입니다.
#챕터6 #주니코니 #힘내랏❤️

목차
-k-means 알고리즘 작동 방식
-PCA(주성분 분석)



k-means 클러스터링 :
k-means 알고리즘이란 지정한 k-개의 평균값을 가지고 클러스터링하는 것을 의미한다.

작동 방식은 간략히 말하자면 다음과 같다.
1. 임의로 중심점을 찍고 그룹화 한다
2. 데이터 포인트마다 중심점에서 가깝게 재분류된다
3. 재분류된 그룹 내 관측치들의 평균값을 토대로 중심점을 (재)계산한다(평균값-> 중심점)
4. 클러스팅이 잘되기까지 2번부터의 과정을 반복!

그림으로 말하자면

https://ministar.tistory.com/m/30

👍🏻


PCA(주성분 분석) :
주성분 분석이란 Principal Component Analysis의 약자로, 차원축소의 한 방법이다.

차원축소란 데이터의 특성을 줄여서 데이터를 더 단순화 시켜, 모델의 저장 공간을 줄이고 계산 속도를 향상시킬 수 있다. (+ 시각화도 가능-데이터 파악, 다중공선성 문제 해결)

그래서 PCA란

인데, 자세한 내용은 위 이미지 출처이자 설명이 괜찮은 아래 블로그를 참고하자

 

주성분 분석(PCA)의 개념적 이해

"주성분 분석을 개념적으로 이해하기 위한 포스팅입니다" 데이터 분석과 머신러닝 모델에 대해 공부하다 보면 데이터 전처리가 매우 중요하다는 것을 알 수 있습니다. 그중 특히, input features(변

everyday-tech.tistory.com