전체 글130 [혼공머신] 3주차_로지스틱회귀&시그모이드, 소프트맥스 함수 본 게시글은 혼공학습단 11기로, 복습 차원에서 책 내용을 제 스타일대로 요약한 내용입니다. #챕터4 #주니코니 #힘내랏 목차 -로지스틱회귀란 -시그모이드 함수(로지스틱 함수) -소프트맥스 함수 로지스틱 회귀란 -분류 모델이다.(이진/ 다중 분류) -L2 규제다. 기본적으로 릿지 회귀와 같이 계수의 제곱을 규제한다. -시그모이드 함수로 확률을 얻고(이진) , 소프트맥스 함수로 확률을 얻는다.(분류) 시그모이드 함수 -하나의 선형 방정식(기울기)의 출력값을 0~1 사이로 압축한다. 소프트맥스 함수 -여러 개의 선형 방정식의 출력값을 0~1 사이로 압축하고, 전체 합이 1이 되도록 만든다.(지수 함수 사용) -n개의 z값을 확률로 변환한다. -클래스 개수만큼 방정식을 훈련한다. 2024. 1. 21. [혼공머신] 2주차_knn 최적의 k값 찾기 시각화 본 게시글은 혼공학습단 11기로, 복습 차원에서 책 내용을 제 스타일대로 요약한 내용입니다. #챕터3 #주니코니 #힘내랏 목차🐻 - 주차별 미션 - knn 최적의 k값 찾기_시각화 #최적의 k값 찾기(그래프로) knr = KNeighborsRegressor() x = np.arange(5,45).reshape(-1,1) #5~45까지 x 좌표 만들기 for n in [1,5,10]: #k=1,5,10일때의 예측 그래프 knr.n_neighbors = n #n_neighbors = 이웃의 개수 정하기 knr.fit(train_input, train_target) prediction = knr.predict(x) plt.scatter(train_input,train_target) plt.plot(x,pred.. 2024. 1. 14. [혼공머신] 1주차_머신러닝이란 본 게시글은 혼공학습단 11기로, 복습 차원에서 책 내용을 제 스타일대로 요약한 내용입니다. #챕터1~2 #주니코니 #힘내랏 목차🐻 - 주차별 미션 - 피처(feature) - fit() - knn 장단점 - numpy - score, predict() - 손코딩 실습 파일 1. 피처(feature) -데이터의 특징, 특성(feature)를 의미 -2개의 특성을 사용해 그래프를 그린다면 2차원 그래프 2. fit() 메서드 -사이킷런 패키지 내 함수로, (알고리즘을) 훈련함을 의미 -모델에 데이터를 전달하여 규칙을 학습하는 과정을 '훈련'이라 함 3. knn 장단점 -knn이란 k-Nearest Neighbors 알고리즘, 가장 가까운 k개의 데이터를 보고 다수결의 원칙을 따름 -장점 : 명확하고 간단한.. 2024. 1. 7. def () 함수 읽는법 아래 설명 추천 👍 https://medium.com/@lim.dg119/week-2-python-%EC%96%B8%EC%96%B4-5-fd107b6b4c0 2023. 11. 15. DEM, SNAP, 자연 변화 탐지(고도 시각화) 아래 사이트👍 https://progworks.tistory.com/75 DEM - 국가공간정보포털 DEM 자료 활용하기 DEM 이란? DEM(Digital Eleveation Model) 실세계 지형 정보 중 건물, 수목, 인공 구조물 등을 제외한 지형 부분을 표현한 모형 DSM(Digital Surface Model) 실세계의 모든 정보, 즉 지형, 수목, 건물, 인공구조물 등 progworks.tistory.com 2023. 10. 24. lag feature, rolling feature 프로젝트 진행중 맞이한 문제.. 상황은 이렇다! TIP 1.시계열이라고 해서 꼭 굳이 lstm, 대신 lgbm을! 갓gbm 2.lag feature를 다양하게, 길게(꼭 특정 a시간이 아닌 24(시간)+ a) 잠깐! lag feature란 시차, 시간 위아래로 댕기는 것 3.rolling feature 쓰기(이동평균 추천) print('Rolling feature 만들기') for i in [7,10,14]: print('Rolling period:', i) all_df['rolling_mean_'+str(i)] = all_df.groupby(['store_id'])[TARGET].transform(lambda x: x.shift(SHIFT_DAY).rolling(i).mean()) all_df['rol.. 2023. 10. 5. 군집화와 k-means(데이터 마이닝) 목차 -군집화란? -계층적/비계층적 군집화 -how 그룹핑? -k-means *이상철교수님의 데이터마이닝 수업을 요약했습니다 군집화란? 그룹으로 묶어 구분하다 k-means는 비지도 학습이다 계층적 군집화와 비계층적 군집화 1.계층적 군집화 : 개체간 거리 계산, 병합+분리(두개에서부터 데이터 끝까지 다 묶어준다) 2.비계층적 군집화 : 사전에 그룹 수 지정해서 거리 계산 -현실에서 많이 쓰는 방법 -몇개의 군집이 정답인가? 하나씩 다 해봐야한다! - 대규모 데이터를 처리에 유용 -k means how 그룹핑? 나눌 때 '어떤 속성을 가지고' 그룹화를 시켜야하는데.. 1) 개체간 *거리를 계산해서 비슷한 개체끼리 나눈다. *피타고라스의 정의(유클리드 거리) 2) 표준화 시키고 그룹핑하기!(그렇지 않으면 .. 2023. 9. 21. 유데미 : concat(cf.merge), 판다스와 시리즈 차이 목차 1.concat -new data(frame) 만들기 -concat/멀티인덱싱(keys[]) -concat한 df에서 특정 인덱스만 가져오기/슬라이싱 -cf.merge 2.잠깐! 판다스와 시리즈 차이 *아래 자료 출처 : 유데미 강좌 https://www.udemy.com/course/best-pandas-python/learn/lecture/29425772#overview 1. concat 1) new data(frame) 만들기 : 딕셔너리 형태, 컬럼명 [], '스트링' 2) concat/멀티인덱싱(keys, 컬럼명[]) -멀티 인덱싱 : 기존 인덱스 앞에 새로운 열 (여러개) 만드는 것 3) concat한 df에서 특정 인덱스만 가져오기 -슬라이싱, ' : ' cf.merge merge란 :.. 2023. 9. 16. 시계열 데이터 결측치 처리법 https://rfriend.tistory.com/682 2023. 9. 15. 이전 1 ··· 3 4 5 6 7 8 9 ··· 15 다음