머신러닝(3)
-
Moment Generating Function
모멘트(moment)확률변수의 "모양(형태)"을 숫자로 요약한 값 확률변수의 분포가 어디쯤에 몰려 있는지, 얼마나 퍼져 있는지, asymmetric한지, 뾰족한지 같은 걸 수치화한 것 -> 모멘트모멘트 종류정의의미1차 모멘트E[X]평균 (중심 위치)2차 중심 모멘트E[(X−μ)^2]분산 (퍼짐 정도)3차 중심 모멘트E[(X-μ)^3]왜도 (비대칭성)4차 중심 모멘트E[(X−μ)^4]첨도 (뾰족함)※ 중심 모멘트에서 μ=E[X]는 평균 왜 중요한가?👉 확률분포의 모양을 숫자로 설명해줘서👉 우리가 데이터를 요약하고 비교하고 추론하는 데 꼭 필요하기 때문 즉, 분포의 특성을 알아야 데이터를 이해하고 모델링할 수 있고,모멘트는 분포의 모양을 한 줄 요약해주는 것이다. MGF(Moment Generati..
2025.04.08 -
[Bias-Variance Trade-off] 19분 예상 도착? 기사님 빨리가주세요!
지난 학기 '빅데이터 해석' 강의에서 처음 접했던 개념 중 하나가 바로 Bias-Variance Trade-off였습니다.이론적으로는 이해가 갔지만, 실제로 데이터 분석에 적용하려니 "왜 Bias와 Variance를 동시에 낮추는 것이 이렇게 어려울까?"라는 의문이 들었습니다.LG Aimers에서 이 개념을 다시 배우며, 더 깊이 이해하게 된 내용을 정리해보려 합니다. 카카오 T의 도착 시간 예측1교시 수업인데 8시에 눈을 뜬 글쓴이는 급하게 택시를 잡기 위해 카카오 T를 켰습니다. "학교까지 19분이나 걸린다고? 예측이 진짜 정확할까?" Bias-Variance Trade-off는 바로 이런 예측 모델에서 겪는 문제를 설명해주는 개념입니다. 카카오 T는 사용자로부터 출발지와 도착지 같은 정보를 받아,..
2025.01.20 -
회귀분석 MSE 차이 비교 실습
보간법을 사용하여 결측치를 보간하고, sklearn-impute 라이브러리를 이용해서 회귀분석을 진행해보자 회귀분석을 통해 mse 차이 비교1) 필요한 패키지 임포트# sklearn-learn에서 일부 실험적이거나 미완성 기능 사용 시 experimental 모듈 제공# 명시적으로 활성화해야만 사용할 수 있음# Imputeation 대체 방법을 사용하는 Imputer 활성화from sklearn.experimental import enable.iterative_imputer# 결측값 예측에 회귀 모델을 반복적으로 사용하여 결측값을 대체하는 도구 임포트from sklearn.impute import IterativeImputerimport pandas as pdimport seaborn as snsimpo..
2024.01.08