평균제곱오차(MSE)
·
Modeling/머신러닝
보간법을 사용하여 결측치를 보간하고, sklearn-impute 라이브러리를 이용해서 회귀분석을 진행해보자 회귀분석을 통해 mse 차이 비교1) 필요한 패키지 임포트# sklearn-learn에서 일부 실험적이거나 미완성 기능 사용 시 experimental 모듈 제공# 명시적으로 활성화해야만 사용할 수 있음# Imputeation 대체 방법을 사용하는 Imputer 활성화from sklearn.experimental import enable.iterative_imputer# 결측값 예측에 회귀 모델을 반복적으로 사용하여 결측값을 대체하는 도구 임포트from sklearn.impute import IterativeImputerimport pandas as pdimport seaborn as snsimpo..
결측치와 누락값
·
Data Analysis/Python
결측치와 누락값결측치와 누락값은 데이터 분석에서 중요한 요소로 간주된다. 결측치는 실제로 값이 없는 상황,누락값은 휴먼 에러 등으로 인해 빠진 값이다. 둘 다 " 값이 없다"는  NA, NaN과 같은 표현으로 나타낼 수 있다.  순수한 결측치 vs na값 자체가 값인 경우예를 들어, 설문조사에서 "가장 선호하는 색깔은?" 이라는 질문에 대답하지 않은 경우 해당 값은 결측치가 된다.이는 데이터에서 값이 실제로 빠져있어서 해당 위치에 아무런 정보가 없는 경우를 의미한다. 반면, 통신이나 센서 데이터에서 "na"값은 신호 강도가 부족하거나 데이터의 품질이 낮은 상태를 나타낸다.이 경우, "na"값은 특별한 상태를 나타내는 것!  결측치 & 누락값을 왜 처리하여야 하는가?데이터의 정확성과 분석 결과의 신뢰성 유..
semlng
'보간법' 태그의 글 목록