A/B 테스트란
·
Data Analysis/방법론
본 포스팅은 박스앤위스커 블로그A/B 테스팅이란 글을 정리한 글입니다.   1. A/B 테스트A/B 테스팅이란 웹 사이트 방문자를 임의로 두 집단으로 나누고,한 집단에게는 기존 사이트, 다른 집단에게는 새로운 사이트를 보여준 다음,두 집단의 성과를 측정 비교하여 새로운 사이트가 기존 사이트에 비해 좋은지를 정량적으로 평가하는 방식을 말한다.여기서 성과란 새 사이트가 목표로 삼았던 기준에 따라 회원 가입율, 재방문율, 구매전환율 등의 지표를 본다.   1.1 왜 하나A/B 테스팅을 하는 이유는 상관관계로부터 인과관계일 가능성이 높은 것을 찾아내기 위함이다.그래야만 "원인"에 해당하는 요소에 개입을 하여 "결과"에 해당하는 요소가 원하는 방향으로 변화되도록 할 수 있다. 혹은 역의 판단도 가능하다. 가령 물..
Data preprocessing
·
Data Analysis/방법론
데이터 전처리데이터 분석 전 데이터를 정제, 변형하여 분석에 적합한 형태로 만드는 과정실무에서 접하는 데이터는 messy 한 특징을 가지고 있어 유의미한 결과 도출을 위해 필수적이다.   STEP 1 : 데이터 수집데이터를 수집하는 단계로, 원시 데이터를 모으고 저장하는 과정 수집 방법의 종류(데이터의 형태, 종류에 따라 수집방법 결정)1. Web Crawling2. 로그 수집3. etc.  STEP 2 : 데이터 정제데이터의 불필요한 정보 or 오류를 제거하여 데이터의 신뢰도를 높이는 과정 (결측치 or 이상치 처리) 데이터 정제 절차1. 오류 원인 분석2. 정제 대상 선정    → 초기에는 모든 데이터를 대상으로 정제 진행3. 정제 방법 결정    ex) 오류 데이터 삭제, 대체, 예측값 삽입 등 데..
Data Analysis Overview
·
Data Analysis/방법론
데이터 분석의 목적1. 목적, 평가 지표 결정무엇을 위해, 어떤 데이터를 사용하여 어떤 분석을 하고, 그 결과로 어떤 지표로 평가할지 결정한다. 2. 데이터 수집내부와 외부 환경에서 데이터를 수집한다. 3. 데이터 가공 및 전처리여러 데이터를 통합하여 분석에 적합한 포맷으로 가공하고 결측치 등을 처리한다. 4. EDA  & 시각화데이터 분포나 경향, 개요 등을 시각화하여 확인하고 가설이나 의문, 과제 등을 정리한다. 5. 특징 값 추출머신러닝 모델에 입력할 수 있는 다양한 특징 값을 작성한다. 6. 모델 작성, 예측 및 분류모델의 하이퍼파라미터를 조정하면서 예측 정밀도가 높은 모델을 작성한다. 7. 모델 검증작성한 모델을 이용하여 테스트 과정을 거치며 효과를 검증한다.  데이터분석 용어 정리목적변수 : ..
semlng
'Data Analysis/방법론' 카테고리의 글 목록