전체 글(36)
-
A/B 테스트란
본 포스팅은 박스앤위스커 블로그A/B 테스팅이란 글을 정리한 글입니다. 1. A/B 테스트A/B 테스팅이란 웹 사이트 방문자를 임의로 두 집단으로 나누고,한 집단에게는 기존 사이트, 다른 집단에게는 새로운 사이트를 보여준 다음,두 집단의 성과를 측정 비교하여 새로운 사이트가 기존 사이트에 비해 좋은지를 정량적으로 평가하는 방식을 말한다.여기서 성과란 새 사이트가 목표로 삼았던 기준에 따라 회원 가입율, 재방문율, 구매전환율 등의 지표를 본다. 1.1 왜 하나A/B 테스팅을 하는 이유는 상관관계로부터 인과관계일 가능성이 높은 것을 찾아내기 위함이다.그래야만 "원인"에 해당하는 요소에 개입을 하여 "결과"에 해당하는 요소가 원하는 방향으로 변화되도록 할 수 있다. 혹은 역의 판단도 가능하다. 가령 물..
2024.07.03 -
Network Layer : Data Plane
Network LayerNetwork Layer는 TCP 5 Layer에서 identified end system간 frame을 교환하는 역할을 하고,이를 위한 두 가지 핵심 요소는 다음과 같다.Routing : 각 pkt의 route를 결정하고, routing algorithm이 필요함.Forwarding : router에서 packet을 이동시키며, routing table에 기반함 Router가 위의 역할을 수행하는데, router에서는 routing algorithm을 작동시키고, datagram을 forwarding 한다. 1. Input port2. Output port3. Switching fabric4. Routing processor Virtual Circuit Packet Switch..
2024.06.15 -
Transport Layer - TCP Congestion Control
Overview of TCP Congestion ControlPacket을 주고받는 방법에는 크게 Circuit Switching과 Datagram Packet Switching이 있다. 먼저, Circuit Switching은 다음과 같은 3가지 단계로 이뤄진다.Circuit EstablishmentData TransferCircuit DisconnectCircuit을 주고받는 두 stations은 Connection Oriented이기 때문에, delay or loss의 문제가 없지만,모든 channel이 꽉 차는 Congestion(Call Blocking) 발생할 가능성이 있다. 반면, Datagram Packet Switching에서는 Connectionless한 방법으로,Each packet..
2024.06.15 -
Data preprocessing
데이터 전처리데이터 분석 전 데이터를 정제, 변형하여 분석에 적합한 형태로 만드는 과정실무에서 접하는 데이터는 messy 한 특징을 가지고 있어 유의미한 결과 도출을 위해 필수적이다. STEP 1 : 데이터 수집데이터를 수집하는 단계로, 원시 데이터를 모으고 저장하는 과정 수집 방법의 종류(데이터의 형태, 종류에 따라 수집방법 결정)1. Web Crawling2. 로그 수집3. etc. STEP 2 : 데이터 정제데이터의 불필요한 정보 or 오류를 제거하여 데이터의 신뢰도를 높이는 과정 (결측치 or 이상치 처리) 데이터 정제 절차1. 오류 원인 분석2. 정제 대상 선정 → 초기에는 모든 데이터를 대상으로 정제 진행3. 정제 방법 결정 ex) 오류 데이터 삭제, 대체, 예측값 삽입 등 데..
2024.05.05 -
Data Analysis Overview
데이터 분석의 목적1. 목적, 평가 지표 결정무엇을 위해, 어떤 데이터를 사용하여 어떤 분석을 하고, 그 결과로 어떤 지표로 평가할지 결정한다. 2. 데이터 수집내부와 외부 환경에서 데이터를 수집한다. 3. 데이터 가공 및 전처리여러 데이터를 통합하여 분석에 적합한 포맷으로 가공하고 결측치 등을 처리한다. 4. EDA & 시각화데이터 분포나 경향, 개요 등을 시각화하여 확인하고 가설이나 의문, 과제 등을 정리한다. 5. 특징 값 추출머신러닝 모델에 입력할 수 있는 다양한 특징 값을 작성한다. 6. 모델 작성, 예측 및 분류모델의 하이퍼파라미터를 조정하면서 예측 정밀도가 높은 모델을 작성한다. 7. 모델 검증작성한 모델을 이용하여 테스트 과정을 거치며 효과를 검증한다. 데이터분석 용어 정리목적변수 : ..
2024.05.05 -
seaborn 라이브러리 연습
파이썬의 대표적인 시각화 도구에는 matplotlib와 seaborn이 있다.seaborn은 matplotlib 대비 쉽게 그래프를 그리고 그래프 스타일을 설정할 수 있다는 장점이 있으며,정교하게 그래프의 크기를 조절하거나 각 축의 범례값을 조절할 때에는 matplotlib을 함께 사용하기도 한다. 그러나, seaborn 사용법에 익숙해진다면 큰 문제가 되지 않으므로 많이 연습해보자 필요한 패키지를 임포트import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsdf = pd.read_csv('mpg.csv')df 그래프 4개 그리기import matplotlib.gridspec as gridspec # ..
2024.01.21