Data Analysis(15)
-
Poisson Process
왜 Poisson Process를 공부하는가?Linkedin에서 현업 데이터 분석가 분들의 인사이트를 읽다보면,'얼마나 많이'보다 '언제 일어나는가'에 대한 문제를 더 자주 고민하시는 것을 많이 접할 수 있었다. 예를 들어,"한 시간 뒤 고객 몇 명이 우리 웹사이트에 들어올까?""광고를 본 뒤 유저가 앱을 다시 켜는 데까지 시간이 얼마나 걸릴까?"와 같은 시간 기반의 사건들의 확률을 이해하기 위해선 다루는 도구에 대한 이해도 필요하다.Poisson Process는 이런 시간 기반의 사건들을 수학적으로 풀 수 있는 도구 중 하나이다. 평균만 본다고 예측이 되는 게 아니다 💬 우리 콜센터는 시간당 평균 12콜이 와요 → 이 말로는 10분동안 5콜이 몰릴 수도, 0콜이 올 수도 있다는 걸 설명할 수 없다...
2025.05.31 -
A/B 테스트로 알아보는 카이제곱 분포
수리통계학에서 배우고 있는 다양한 dist들이수식과 증명 위주 수업이라 와닿지 않아 학습의 연장선으로실제 데이터 분석에서의 적용 하는 방법에 대해 고민해보려고 한다. 그래서 그 첫 시작은 Chi-square dist 문제 상황한 쇼핑몰 앱에서 "구매 버튼 색상"을 바꿨을 때 CTR(클릭률)이 달라지는지를 A/B 테스트를 통해 확인하려고 한다.Group A: 빨간색 버튼Group B: 파란색 버튼 버튼을 클릭한 유저 수와 미클릭한 유저 수를 다음과 같은 표로 나타냈다고 해보자.Group클릭미클릭전체A (빨강)4555100B (파랑)3070100 우리는 이 표를 통해 다음 질문에 답을 하는 것이 목표이다."버튼 색상과 클릭 여부는 과연 무관한가?아니면 어떤 색상이 더 클릭을 유도하는가?" A/B 테스트..
2025.05.25 -
Moment Generating Function
모멘트(moment)확률변수의 "모양(형태)"을 숫자로 요약한 값 확률변수의 분포가 어디쯤에 몰려 있는지, 얼마나 퍼져 있는지, asymmetric한지, 뾰족한지 같은 걸 수치화한 것 -> 모멘트모멘트 종류정의의미1차 모멘트E[X]평균 (중심 위치)2차 중심 모멘트E[(X−μ)^2]분산 (퍼짐 정도)3차 중심 모멘트E[(X-μ)^3]왜도 (비대칭성)4차 중심 모멘트E[(X−μ)^4]첨도 (뾰족함)※ 중심 모멘트에서 μ=E[X]는 평균 왜 중요한가?👉 확률분포의 모양을 숫자로 설명해줘서👉 우리가 데이터를 요약하고 비교하고 추론하는 데 꼭 필요하기 때문 즉, 분포의 특성을 알아야 데이터를 이해하고 모델링할 수 있고,모멘트는 분포의 모양을 한 줄 요약해주는 것이다. MGF(Moment Generati..
2025.04.08 -
KPI란 무엇인가
현재 IT 연합동아리 TAVE에서 진행하고 있는 SQL 스터디의 주차별 커리큘럼 중'KPI' 개념을 처음으로 본격적으로 공부할 기회가 있었습니다. KPI의 기본 개념뿐 아니라, 실제 조직에 속해있는 팀이 되어가상의 마케팅 캠폐인을 진행하는 상황을 가정해KPI가 어떻게 설정되고 활용되는지를 정리해보았습니다. KPI KPI(Key Performance Indicator)는 "우리가 잘하고 있는 걸까?"라는 질문에 객관적으로 대답할 수 있게 해주는 수치화된 지표입니다.쉽게 말해, 목표를 향해 얼마나 잘 나아가고 있는지 확인할 수 있는 '성적표'라고 생각하면 됩니다. 대학생활과 비교해보면, 학점이 대학생의 '학업 KPI'인 셈입니다.시험 점수, 과제 점수, 출석률이 모여 최종 학점이 되고,이를 통해 학업 성취..
2025.04.05 -
자료구조는 왜 중요할까?
자료구조가 중요한 이유 코딩을 처음 시작했을 때를 생각해보면,단순히 내가 작성한 코드가 올바르게 작동하는 지가 가장 중요했다. (지금도 별반 다르지 않다.)하지만 동아리에서 흔히 코딩좀 치는(?) 형들이 서로 코드 리뷰하는 대화를 들어보면, 그렇게 잘 짠 코드는 아닌듯?하는 대화를 들을 때가 많다. 그렇다면 '잘 짠 코드' 란 뭘까? 고품질 코드'잘 짠 코드', 즉 고품질 코드는 바로 다음을 만족하는 코드이다.1. 코드의 유지보수성 (Maintainability)👉 코드가 직관적이며 쉽게 수정, 확장될 수 있는가? 2. 코드의 효율성 (Efficiency)👉 코드가 빠르고 적은 리소스를 사용하도록 최적화되었는가? 위 두 가지를 만족하는 것이 뛰어난 개발자의 역량이며,이를 위해 적절한 자료구조 와 ..
2025.03.14 -
독립사건 vs 배반사건
미국 주식은 날아가는데, 내 주식은... 왜?— "독립사건 vs 배반사건"으로 보는 한미 증시 이야기 주식 투자자라면 한 번쯤 이런 생각을 해봤을 것이다. "미장은 연일 신고가를 갱신하는데, 국장은 왜 이 모양이지?""미국이 오르면 한국도 따라가야 하는 거 아니야?" 최근 미국 증시는 나스닥과 S&P500이 사상 최고치를 기록하며 "붐"을 일으키고 있는 반면,한국 증시는 "박스피(박스권에 갇힌 코스피)"라는 오명을 벗어나지 못하고 있다.이 두 시장의 흐름을 보면 마치 "독립사건 vs 배반사건" 개념과도 연결될 수 있다.한번 재미있게 풀어보자. 미국 증시 vs 한국 증시: 독립사건일까?미장이 상승한다고 해서 국장도 반드시 상승하는 것은 아니다.이는 통계적으로 '독립사건'의 개념과 연결될 수 있다...
2025.02.03