Data Analysis(20)
-
Moment Generating Function
모멘트(moment)확률변수의 "모양(형태)"을 숫자로 요약한 값 확률변수의 분포가 어디쯤에 몰려 있는지, 얼마나 퍼져 있는지, asymmetric한지, 뾰족한지 같은 걸 수치화한 것 -> 모멘트모멘트 종류정의의미1차 모멘트E[X]평균 (중심 위치)2차 중심 모멘트E[(X−μ)^2]분산 (퍼짐 정도)3차 중심 모멘트E[(X-μ)^3]왜도 (비대칭성)4차 중심 모멘트E[(X−μ)^4]첨도 (뾰족함)※ 중심 모멘트에서 μ=E[X]는 평균 왜 중요한가?👉 확률분포의 모양을 숫자로 설명해줘서👉 우리가 데이터를 요약하고 비교하고 추론하는 데 꼭 필요하기 때문 즉, 분포의 특성을 알아야 데이터를 이해하고 모델링할 수 있고,모멘트는 분포의 모양을 한 줄 요약해주는 것이다. MGF(Moment Generati..
2025.04.08 -
KPI란 무엇인가
현재 IT 연합동아리 TAVE에서 진행하고 있는 SQL 스터디의 주차별 커리큘럼 중'KPI' 개념을 처음으로 본격적으로 공부할 기회가 있었습니다. KPI의 기본 개념뿐 아니라, 실제 조직에 속해있는 팀이 되어가상의 마케팅 캠폐인을 진행하는 상황을 가정해KPI가 어떻게 설정되고 활용되는지를 정리해보았습니다. KPI KPI(Key Performance Indicator)는 "우리가 잘하고 있는 걸까?"라는 질문에 객관적으로 대답할 수 있게 해주는 수치화된 지표입니다.쉽게 말해, 목표를 향해 얼마나 잘 나아가고 있는지 확인할 수 있는 '성적표'라고 생각하면 됩니다. 대학생활과 비교해보면, 학점이 대학생의 '학업 KPI'인 셈입니다.시험 점수, 과제 점수, 출석률이 모여 최종 학점이 되고,이를 통해 학업 성취..
2025.04.05 -
자료구조는 왜 중요할까?
자료구조가 중요한 이유 코딩을 처음 시작했을 때를 생각해보면,단순히 내가 작성한 코드가 올바르게 작동하는 지가 가장 중요했다. (지금도 별반 다르지 않다.)하지만 동아리에서 흔히 코딩좀 치는(?) 형들이 서로 코드 리뷰하는 대화를 들어보면, 그렇게 잘 짠 코드는 아닌듯?하는 대화를 들을 때가 많다. 그렇다면 '잘 짠 코드' 란 뭘까? 고품질 코드'잘 짠 코드', 즉 고품질 코드는 바로 다음을 만족하는 코드이다.1. 코드의 유지보수성 (Maintainability)👉 코드가 직관적이며 쉽게 수정, 확장될 수 있는가? 2. 코드의 효율성 (Efficiency)👉 코드가 빠르고 적은 리소스를 사용하도록 최적화되었는가? 위 두 가지를 만족하는 것이 뛰어난 개발자의 역량이며,이를 위해 적절한 자료구조 와 ..
2025.03.14 -
독립사건 vs 배반사건
미국 주식은 날아가는데, 내 주식은... 왜?— "독립사건 vs 배반사건"으로 보는 한미 증시 이야기 주식 투자자라면 한 번쯤 이런 생각을 해봤을 것이다. "미장은 연일 신고가를 갱신하는데, 국장은 왜 이 모양이지?""미국이 오르면 한국도 따라가야 하는 거 아니야?" 최근 미국 증시는 나스닥과 S&P500이 사상 최고치를 기록하며 "붐"을 일으키고 있는 반면,한국 증시는 "박스피(박스권에 갇힌 코스피)"라는 오명을 벗어나지 못하고 있다.이 두 시장의 흐름을 보면 마치 "독립사건 vs 배반사건" 개념과도 연결될 수 있다.한번 재미있게 풀어보자. 미국 증시 vs 한국 증시: 독립사건일까?미장이 상승한다고 해서 국장도 반드시 상승하는 것은 아니다.이는 통계적으로 '독립사건'의 개념과 연결될 수 있다...
2025.02.03 -
[Bias-Variance Trade-off] 19분 예상 도착? 기사님 빨리가주세요!
지난 학기 '빅데이터 해석' 강의에서 처음 접했던 개념 중 하나가 바로 Bias-Variance Trade-off였습니다.이론적으로는 이해가 갔지만, 실제로 데이터 분석에 적용하려니 "왜 Bias와 Variance를 동시에 낮추는 것이 이렇게 어려울까?"라는 의문이 들었습니다.LG Aimers에서 이 개념을 다시 배우며, 더 깊이 이해하게 된 내용을 정리해보려 합니다. 카카오 T의 도착 시간 예측1교시 수업인데 8시에 눈을 뜬 글쓴이는 급하게 택시를 잡기 위해 카카오 T를 켰습니다. "학교까지 19분이나 걸린다고? 예측이 진짜 정확할까?" Bias-Variance Trade-off는 바로 이런 예측 모델에서 겪는 문제를 설명해주는 개념입니다. 카카오 T는 사용자로부터 출발지와 도착지 같은 정보를 받아,..
2025.01.20 -
추상 자료형 (Abstract Data Type)
1. 자료구조와 알고리즘1.1 자료구조이번 방학을 알차게 보내기 위해, 방학때 이루고자 하는 목표를 차례대로 기록했다.우선, 그동안 미뤄놨던 컴퓨터 파일 정리를 했는데, 학기-과목-과제 이런 계층적인 디렉터리를 이용해서 파일을 저장했다. 목표를 차례대로 기록하는 것, 컴퓨터에 계층적인 디렉토리로 저장하는 것과 마찬가지로프로그램에서도 자료들을 정리하여 보관하는 여러 가지 구조들이 있으며, 이를 자료구조라고 한다. 예를 들면 대표적으로 다음과 같은 자료구조가 있다.스택 : 식당에서 그릇을 쌓는 것처럼 자료들을 쌓아서 정리하는 구조큐 : 마트 계산대의 줄처럼 먼저 도착한 자료가 먼저 빠져나가는 구조 1.2 알고리즘간단한 구구단 계산기 프로그램을 만들어본다고 하자.간단하게 궁금한 단 수를 입력받고, 입력받은..
2024.07.04