Tools & Skills(14)
-
데이터 전처리 기본기
데이터 분석에 필요한 기초문법pandas 라이브러리에서 제공하는 기초 문법들은 여러가지가 있지만,그 중 데이터 전처리에 필요한 기초 문법들 중 필수적인 문법 몇 가지만 알아보자 먼저 pandas 라이브러리를 임포트하고,예제 파일 학생들의 반 별(nclass) 과목별 점수가 나와있는 exam.csv 파일을 불러온다.import pandas as pddf = pd.read_csv('exam.csv') 1. query() query() 함수는 행 데이터를 추출할 때 사용한다.예를 들어, 데이터프레임(df) 데이터를 추출할 때 학생(id), 반(nclass)와 같은 연속적인 범주형 데이터를 추출할 수 있다. query() 괄호 안에 다양한 조건들을 넣어 원하는 조건의 데이터를 추출할 수 있다.# Case 1:..
2024.01.02 -
BeautifulSoup 맛 보기
BeautifulSoup로 웹 스크래핑단어와 단어의 의미만을 출력해보고 싶다면? 또, 여러 단어들의 의미들도 출력하고 싶다면? BeautifulSoup를 이용하여 웹 스크래핑 하면 쉽게 출력할 수 있다. https://semlog.tistory.com/4에서 설명한 웹 스크래핑 프로세스를 떠올려보자. URL 분석https://alldic.daum.net/search.do?q=happiness" data-ke-type="html">HTML 삽입미리보기할 수 없는 소스다음 사전에서 'happiness'를 검색했을 때의 URL이다. ? 를 기준으로 searh_do는 Daum's server-side script의 함수 중 하나를 나타내고, q=happiness는 (Web) Query를 의미하고, searh_d..
2023.12.19