BeautifulSoup 맛 보기
·
Data Analysis/Python
BeautifulSoup로 웹 스크래핑단어와 단어의 의미만을 출력해보고 싶다면? 또, 여러 단어들의 의미들도 출력하고 싶다면? BeautifulSoup를 이용하여 웹 스크래핑 하면 쉽게 출력할 수 있다. https://semlog.tistory.com/4에서 설명한 웹 스크래핑 프로세스를 떠올려보자. URL 분석https://alldic.daum.net/search.do?q=happiness" data-ke-type="html">HTML 삽입미리보기할 수 없는 소스다음 사전에서 'happiness'를 검색했을 때의 URL이다. ? 를 기준으로 searh_do는 Daum's server-side script의 함수 중 하나를 나타내고, q=happiness는 (Web) Query를 의미하고, searh_d..
개발자 도구 & Web Scraping 프로세스
·
Portfolio/kakao X goorm 군 장병 AI·SW 교육
개발자 도구 네이버에 데이터분석을 검색 후 뉴스 기사를 들어간 후 페이지의 아무 부분에 커서를 대고 마우스 오른쪽 클릭을 하면 페이지 소스 보기 항목이 나온다. 항목을 누르면 다음과 같은 HTML 코드가 쭉 작성된 페이지가 새로 나타난다. 앞서 배운것처럼 태그 안에 태그가 있고, 그 안에는 css나 JS와 관련된 여러 태그들로 구성되어 있는 것을 볼 수 있다. 잘 들여다보면 페이지의 박스와 관련된 div안에 div가 들어가 있는 식으로 여러 개의 div가 중첩되어 있는 것을 볼 수 있다. 만약 본문에 해당하는 태그를 찾으려면? 소스 페이지에서 본문에 해당하는 태그를 직접 찾으려면 매우 번거롭고, 오래 걸릴 것이다. 이때 우리를 도와줄 도구가 오늘 배울 개발자 도구 이다. 뉴스 기사 페이지에서 Ctrl +..
Web Scarping & HTML 기초
·
Portfolio/kakao X goorm 군 장병 AI·SW 교육
Web Scraping vs Web Craling 우리는 원하는 정보를 얻기 위해 다양한 플랫폼을 이용하고 있다. 네이버와 같은 검색 포털부터, 야놀자와 같은 숙박업소 정보 플랫폼 등 카테고리 별로 떠오르는 플랫폼만 해도 수십 가지이다. 이처럼 수많은 플랫폼 사이에서 우리는 '우리가 찾는 데이터를 얼마나 많이 보유하고, 알맞게 보여주는지'에 따라 플랫폼을 선택한다. 플랫폼들은 수많은 데이터 속에서 웹 크롤링(Web Crawling) 과 웹 스크래핑(Scraping) 기술을 활용하여 고객에게 서비스를 제공한다. 두 기술의 차이가 뭘까? 웹 크롤링(Web Crawling) 웹 크롤링이란 웹 상의 정보들을 탐색하고 수집하는 작업이다. 인터넷에 존재하는 방대한 양의 정보를 사람이 일일이 파악하는 것은 불가능하므..
semlng
'web scraping' 태그의 글 목록