
[웹 크롤링] 정적 크롤링 (requests, beautifulSoup)
·
Python/Web Crawling
1. 웹 크롤링 배경 지식HTTP 통신 : 웹 브라우저와 웹 서버 간에 데이터를 주고받기 위해 사용되는 통신브라우저에서 서버에 url을 요청 ➔ 서버에서 HTML 형식으로 응답해줌 (HTML에 페이지에 대한 정보가 들어있음)ex1) www.naver.com을 입력(요청)하면, 서버에서 그 그 사이트 정보를 HTML 형식으로 반환해줌ex2) 존재하지 않는 주소를 요청하면, 서버에서 "404 Not Found"라고 응답함웹 페이지의 정보를 크롤링하려면, HTML과 CSS 선택자에 대한 개념을 알아야 함 2. 웹 사이트 기초HTML : 구조CSS : 디자인JavaScript : 동작2.1. HTML 환경 설정 (실습 준비)VSCODE에서 .html 파일 생성셀에 `!` 입력하고 Enter 치면 기본 틀이 자..