본문 바로가기

Data science/크롤링

urllib 기초

from urllib.request import urlopen
# urllib 헤더 모듈 사용

f = urlopen('http://hanbit.co.kr')
# urlopen()는 HTTPResponse 자료형의 객체를 반환

print(f.read())
# read() 메서드로 HTTP 응답 본문(bytes 자료형)을 추출

print(f.getheader('Content-Type'))
# http 헤더의 값을 추출

'Data science > 크롤링' 카테고리의 다른 글

re 모듈 기본 사용법  (0) 2022.05.18
html 인코딩 방식 추출  (0) 2022.05.18
Wget 실습(원하는 부분 가져오기)  (0) 2022.05.15
Wget 실습(실제 사이트 크롤링)  (0) 2022.05.15
Wget 옵션  (0) 2022.05.15