from urllib.request import urlopen
# urllib 헤더 모듈 사용
f = urlopen('http://hanbit.co.kr')
# urlopen()는 HTTPResponse 자료형의 객체를 반환
print(f.read())
# read() 메서드로 HTTP 응답 본문(bytes 자료형)을 추출
print(f.getheader('Content-Type'))
# http 헤더의 값을 추출
'Data science > 크롤링' 카테고리의 다른 글
re 모듈 기본 사용법 (0) | 2022.05.18 |
---|---|
html 인코딩 방식 추출 (0) | 2022.05.18 |
Wget 실습(원하는 부분 가져오기) (0) | 2022.05.15 |
Wget 실습(실제 사이트 크롤링) (0) | 2022.05.15 |
Wget 옵션 (0) | 2022.05.15 |