긍정적인 사고와 행동으로 선한 영향력을 줄 수 있도록

Python

Python 웹 페이지 크롤링 허용 여부 확인하기

리거니 2022. 2. 8. 21:14
웹 페이지를 크롤링하기 전에 크롤링 허용 여부를 확인하는 작업이 필요하다.


방법

주소 창에 '크롤링할 주소/robots.txt' 를 입력

만약 robots.txt 파일이 없다면 수집에 대한 정책이 없으므로 크롤링 해도 된다는 뜻 !

 

 

membership + /myHollys 경로 제외 모든 접근 허용