본문 바로가기
crawling

웹 크롤링 기초

by 주니코니 2023. 7. 10.

driver.maximize_window()

driver.set_window_size(800,600) #가로x세로

사이즈 지정해줄 수도 있다

 

파일 열고 닫기

open, close -> with open 추천

 

time sleep

작업 사이사이, time sleep 1,2초 정도 주는 것이 좋다

0.1초는 큰 의미가 없다

 

index 차곡차곡 추출하는 함수는 enumerate로 자주 쓴다

 

웹 브라우저 닫기

driver.quit()보다 driver.close()를 많이 쓴다

 

multi line text

ex1 = """ 

 

end키

페이지 끝까지 긁는 크롤링 키 : END

 

Tip 크롤링 할 때 

1.id, xpath, class 등 원하는 거(간단한 거) 선택해서 작업하면 됨

2.linktext는 태그 및 href(hyper link)를 말함

3.태그란? '<a'는  a 태그라 함

(아래 이미지에서는 link 태그)