<다운로드>

다운받아서 한 폴더에 넣기

(나는 selenium이라는 폴더를 만들었음)


selenium standalone server - https://www.seleniumhq.org/download/

gecko driver - https://github.com/mozilla/geckodriver/releases/tag/v0.17.0

chrome driver - https://sites.google.com/a/chromium.org/chromedriver/




<cmd>

cmd창을 관리자 권한으로 열어서

위에서 사용한 폴더로 접근


이 명령어 입력

(포트 번호가 busy하다고 나오면 다른 번호로 입력)

**standalone 버전에 맞게 입력 필요**

java -Dwebdriver.gecko.driver="geckodriver.exe" -jar selenium-server-standalone-3.11.0.jar -port 4444




<R studio>


library(RSelenium) #브라우저를 제어하기 위한 패키지

library(rvest) #HTML처리

library(httr) #HTML처리

library(stringr) #문자열 함수

ch=wdman::chrome(port=4444L) #크롬드라이버를 포트 4444번에 배정

remDr=remoteDriver(port=4444L, browserName='chrome') #remort설정

remDr$open() #크롬드라이버 실행

remDr$navigate("크롤링 하고자 하는 페이지 url")


# remDr$close #닫을 때 사용







참고

http://hmtb.tistory.com/5

https://blog.naver.com/edgelab/221179101707


+ Recent posts