TEST<-as.data.frame(FRE) #df으로 변경

colnames(TEST)<-"num" #열이름 변경

TEST$keywords<-rownames(TEST) #행이름을 데이터로 추가

rownames(TEST)<-c() #행이름 삭제

#df를 transaction으로 변경 -> 작동안함

test<-as(TXT_P_MORP$MORP, "transactions")


#df를 transaction으로 변경

write(TXT_P_MORP$MORP, file = "my_basket");

trans = read.transactions("my_basket", format = "basket", sep=",");

inspect(trans) #transaction 내용 보기

wordtable <- crossTable(trans) # 교차표 작성

tranrules <- apriori(trans, parameter=list(supp=0.05, conf=0.01)) 

inspect(tranrules) # 연관규칙 생성 결과 보기

'programing > R studio' 카테고리의 다른 글

워드클라우드 여백 없애기  (0) 2018.06.12
행이름을 데이터프레임에 새로 넣기  (0) 2018.06.11
r 크롤링  (0) 2018.05.23
r 아르 - 역수 구하기  (0) 2018.05.21
아르 r - help, example, demo  (0) 2018.05.21

A3의 처음 4번째 글자 제거

=RIGHT(A3, LEN(A3)-4)



'programing > Excel' 카테고리의 다른 글

[정리]  (0) 2018.07.19
엑셀 - 피벗테이블  (0) 2018.01.26
엑셀 - 조건부서식 , 분산형데이터 삽입  (0) 2018.01.26
엑셀 - 기본 설정  (0) 2018.01.26

<다운로드>

다운받아서 한 폴더에 넣기

(나는 selenium이라는 폴더를 만들었음)


selenium standalone server - https://www.seleniumhq.org/download/

gecko driver - https://github.com/mozilla/geckodriver/releases/tag/v0.17.0

chrome driver - https://sites.google.com/a/chromium.org/chromedriver/




<cmd>

cmd창을 관리자 권한으로 열어서

위에서 사용한 폴더로 접근


이 명령어 입력

(포트 번호가 busy하다고 나오면 다른 번호로 입력)

**standalone 버전에 맞게 입력 필요**

java -Dwebdriver.gecko.driver="geckodriver.exe" -jar selenium-server-standalone-3.11.0.jar -port 4444




<R studio>


library(RSelenium) #브라우저를 제어하기 위한 패키지

library(rvest) #HTML처리

library(httr) #HTML처리

library(stringr) #문자열 함수

ch=wdman::chrome(port=4444L) #크롬드라이버를 포트 4444번에 배정

remDr=remoteDriver(port=4444L, browserName='chrome') #remort설정

remDr$open() #크롬드라이버 실행

remDr$navigate("크롤링 하고자 하는 페이지 url")


# remDr$close #닫을 때 사용







참고

http://hmtb.tistory.com/5

https://blog.naver.com/edgelab/221179101707


역수 : 어떤 수와 곱해서 1이 되게 하는 수


> x <- c(10.4, 5.6, 3.1, 6.4, 21.7)

> 1/x #숫자의 역수

[1] 0.09615385 0.17857143 0.32258065 0.15625000 0.04608295

 


'programing > R studio' 카테고리의 다른 글

데이터 프레임을 transaction으로 변경  (0) 2018.06.11
r 크롤링  (0) 2018.05.23
아르 r - help, example, demo  (0) 2018.05.21
r paste()와 paste0() 함수  (0) 2018.05.17
r 웹크롤링 - 베스트셀러 순위 보기  (0) 2018.05.17

help(solve) 

# solve 라는 명령어 사용법에 대한 설명#


example(solve)

# solve 라는 명령어에 대한 예제#


demo(persp) 

# persp 라는 명령어에 대한 예시#

'programing > R studio' 카테고리의 다른 글

r 크롤링  (0) 2018.05.23
r 아르 - 역수 구하기  (0) 2018.05.21
r paste()와 paste0() 함수  (0) 2018.05.17
r 웹크롤링 - 베스트셀러 순위 보기  (0) 2018.05.17
tm 패키지  (0) 2018.05.17

paste() 공백 있이 문자열 붙이기

paste0() 공백 없이 문자열 붙이기

'programing > R studio' 카테고리의 다른 글

r 아르 - 역수 구하기  (0) 2018.05.21
아르 r - help, example, demo  (0) 2018.05.21
r 웹크롤링 - 베스트셀러 순위 보기  (0) 2018.05.17
tm 패키지  (0) 2018.05.17
stringr 패키지 - str_detect 함수  (0) 2018.05.17

> library(httr) # 페이지 가져오는데 필요한 패키지

> web<-GET("https://ridibooks.com/bestsellers/general?order=monthly")

>

> #XML 패키지의 htmlParse 함수로 해당 html 변환

> library(XML)

> web<-htmlParse(web)

>

> #xpathSApply(저장된 html 문서, 원하는 요소의 XPath, xmlValue)

> xpathSApply(web, '//*[@id="page_best"]/div[2]/div[2]/div[2]/h3/a/span', xmlValue)

[1] "        \n          \n            봉제인형 살인사건\n      "

>

> #\n 공백 제거

> x<-xpathSApply(web, '//*[@id="page_best"]/div[2]/div[2]/div[2]/h3/a/span', xmlValue)

> x<-gsub("\n", "", x) #\n 지우기

> x<-gsub("  ", "", x) #공백 지우기

> x

[1] "봉제인형 살인사건"

>

> #xpath 나누기

> xpath1 = '//*[@id="page_best"]/div[2]/div['

> xpath2 = ']/div[2]/h3/a/span'

>

> xpath = paste0(xpath1, i, xpath2) #paste0 공백없이 묶음

> xpath

[1] "//*[@id=\"page_best\"]/div[2]/div[10]/div[2]/h3/a/span"

>

> title = c()

>

> for(i in 1:10){

+   xpath = paste0(xpath1, i+1, xpath2) #바뀌는 숫자가 2부터 시작하므로

+   x = xpathSApply(web, xpath, xmlValue)

+   x = gsub("\n", "", x)

+   x = gsub("  ", "", x)

+   title[i] = x

+ }

>

> title

 [1] "봉제인형 살인사건"            

 [2] "우울할 뇌과학"             

 [3] "마당이 있는 "               

 [4] "로버트 그린 권력술 시리즈 세트"

 [5] "북유럽신화"                   

 [6] "82년생 김지영"                

 [7] "모든 순간이 너였다"           

 [8] "나미야 잡화점의 기적"         

 [9] "혼자 하는 공부의 정석"        

[10] "만만하게 보이지 않는 대화법"

 



출처 : http://lightblog.tistory.com/161


'programing > R studio' 카테고리의 다른 글

아르 r - help, example, demo  (0) 2018.05.21
r paste()와 paste0() 함수  (0) 2018.05.17
tm 패키지  (0) 2018.05.17
stringr 패키지 - str_detect 함수  (0) 2018.05.17
stopwords(불용어)  (0) 2018.05.17

tm 패키지

Text Mining, 텍스트 분석


Corpus 문서를 관리하는 기본 구조, 텍스트 문서들의 집합, 명사를 출일 수 있음


tm_map 함수 : 사용 빈번


Document-term metrix

문서번호와 단어간의 사용여부 or 빈도수를 만드는 작업

해당 문서의 해당용어 출현빈도를 카운팅해서 알려줌

'programing > R studio' 카테고리의 다른 글

r paste()와 paste0() 함수  (0) 2018.05.17
r 웹크롤링 - 베스트셀러 순위 보기  (0) 2018.05.17
stringr 패키지 - str_detect 함수  (0) 2018.05.17
stopwords(불용어)  (0) 2018.05.17
lapply와 do.call  (0) 2018.05.16

stringr 패키지 - str_detect 함수


> fruits <- c('apple', 'Apple', 'banana', 'pineapple')

> str_detect(fruits, "A")

[1] FALSE  TRUE FALSE FALSE

> str_detect(fruits, "^a") #a 시작하는 문자

[1]  TRUE FALSE FALSE FALSE

> str_detect(fruits, "e$") #e 끝나는 문자

[1]  TRUE  TRUE FALSE  TRUE

> str_detect(fruits, "^[aA]") #a OR A 시작하는 문자

[1]  TRUE  TRUE FALSE FALSE

> str_detect(fruits, "[aA]") #a OR A 들어가있는 문자

[1] TRUE TRUE TRUE TRUE



출처 : https://blog.naver.com/1stwook/220669068544

'programing > R studio' 카테고리의 다른 글

r 웹크롤링 - 베스트셀러 순위 보기  (0) 2018.05.17
tm 패키지  (0) 2018.05.17
stopwords(불용어)  (0) 2018.05.17
lapply와 do.call  (0) 2018.05.16
정규식 기호  (0) 2018.05.15

+ Recent posts