suor 땀

chule 발냄새

equipe 팀

pisar 밟다

focar 집중하다

basta falar = just talk

comando = command 지휘, 명령

Haverá suporte para outros idiomas. = There will be support for other languages.

auxiliar 지원하다

'me myself and i > portuguese' 카테고리의 다른 글

[포르투갈어]  (0) 2018.06.18
[포어] contorno / arrasar  (0) 2018.06.14
포르투갈어 단어  (0) 2018.05.08
[포어 기사 번역] Galaxy S9 e Galaxy S9+  (0) 2018.05.03
포어 기사 번역  (0) 2018.05.02

I want to be a diligent like you.

that would be interesting. 재밌을 것 같아

It looks fun. 재밌겠다

That sounds great/Must be nice/You are so lucky/Good for her/You must be happy 좋겠다

의사결정나무


분류/확률(추정)을 위한 것


다지분리?


회귀나무(regression tree)도 의사결정나무를 만들어 예측 가능하다.


목표변수가 연속형 값일 경우 -> 의사결정나무보다는 회귀모델이나 인공신경망 사용하는게 좋음


의사결정나무 알고리즘

-. 목표변수(부모노드) - 순수도(자식노드) - 순수도 - 순수도


의사결정나무 목표

입력변수 값을 기초로 의사결정나무를 만드는 것



*범주형 타겟 변수 : gini척도, 정보이익, 카이제곱

*연속형 목표 변수 : f-test, 분산


회귀분석은 결측값이 있으면 안 됨!

아예 빼거나 다른 값 넣기


의사결정나무는 결측값 있어도 ㄱㅊㄱㅊ NULL도 하나의 값으로 인식함



순수도 척도 : 0~1까지 부여

1이 아주 순수함(한 노드에 클래스 1개일 경우)

이 값에서 1을 빼면 다양성 척도




- 범주형 변수에 대한 분할을 평가하는 순수도 척도 : 지나, 엔트로피, 정보 이익, 정보 이익 비율, 카이제곱 검정

- 수치형 목표 변수의 경우 : 분산의 감소, F검정


지니 

- 모집단의 순수도 판정

- 인구 다양성을 조사하는 생물학자와 환경 공학자들이 자주 사용

- 랜덤하게 추출했을 때, 그 클래스가 동일한 클래스에 있을 확률

- 완전 순수한 노드의 경우 지니척도는 1이다



엔트로피 감소(정보 이익)

- 정보 이론(머신 러닝 기법)에서 가져온 기법

- 비트 수 개념

ex 16가지 가능한 상태들이 있다면 log2 (16) 즉, 4비트 이다.




정보 이익 비율(information gain ratio)

- 클래스를 나눌 때 가지가 많으면 패널티를 주는 방식

- bushy trees : 잔가지가 많은 트리




카이제곱검정(chi-square by Pearson)

- 통계학적 유의성에 대한 검정

- 범주에 대한 기대값과 관측값의 표준화된 차이의 제곱들의 합으로 정의

- 관측된 표본들 간의 차이가 우연에 의한 것일 확률을 추정

- contingency table(분할표)

- 결과가 큰 수를 선택하는게 맞음

- CHAID[체이드] : 최선의 분할을 고를 때; 목표 변수에 대한 유의하게 다른 효과를 갖지 않은 클래스들을 통합할 때(분할 된 노드를 하나로 합치는 것이 어떨까); 노드에 대하여 추가적인 분할이 필요한 지를 결정할 때

- 범주형일 경우 사용

(but, 연속형 변수의 경우에는 분산 or F-검정 사용)




F 검정

- 다른 평균과 분산을 가진 표본들이 같은 모집단에서 실제로 나왔을 확률에 대한 척도 제공

- F 점수 : 두 추정치의 비율

- 하나는 모든 표본을 포함하는 집단에서 합쳐진 분산으로 부터, 다른 하나는 표본 평균들로 계산된 표본들 사이의 분산으로 유도

- 점수가 클 수록 표본들이 같은 모집단에서 나왔을 확률이 낮음

'분석 > 통계분석' 카테고리의 다른 글

보간법(interpolation)  (0) 2019.01.30
[비선형 회귀 분석]  (0) 2018.12.11
계수 중 e 지수 계산하기  (1) 2018.09.17
임계값  (0) 2018.07.24
독립변수/종속변수  (0) 2018.05.08

A3의 처음 4번째 글자 제거

=RIGHT(A3, LEN(A3)-4)



'programing > Excel' 카테고리의 다른 글

[정리]  (0) 2018.07.19
엑셀 - 피벗테이블  (0) 2018.01.26
엑셀 - 조건부서식 , 분산형데이터 삽입  (0) 2018.01.26
엑셀 - 기본 설정  (0) 2018.01.26

<다운로드>

다운받아서 한 폴더에 넣기

(나는 selenium이라는 폴더를 만들었음)


selenium standalone server - https://www.seleniumhq.org/download/

gecko driver - https://github.com/mozilla/geckodriver/releases/tag/v0.17.0

chrome driver - https://sites.google.com/a/chromium.org/chromedriver/




<cmd>

cmd창을 관리자 권한으로 열어서

위에서 사용한 폴더로 접근


이 명령어 입력

(포트 번호가 busy하다고 나오면 다른 번호로 입력)

**standalone 버전에 맞게 입력 필요**

java -Dwebdriver.gecko.driver="geckodriver.exe" -jar selenium-server-standalone-3.11.0.jar -port 4444




<R studio>


library(RSelenium) #브라우저를 제어하기 위한 패키지

library(rvest) #HTML처리

library(httr) #HTML처리

library(stringr) #문자열 함수

ch=wdman::chrome(port=4444L) #크롬드라이버를 포트 4444번에 배정

remDr=remoteDriver(port=4444L, browserName='chrome') #remort설정

remDr$open() #크롬드라이버 실행

remDr$navigate("크롤링 하고자 하는 페이지 url")


# remDr$close #닫을 때 사용







참고

http://hmtb.tistory.com/5

https://blog.naver.com/edgelab/221179101707


역수 : 어떤 수와 곱해서 1이 되게 하는 수


> x <- c(10.4, 5.6, 3.1, 6.4, 21.7)

> 1/x #숫자의 역수

[1] 0.09615385 0.17857143 0.32258065 0.15625000 0.04608295

 


'programing > R studio' 카테고리의 다른 글

데이터 프레임을 transaction으로 변경  (0) 2018.06.11
r 크롤링  (0) 2018.05.23
아르 r - help, example, demo  (0) 2018.05.21
r paste()와 paste0() 함수  (0) 2018.05.17
r 웹크롤링 - 베스트셀러 순위 보기  (0) 2018.05.17

help(solve) 

# solve 라는 명령어 사용법에 대한 설명#


example(solve)

# solve 라는 명령어에 대한 예제#


demo(persp) 

# persp 라는 명령어에 대한 예시#

'programing > R studio' 카테고리의 다른 글

r 크롤링  (0) 2018.05.23
r 아르 - 역수 구하기  (0) 2018.05.21
r paste()와 paste0() 함수  (0) 2018.05.17
r 웹크롤링 - 베스트셀러 순위 보기  (0) 2018.05.17
tm 패키지  (0) 2018.05.17




다시 내일 아침부터 힘내서 해봐야겠다

'video' 카테고리의 다른 글

[YouTube] 스티브 잡스 - 마케팅의 본질  (0) 2018.05.17

http://www.ciokorea.com/news/37875?page=0,0

'분석 > 리서치마케팅' 카테고리의 다른 글

NPS(Net Promotion Score)  (0) 2018.07.16
확증편향, 필터버블, 반향실  (0) 2018.07.11
어근과 형태소  (0) 2018.05.17
리치 미디어 마케팅  (0) 2018.05.15
정규화(normalization)  (0) 2018.05.11

paste() 공백 있이 문자열 붙이기

paste0() 공백 없이 문자열 붙이기

'programing > R studio' 카테고리의 다른 글

r 아르 - 역수 구하기  (0) 2018.05.21
아르 r - help, example, demo  (0) 2018.05.21
r 웹크롤링 - 베스트셀러 순위 보기  (0) 2018.05.17
tm 패키지  (0) 2018.05.17
stringr 패키지 - str_detect 함수  (0) 2018.05.17

+ Recent posts