'분류 전체보기' 카테고리의 글 목록 (15 Page)

분류 전체보기

[포르투갈어] 2018.06.10
[영어] 2018.06.10
통계기본 (감이 안 잡힌다) 2018.06.02
첫번째에서/끝에서 몇번째까지 글자 제거하기 2018.05.23
r 크롤링 2018.05.23
r 아르 - 역수 구하기 2018.05.21
아르 r - help, example, demo 2018.05.21
[YouTube] 성공하는 아침을 만드는 5가지 의식 2018.05.17
sns 분석 툴 10 2018.05.17
r paste()와 paste0() 함수 2018.05.17

[포르투갈어]

2018. 6. 10. 21:53

suor 땀

chule 발냄새

equipe 팀

pisar 밟다

focar 집중하다

basta falar = just talk

comando = command 지휘, 명령

Haverá suporte para outros idiomas. = There will be support for other languages.

auxiliar 지원하다

'me myself and i > portuguese' 카테고리의 다른 글

[포르투갈어] (0)	2018.06.18
[포어] contorno / arrasar (0)	2018.06.14
포르투갈어 단어 (0)	2018.05.08
[포어 기사 번역] Galaxy S9 e Galaxy S9+ (0)	2018.05.03
포어 기사 번역 (0)	2018.05.02

[영어]

2018. 6. 10. 21:52

I want to be a diligent like you.

that would be interesting. 재밌을 것 같아

It looks fun. 재밌겠다

That sounds great/Must be nice/You are so lucky/Good for her/You must be happy 좋겠다

'me myself and i > english' 카테고리의 다른 글

[영어] (0)	2018.06.12
[영어] 감정표현 : 안타깝다, 속상하다 (0)	2018.06.11
hit the hay - (피곤해서) 잠을 자다 (0)	2018.04.16
담당 부서를 가르쳐 주세요 (0)	2018.03.28
영어회화 100일의 기적 - 2일차 (2)	2018.03.27

통계기본 (감이 안 잡힌다)

2018. 6. 2. 14:43

의사결정나무

분류/확률(추정)을 위한 것

다지분리?

회귀나무(regression tree)도 의사결정나무를 만들어 예측 가능하다.

목표변수가 연속형 값일 경우 -> 의사결정나무보다는 회귀모델이나 인공신경망 사용하는게 좋음

의사결정나무 알고리즘

-. 목표변수(부모노드) - 순수도(자식노드) - 순수도 - 순수도

의사결정나무 목표

입력변수 값을 기초로 의사결정나무를 만드는 것

*범주형 타겟 변수 : gini척도, 정보이익, 카이제곱

*연속형 목표 변수 : f-test, 분산

회귀분석은 결측값이 있으면 안 됨!

아예 빼거나 다른 값 넣기

의사결정나무는 결측값 있어도 ㄱㅊㄱㅊ NULL도 하나의 값으로 인식함

순수도 척도 : 0~1까지 부여

1이 아주 순수함(한 노드에 클래스 1개일 경우)

이 값에서 1을 빼면 다양성 척도

- 범주형 변수에 대한 분할을 평가하는 순수도 척도 : 지나, 엔트로피, 정보 이익, 정보 이익 비율, 카이제곱 검정

- 수치형 목표 변수의 경우 : 분산의 감소, F검정

지니

- 모집단의 순수도 판정

- 인구 다양성을 조사하는 생물학자와 환경 공학자들이 자주 사용

- 랜덤하게 추출했을 때, 그 클래스가 동일한 클래스에 있을 확률

- 완전 순수한 노드의 경우 지니척도는 1이다

엔트로피 감소(정보 이익)

- 정보 이론(머신 러닝 기법)에서 가져온 기법

- 비트 수 개념

ex 16가지 가능한 상태들이 있다면 log2 (16) 즉, 4비트 이다.

정보 이익 비율(information gain ratio)

- 클래스를 나눌 때 가지가 많으면 패널티를 주는 방식

- bushy trees : 잔가지가 많은 트리

카이제곱검정(chi-square by Pearson)

- 통계학적 유의성에 대한 검정

- 범주에 대한 기대값과 관측값의 표준화된 차이의 제곱들의 합으로 정의

- 관측된 표본들 간의 차이가 우연에 의한 것일 확률을 추정

- contingency table(분할표)

- 결과가 큰 수를 선택하는게 맞음

- CHAID[체이드] : 최선의 분할을 고를 때; 목표 변수에 대한 유의하게 다른 효과를 갖지 않은 클래스들을 통합할 때(분할 된 노드를 하나로 합치는 것이 어떨까); 노드에 대하여 추가적인 분할이 필요한 지를 결정할 때

- 범주형일 경우 사용

(but, 연속형 변수의 경우에는 분산 or F-검정 사용)

F 검정

- 다른 평균과 분산을 가진 표본들이 같은 모집단에서 실제로 나왔을 확률에 대한 척도 제공

- F 점수 : 두 추정치의 비율

- 하나는 모든 표본을 포함하는 집단에서 합쳐진 분산으로 부터, 다른 하나는 표본 평균들로 계산된 표본들 사이의 분산으로 유도

- 점수가 클 수록 표본들이 같은 모집단에서 나왔을 확률이 낮음

'분석 > 통계분석' 카테고리의 다른 글

보간법(interpolation) (0)	2019.01.30
[비선형 회귀 분석] (0)	2018.12.11
계수 중 e 지수 계산하기 (1)	2018.09.17
임계값 (0)	2018.07.24
독립변수/종속변수 (0)	2018.05.08

첫번째에서/끝에서 몇번째까지 글자 제거하기

2018. 5. 23. 14:34

A3의 처음 4번째 글자 제거

=RIGHT(A3, LEN(A3)-4)

'programing > Excel' 카테고리의 다른 글

[정리] (0)	2018.07.19
엑셀 - 피벗테이블 (0)	2018.01.26
엑셀 - 조건부서식 , 분산형데이터 삽입 (0)	2018.01.26
엑셀 - 기본 설정 (0)	2018.01.26

r 크롤링

2018. 5. 23. 14:33

<다운로드>

다운받아서 한 폴더에 넣기

(나는 selenium이라는 폴더를 만들었음)

selenium standalone server - https://www.seleniumhq.org/download/

gecko driver - https://github.com/mozilla/geckodriver/releases/tag/v0.17.0

chrome driver - https://sites.google.com/a/chromium.org/chromedriver/

<cmd>

cmd창을 관리자 권한으로 열어서

위에서 사용한 폴더로 접근

이 명령어 입력

(포트 번호가 busy하다고 나오면 다른 번호로 입력)

**standalone 버전에 맞게 입력 필요**

java -Dwebdriver.gecko.driver="geckodriver.exe" -jar selenium-server-standalone-3.11.0.jar -port 4444

library(RSelenium) #브라우저를 제어하기 위한 패키지

library(rvest) #HTML처리

library(httr) #HTML처리

library(stringr) #문자열 함수

ch=wdman::chrome(port=4444L) #크롬드라이버를 포트 4444번에 배정

remDr=remoteDriver(port=4444L, browserName='chrome') #remort설정

remDr$open() #크롬드라이버 실행

remDr$navigate("크롤링 하고자 하는 페이지 url")

# remDr$close #닫을 때 사용

참고

http://hmtb.tistory.com/5

https://blog.naver.com/edgelab/221179101707

'programing > R studio' 카테고리의 다른 글

행이름을 데이터프레임에 새로 넣기 (0)	2018.06.11
데이터 프레임을 transaction으로 변경 (0)	2018.06.11
r 아르 - 역수 구하기 (0)	2018.05.21
아르 r - help, example, demo (0)	2018.05.21
r paste()와 paste0() 함수 (0)	2018.05.17

r 아르 - 역수 구하기

2018. 5. 21. 07:15

역수 : 어떤 수와 곱해서 1이 되게 하는 수

> x <- c(10.4, 5.6, 3.1, 6.4, 21.7)

> 1/x #숫자의 역수

[1] 0.09615385 0.17857143 0.32258065 0.15625000 0.04608295

'programing > R studio' 카테고리의 다른 글

데이터 프레임을 transaction으로 변경 (0)	2018.06.11
r 크롤링 (0)	2018.05.23
아르 r - help, example, demo (0)	2018.05.21
r paste()와 paste0() 함수 (0)	2018.05.17
r 웹크롤링 - 베스트셀러 순위 보기 (0)	2018.05.17

아르 r - help, example, demo

2018. 5. 21. 07:08

help(solve)

# solve 라는 명령어 사용법에 대한 설명#

example(solve)

# solve 라는 명령어에 대한 예제#

demo(persp)

# persp 라는 명령어에 대한 예시#

'programing > R studio' 카테고리의 다른 글

r 크롤링 (0)	2018.05.23
r 아르 - 역수 구하기 (0)	2018.05.21
r paste()와 paste0() 함수 (0)	2018.05.17
r 웹크롤링 - 베스트셀러 순위 보기 (0)	2018.05.17
tm 패키지 (0)	2018.05.17

[YouTube] 성공하는 아침을 만드는 5가지 의식

2018. 5. 17. 19:20

다시 내일 아침부터 힘내서 해봐야겠다

'video' 카테고리의 다른 글

[YouTube] 스티브 잡스 - 마케팅의 본질 (0)	2018.05.17

sns 분석 툴 10

2018. 5. 17. 17:35

http://www.ciokorea.com/news/37875?page=0,0

'분석 > 리서치마케팅' 카테고리의 다른 글

NPS(Net Promotion Score) (0)	2018.07.16
확증편향, 필터버블, 반향실 (0)	2018.07.11
어근과 형태소 (0)	2018.05.17
리치 미디어 마케팅 (0)	2018.05.15
정규화(normalization) (0)	2018.05.11

r paste()와 paste0() 함수

2018. 5. 17. 17:27

paste() 공백 있이 문자열 붙이기

paste0() 공백 없이 문자열 붙이기

'programing > R studio' 카테고리의 다른 글

r 아르 - 역수 구하기 (0)	2018.05.21
아르 r - help, example, demo (0)	2018.05.21
r 웹크롤링 - 베스트셀러 순위 보기 (0)	2018.05.17
tm 패키지 (0)	2018.05.17
stringr 패키지 - str_detect 함수 (0)	2018.05.17

PREV 1 ···12 13 14 15 16 17 18 ···36 NEXT

h-elena