RMSE(root-mean-squared error)

It does this by measuring difference between predicted values and the actual values.

In a good model, the RMSE should be close for both your testing data and your training data.

출처: https://www.quora.com/What-is-the-meaning-of-root-mean-squared-error-RMSE-in-statistics

'분석 > 통계분석' 카테고리의 다른 글

2. 자료의 분류  (0) 2019.02.10
1. 통계학이란/표본추출법  (0) 2019.02.10
학습용(Training), 검증용(Validation), 시험용(Test) 데이터 분류  (0) 2019.01.30
시계열 분석  (0) 2019.01.30
보간법(interpolation)  (0) 2019.01.30

시계열 ts()

R로 시계열 분석 시, frequency를 나눌 때는 데이터가 frequency대로 정확하게 떨어지게 나눠야 함

ex)

ts(data, start=c(2012,3), frequency = 12) 

2012년 1월~2018년 2월 자료까지 밖에 없는 경우

2012년 3월을 start 점으로 해줘야 함

'programing > R studio' 카테고리의 다른 글

R 패키지 설치 에러  (3) 2019.06.09
R 단축키  (0) 2019.03.23
approx VS approxfun  (0) 2019.01.30
특정 행 or 열 이름만 바꾸기  (0) 2018.12.03
duplicated(), unique(), distinct()  (0) 2018.09.17

학습용(Training), 검증용(Validation), 시험용(Test) 데이터 분류

1) 시계열 데이터가 아닌 경우

- seed 설정 후 분류


2) 시계열 데이터일 경우

Training data - 오래된 데이터

Validation data - 그 다음 데이터

Test data - 가장 최신의 데이터


참고: http://kkokkilkon.tistory.com/13

'분석 > 통계분석' 카테고리의 다른 글

1. 통계학이란/표본추출법  (0) 2019.02.10
RMSE(root-mean-squared error)  (0) 2019.01.30
시계열 분석  (0) 2019.01.30
보간법(interpolation)  (0) 2019.01.30
[비선형 회귀 분석]  (0) 2018.12.11

approx VS approxfun


1. approx

- 지정된 점 혹은 지전된 수의 근사함수의 값을 리턴한다

- 알고 있는 지점에서 근사값(approximation)이 필요한 경우에 사용


2. approxfun

- 특정 시점에서 평가할 수 있는 함수를 반환한다

- 추후에 주어진 인수에 대해 근사값을 반환하는 함수가 필요한 경우에 사용



'programing > R studio' 카테고리의 다른 글

R 단축키  (0) 2019.03.23
시계열 ts()  (0) 2019.01.30
특정 행 or 열 이름만 바꾸기  (0) 2018.12.03
duplicated(), unique(), distinct()  (0) 2018.09.17
merge 함수의 all.x = TRUE  (0) 2018.09.10

시계열 분석 시, 주로 monthly, yearly 혹은 weekly 데이터로 추정함


daily데이터로는 추정하는 경우는, 일자별로 데이터 수가 중요할 때

예를 들면, 업무시간! 월~금의 업무시간과 주말의 업무시간은 차이가 날 수 밖에 없음

보간법(interpolation) 

가장 기본이 되는건 선형보간법으로 데이터 평균으로 추측하는 법

'분석 > 통계분석' 카테고리의 다른 글

학습용(Training), 검증용(Validation), 시험용(Test) 데이터 분류  (0) 2019.01.30
시계열 분석  (0) 2019.01.30
[비선형 회귀 분석]  (0) 2018.12.11
계수 중 e 지수 계산하기  (1) 2018.09.17
임계값  (0) 2018.07.24

El nido


Puerto princesa -> van or motobicle

*motobicle-500pesos/per day(24h)/4.5hours commute

'travel' 카테고리의 다른 글

padi 스쿠버다이빙 자격증 종류  (0) 2018.09.18
격포해변  (0) 2018.02.17
대전 달방구  (0) 2018.02.17
여수 낭만카페  (0) 2018.02.17
일본  (0) 2018.02.17

100자 이내

트래픽 높으면서

혼잡도가 낮은 단어들


일반적 키워드 40%

선점되지 않은 키워드 60%(혼잡도 1 넘고, 이미 등록된 앱 20개 이상일 경우 사용하지 않도록)

'분석 > 리서치마케팅' 카테고리의 다른 글

[용어]  (0) 2018.09.27
active data VS passive data  (0) 2018.08.20
애드혹 조사  (0) 2018.08.20
그로스 해킹  (0) 2018.07.19
큐레이션  (0) 2018.07.17

+ Recent posts