학습용(Training), 검증용(Validation), 시험용(Test) 데이터 분류

1) 시계열 데이터가 아닌 경우

- seed 설정 후 분류


2) 시계열 데이터일 경우

Training data - 오래된 데이터

Validation data - 그 다음 데이터

Test data - 가장 최신의 데이터


참고: http://kkokkilkon.tistory.com/13

'분석 > 통계분석' 카테고리의 다른 글

1. 통계학이란/표본추출법  (0) 2019.02.10
RMSE(root-mean-squared error)  (0) 2019.01.30
시계열 분석  (0) 2019.01.30
보간법(interpolation)  (0) 2019.01.30
[비선형 회귀 분석]  (0) 2018.12.11

approx VS approxfun


1. approx

- 지정된 점 혹은 지전된 수의 근사함수의 값을 리턴한다

- 알고 있는 지점에서 근사값(approximation)이 필요한 경우에 사용


2. approxfun

- 특정 시점에서 평가할 수 있는 함수를 반환한다

- 추후에 주어진 인수에 대해 근사값을 반환하는 함수가 필요한 경우에 사용



'programing > R studio' 카테고리의 다른 글

R 단축키  (0) 2019.03.23
시계열 ts()  (0) 2019.01.30
특정 행 or 열 이름만 바꾸기  (0) 2018.12.03
duplicated(), unique(), distinct()  (0) 2018.09.17
merge 함수의 all.x = TRUE  (0) 2018.09.10

시계열 분석 시, 주로 monthly, yearly 혹은 weekly 데이터로 추정함


daily데이터로는 추정하는 경우는, 일자별로 데이터 수가 중요할 때

예를 들면, 업무시간! 월~금의 업무시간과 주말의 업무시간은 차이가 날 수 밖에 없음

+ Recent posts