library(caret)
createDataPartition()
: 층화 균등 추출에 사용되는 함수이다. 계층 별로 비율을 동일하게, 랜덤하게 뽑아준다.
1) createDataPartition(y, times = 1, p = 0.5, list = TRUE, groups = min(5, length(y)))
- y : 대상 vector
- p : 선택할 데이터 확률
2) 사용예
- df <- data.frame(replicate(10,sample(1:3, 20,rep=TRUE)))
- createDataPartition(y = df$X1, p = 0.7, list = FALSE, groups = min(2, length(df$X1)))
[출처] R 표본 샘플링 - 홀드아웃 holdout 방법|작성자 나리
https://blog.naver.com/nyaminyam/221246413590
[출처] sample, createDataPartition 사용법|작성자 이해할때까지
https://blog.naver.com/wujuchoi/221058021095
'programing > R studio' 카테고리의 다른 글
기하분포 - dgeom (0) | 2018.07.02 |
---|---|
ggplot2 - scale_x_discrete, scale_y_discrete - x, y값 순서 정렬 (0) | 2018.06.29 |
dcast() (0) | 2018.06.26 |
정규화란? (0) | 2018.06.25 |
선형회귀 lm(), predict(), abline(), coef() (0) | 2018.06.24 |