dplyr 패키지
- filter(data, condition1, con2) : 데이터 프래임의 행 선별 by 조건
- slice(data, from, to) : 데이터 프레임의 행 선별 by positon
- distinct(data, co1, co2) : 중복없는 행 추출
- select(data, var1, var20 : 컬럼 선택 by name
- strts_with
- ends_with
- contain
- matches
- one_of
- rename(data, new_var1=var1, new_var2=var2) : 데이터 프레임의 변수 이름 변경
- arrange(col1, col2) : 데이터 프레임 정렬
- sample_n(data, N) / sample_frac(data, 비율) : 샘플 n 행 from 테이블
- replace=TRUE : 복원 추출
- group_by(factor_col)%>%sample_n(N) : 집단별 층화 표본 추출
- mutate(data, new_col=function) : 새로운 열 추가(기존 + 새로운 변수)
- transmute(data, new_col=function) : 새로운 열 추가(새로운 변수)
- summarise(data, function) : multiple values to a single value.
- chain operation (%>%) : 단계절차일 때 중간결과에 대해 저장
https://blog.naver.com/liberty264/221001364360
'programing > R studio' 카테고리의 다른 글
ave() - 아직 정확히 모르겠음 (0) | 2018.05.04 |
---|---|
%in% 와 match(), merge() (0) | 2018.05.04 |
r 분석 블로그 (0) | 2018.05.04 |
상관회귀분석과 결측값 처리 (0) | 2018.05.04 |
summary()와 summarise(), group_by() (0) | 2018.05.04 |