dplyr 패키지

  • filter(data, condition1, con2) : 데이터 프래임의 행 선별 by 조건
  • slice(data, from, to) : 데이터 프레임의 행 선별 by positon
  • distinct(data, co1, co2) : 중복없는 행 추출
  • select(data, var1, var20 : 컬럼 선택 by name
  • strts_with
  • ends_with
  • contain
  • matches
  • one_of
  • rename(data, new_var1=var1, new_var2=var2) : 데이터 프레임의 변수 이름 변경
  • arrange(col1, col2) : 데이터 프레임 정렬
  • sample_n(data, N) / sample_frac(data, 비율) : 샘플 n 행 from 테이블
  • replace=TRUE : 복원 추출
  • group_by(factor_col)%>%sample_n(N) : 집단별 층화 표본 추출
  • mutate(data, new_col=function) : 새로운 열 추가(기존 + 새로운 변수)
  • transmute(data, new_col=function) : 새로운 열 추가(새로운 변수)
  • summarise(data, function) : multiple values to a single value.
  • chain operation (%>%) : 단계절차일 때 중간결과에 대해 저장


https://blog.naver.com/liberty264/221001364360



'programing > R studio' 카테고리의 다른 글

ave() - 아직 정확히 모르겠음  (0) 2018.05.04
%in% 와 match(), merge()  (0) 2018.05.04
r 분석 블로그  (0) 2018.05.04
상관회귀분석과 결측값 처리  (0) 2018.05.04
summary()와 summarise(), group_by()  (0) 2018.05.04

+ Recent posts