df <- read.csv("http://goo.gl/HKnl74")
str(df)
colSums(is.na(df)) #col별로 결측값 개수 구하기
#놀이기구에 대한 만족도와 전체 만족도 간의 관계
#산점도 그리기
attach(df)
plot(overall~rides) #(y축~x축)
plot(overall, rides) #(x축, y축)
#cex=점 크기, pch=점 형태(1-빈원/2-세모/3-더하기/4-곱하기/5-마름모/6-역삼각형...)
#xlim=x축 값의 출력범위 지정, ylim=y축 값의 출력범위 지정, lty=출력되는 선의 형태 지정
plot(overall~rides, main="Overall~Rides",
xlab="Satisfaction with Rides", ylab="Overall Satisfaction",
cex=1, pch=6, col="blue")
#attach()와 detach()
detach(df)
df$weekend
attach(df)
weekend
#공분산 값 구하기
cov(overall, rides)
#상관계수 구하기 (두 변수 간 선형관계의 강도를 알 수 있음)
#use = 'complete.obs' : 결측값 제거된 상태에서 상관계수를 계산
#method = 'pearson' : 피어슨 상관계수 지정
cor(overall, rides, use = 'complete.obs', method = 'pearson')
#cor함수에 대해 더 알아보기
?cor
#상관계수 검정
cor.test(overall, rides)
출처 ...
'programing > R studio' 카테고리의 다른 글
set.seed() (0) | 2018.05.15 |
---|---|
file.choose() - 파일을 선택하여 불러오기 (0) | 2018.05.11 |
sprintf() (0) | 2018.05.09 |
CA() - Correspondence Analysis (0) | 2018.05.08 |
fviz_ca() (0) | 2018.05.08 |