df <- read.csv("http://goo.gl/HKnl74")

str(df)

colSums(is.na(df)) #col별로 결측값 개수 구하기


#놀이기구에 대한 만족도와 전체 만족도 간의 관계

#산점도 그리기

attach(df)

plot(overall~rides) #(y축~x축)

plot(overall, rides) #(x축, y축)


#cex=점 크기, pch=점 형태(1-빈원/2-세모/3-더하기/4-곱하기/5-마름모/6-역삼각형...)

#xlim=x축 값의 출력범위 지정, ylim=y축 값의 출력범위 지정, lty=출력되는 선의 형태 지정

plot(overall~rides, main="Overall~Rides", 

     xlab="Satisfaction with Rides", ylab="Overall Satisfaction", 

     cex=1, pch=6, col="blue")


#attach()와 detach()

detach(df)

df$weekend

attach(df)

weekend


#공분산 값 구하기

cov(overall, rides)


#상관계수 구하기 (두 변수 간 선형관계의 강도를 알 수 있음)

#use = 'complete.obs' : 결측값 제거된 상태에서 상관계수를 계산

#method = 'pearson' : 피어슨 상관계수 지정

cor(overall, rides, use = 'complete.obs', method = 'pearson')


#cor함수에 대해 더 알아보기

?cor


#상관계수 검정 

cor.test(overall, rides)


출처 ...

'programing > R studio' 카테고리의 다른 글

set.seed()  (0) 2018.05.15
file.choose() - 파일을 선택하여 불러오기  (0) 2018.05.11
sprintf()  (0) 2018.05.09
CA() - Correspondence Analysis  (0) 2018.05.08
fviz_ca()  (0) 2018.05.08

+ Recent posts