'분류 전체보기' 카테고리의 글 목록 (17 Page)

분류 전체보기

정규화(normalization) 2018.05.11
file.choose() - 파일을 선택하여 불러오기 2018.05.11
놀이동산 관련 데이터 분석 - 미완성 2018.05.09
sprintf() 2018.05.09
csv 한글 깨짐 현상 2018.05.09
포르투갈어 단어 2018.05.08
CA() - Correspondence Analysis 2018.05.08
fviz_ca() 2018.05.08
fviz_pca 2018.05.08
predict() 2018.05.08

정규화(normalization)

2018. 5. 11. 11:23

정규화(normalization)

데이터를 일정한 규칙에 따라 변형하여 이용하기 쉽게 만드는 일

정규화는 이상 현상이 발생하지 않도록, 릴레이션을 관련이 있는 속성들로만 구성하기 위해 릴레이션을 분해(decomposition)하는 과정이다. 정규화를 통해 올바른 릴레이션의 설계를 완성할 수 있다.

출처 : 네이버 지식백과

'분석 > 리서치마케팅' 카테고리의 다른 글

확증편향, 필터버블, 반향실 (0)	2018.07.11
sns 분석 툴 10 (0)	2018.05.17
어근과 형태소 (0)	2018.05.17
리치 미디어 마케팅 (0)	2018.05.15
FGI, FGD (0)	2018.05.08

file.choose() - 파일을 선택하여 불러오기

2018. 5. 11. 11:12

file.choose()

파일을 선택하여 불러오기

>read.csv(file.choose(), header=T)

'programing > R studio' 카테고리의 다른 글

정규식 기호 (0)	2018.05.15
set.seed() (0)	2018.05.15
놀이동산 관련 데이터 분석 - 미완성 (0)	2018.05.09
sprintf() (0)	2018.05.09
CA() - Correspondence Analysis (0)	2018.05.08

놀이동산 관련 데이터 분석 - 미완성

2018. 5. 9. 14:13

df <- read.csv("http://goo.gl/HKnl74")

str(df)

colSums(is.na(df)) #col별로 결측값 개수 구하기

#놀이기구에 대한 만족도와 전체 만족도 간의 관계

#산점도 그리기

attach(df)

plot(overall~rides) #(y축~x축)

plot(overall, rides) #(x축, y축)

#cex=점 크기, pch=점 형태(1-빈원/2-세모/3-더하기/4-곱하기/5-마름모/6-역삼각형...)

#xlim=x축 값의 출력범위 지정, ylim=y축 값의 출력범위 지정, lty=출력되는 선의 형태 지정

plot(overall~rides, main="Overall~Rides",

xlab="Satisfaction with Rides", ylab="Overall Satisfaction",

cex=1, pch=6, col="blue")

#attach()와 detach()

detach(df)

df$weekend

attach(df)

weekend

#공분산 값 구하기

cov(overall, rides)

#상관계수 구하기 (두 변수 간 선형관계의 강도를 알 수 있음)

#use = 'complete.obs' : 결측값 제거된 상태에서 상관계수를 계산

#method = 'pearson' : 피어슨 상관계수 지정

cor(overall, rides, use = 'complete.obs', method = 'pearson')

#cor함수에 대해 더 알아보기

?cor

#상관계수 검정

cor.test(overall, rides)

출처 ...

'programing > R studio' 카테고리의 다른 글

set.seed() (0)	2018.05.15
file.choose() - 파일을 선택하여 불러오기 (0)	2018.05.11
sprintf() (0)	2018.05.09
CA() - Correspondence Analysis (0)	2018.05.08
fviz_ca() (0)	2018.05.08

sprintf()

2018. 5. 9. 14:09

> sprintf("%d", 111) #정수 출력
[1] "111"
> sprintf("%5d", 11) #다섯자리 고정
[1] "   11"
> 
> sprintf("%f", 10.111) #실수 출력
[1] "10.111000"
> sprintf("%.3f", 10.111234) #소수점 3자리수까지
[1] "10.111"
> 
> 
> sprintf("%s", "hello") #문자열 출력
[1] "hello"

'programing > R studio' 카테고리의 다른 글

file.choose() - 파일을 선택하여 불러오기 (0)	2018.05.11
놀이동산 관련 데이터 분석 - 미완성 (0)	2018.05.09
CA() - Correspondence Analysis (0)	2018.05.08
fviz_ca() (0)	2018.05.08
fviz_pca (0)	2018.05.08

csv 한글 깨짐 현상

2018. 5. 9. 11:28

csv파일을 메모장으로 연 후

다른이름으로 저장할 때 인코딩을 ANSI로 설정한 후 .csv 확장명으로 저장

출처 : https://blog.naver.com/bonnyborn/221217991960

'programing' 카테고리의 다른 글

파이썬 path 설정 (0)	2020.02.23
데이터 분석 준전문가 ADsP 시험 신청하는 곳 (0)	2018.06.18
[통계] 귀무가설, 대립가설, p-value (0)	2018.05.03
DOM node/hover (0)	2018.04.04
WAS (Web Application Server) (0)	2018.04.04

포르투갈어 단어

2018. 5. 8. 17:46

Retrospectiva 회고전(Retrospective)

incompatível 양립할 수 없는

distrair 산만하게 하다(distract)

lousa 칠판

grana(graninha) 돈

hino 찬송가

'me myself and i > portuguese' 카테고리의 다른 글

[포어] contorno / arrasar (0)	2018.06.14
[포르투갈어] (0)	2018.06.10
[포어 기사 번역] Galaxy S9 e Galaxy S9+ (0)	2018.05.03
포어 기사 번역 (0)	2018.05.02
[포르투갈어] (0)	2018.04.22

CA() - Correspondence Analysis

2018. 5. 8. 16:54

CA()

Correspondence Analysis

'programing > R studio' 카테고리의 다른 글

놀이동산 관련 데이터 분석 - 미완성 (0)	2018.05.09
sprintf() (0)	2018.05.09
fviz_ca() (0)	2018.05.08
fviz_pca (0)	2018.05.08
predict() (0)	2018.05.08

fviz_ca()

2018. 5. 8. 16:53

fviz_ca_row()

fviz_ca_col()

fviz_ca_biplot() - row&col

fviz_ca()

'programing > R studio' 카테고리의 다른 글

sprintf() (0)	2018.05.09
CA() - Correspondence Analysis (0)	2018.05.08
fviz_pca (0)	2018.05.08
predict() (0)	2018.05.08
주성분 분석 (0)	2018.05.08

fviz_pca

2018. 5. 8. 16:53

fviz_pca

주요 변수 분석 그리기

옵션

repel - boolean, text labels의 overplotting을 피하기 위해 ggrepel을 사용할지 말지의 여부

col.var - 변수 색

'programing > R studio' 카테고리의 다른 글

CA() - Correspondence Analysis (0)	2018.05.08
fviz_ca() (0)	2018.05.08
predict() (0)	2018.05.08
주성분 분석 (0)	2018.05.08
prcomp() (0)	2018.05.08

predict()

2018. 5. 8. 16:48

%*% 매트릭스 곱

predict()

lm(), glm() 같은 명령문으로 얻어낸 회귀선으로 주어진 x 값에 해당하는 새로운 y 값을 predict하는 command

predict(model, newdata=A, interval=c("confidence", "prediction"), ...)

model - 예측에 사용할 회귀분석 결과식

newdata=A - 예측에 사용할 x값, 지정하지 않을 시 1~45 정수값에 대한 예측값 출력

interval - 지정된 x 값에 대한 y의 confidence interval or prediction interval을 출력

'programing > R studio' 카테고리의 다른 글

fviz_ca() (0)	2018.05.08
fviz_pca (0)	2018.05.08
주성분 분석 (0)	2018.05.08
prcomp() (0)	2018.05.08
lm()과 scale() (0)	2018.05.08

PREV 1 ···14 15 16 17 18 19 20 ···36 NEXT

h-elena