read.csv.sql( ) 명령 - 원하는 데이터를 SQL 쿼리로 불러 오기
> install.packages("googleVis")
( 설치 과정은 생략합니다 )
> library(googleVis)
> install.packages(“sqldf”)
>library(sqldf)
> Fruits
Fruit Year Location Sales Expenses Profit Date
1 Apples 2008 West 98 78 20 2008-12-31
2 Apples 2009 West 111 79 32 2009-12-31
3 Apples 2010 West 89 76 13 2010-12-31
4 Oranges 2008 East 96 81 15 2008-12-31
5 Bananas 2008 East 85 76 9 2008-12-31
6 Oranges 2009 East 93 80 13 2009-12-31
7 Bananas 2009 East 94 78 16 2009-12-31
8 Oranges 2010 East 98 91 7 2010-12-31
9 Bananas 2010 East 81 71 10 2010-12-31
> write.csv(Fruits,"Fruits_sql.csv",quote=F,row.names=F)
> fruits_2 <-read.csv.sql("Fruits_sql.csv",
+ sql="SELECT * FROM file WHERE Year = 2008")
경고메시지:
사용되지 않는 커넥션 3 (Fruits_sql.csv)를 닫습니다
> fruits_2
Fruit Year Location Sales Expenses Profit Date
1 Apples 2008 West 98 78 20 2008-12-31
2 Oranges 2008 East 96 81 15 2008-12-31
3 Bananas 2008 East 85 76 9 2008-12-31
기본 제공 데이터
> data()
> Nile
Time Series:
Start = 1871
End = 1970
Frequency = 1
[1] 1120 1160 963 1210 1160 1160 813 1230 1370 1140 995 935 1110 994 1020 960 1180 799 958 1140 1100 1210 1150 1250 1260 1220 1030 1100 774
[30] 840 874 694 940 833 701 916 692 1020 1050 969 831 726 456 824 702 1120 1100 832 764 821 768 845 864 862 698 845 744 796
[59] 1040 759 781 865 845 944 984 897 822 1010 771 676 649 846 812 742 801 1040 860 874 848 890 744 749 838 1050 918 986 797
[88] 923 975 815 1020 906 901 1170 912 746 919 718 714 740
아래의 내용은 기본 데이터 자료 목록
xls (Microsoft Office Excel) 파일로부터 데이터 프레임에 저장하기
> install.packages("XLConnect")
> library(XLConnect)
> setwd("c:\\r_temp")
> data1=loadWorkbook("fruits_6.xls",create=T)
> data2=readWorksheet(data1,sheet="sheet1",
+ startRow=1 ,
+ endRow=8 ,
+ startCol=1 ,
+ endCol=5)
> data2
no name price qty
1 1 apple 500 6
2 2 banana 400 4
3 3 peach 300 3
4 4 berry 200 2
html 페이지에서 표 형식의 데이터 가져오기
이 페이지에 있는 데이터 가져올 것임
https://en.wikipedia.org/wiki/World_population
> install.packages("XML")
Installing package into ‘C:/Users/seojinsu/Documents/R/win-library/3.1’
( 지면 관계상 설치 과정은 생략하겠습니다.
> library(XML)
>install.packages("httr")
>library("httr")
> pop <- 'http://en.wikipedia.org/wiki/World_population'
> pop
[1] "http://en.wikipedia.org/wiki/World_population"
> pop_table <- readHTMLTable(pop)
> length(pop_table)
[1] 28 // 28 개의 테이블이 있다는 뜻입니다.
> pop_table <- readHTMLTable(pop,which=6) //위 표는 html 페이지에서 6번째 테이블입니다.
> pop_table
Rank Country / Territory Population Date Approx.혻% of world\npopulation Source
1 1 China[note 2] 1,368,130,000 November 28, 2014 19% [83]
2 2 India 1,263,100,000 November 28, 2014 17.5% [84]
3 3 United States 319,163,000 November 28, 2014 4.43% [85]
4 4 Indonesia 252,164,800 July 1, 2014 3.5% [86]
5 5 Brazil 203,505,000 November 28, 2014 2.82% [87]
6 6 Pakistan 188,254,000 November 28, 2014 2.61% [88]
7 7 Nigeria 178,517,000 July 1, 2014 2.48% [89]
8 8 Bangladesh 157,390,000 November 28, 2014 2.18% [90]
9 9 Russia 146,068,400 June 1, 2014 2.03% [91]
10 10 Japan 127,130,000 August 1, 2014 1.76% [92]
> pop_table[,c(2,3)] //2~3열 읽기
Country / Territory Population
1 China[note 2] 1,368,130,000
2 India 1,263,100,000
3 United States 319,163,000
4 Indonesia 252,164,800
5 Brazil 203,505,000
6 Pakistan 188,254,000
( 지면 관계상 이하 내용은 생략합니다 )
출처
더알음 네이버카페 : http://cafe.naver.com/theareum
R라뷰 개정판 실습데이터 모음 : https://www.dropbox.com/s/16ytsq4q3rdaro4/%EB%8D%94%EB%A7%8E%EC%9D%B4_R%EB%9D%BC%EB%B7%B0_%EA%B0%9C%EC%A0%95%ED%8C%90%EC%9A%A9_%EC%8B%A4%EC%8A%B5%EC%9A%A9_%EB%8D%B0%EC%9D%B4%ED%84%B0_%EB%AA%A8%EC%9D%8C.zip?dl=0
'programing > R studio' 카테고리의 다른 글
R로 배우는 코딩 1 - 파이차트, 바차트, 에니메이션(카운트다운), 구글맵에 위치 나타내기 (0) | 2018.02.09 |
---|---|
R studio 기초 8 - 다양한 형식으로 저장하기, readLines(), read.table(), read.cvs() 정리 (0) | 2018.02.06 |
R studio 기초 6 - readline(), read.table(), read.csv() (0) | 2018.02.05 |
R studio 기초 5 - 행렬, 배열, List, 데이터 프레임 (0) | 2018.02.05 |
R studio 기초 4 - 변수, 벡터 (0) | 2018.02.05 |