read.csv.sql( ) 명령 - 원하는 데이터를 SQL 쿼리로 불러 오기


> install.packages("googleVis")

 ( 설치 과정은 생략합니다 )

> library(googleVis)

> install.packages(“sqldf”)  

>library(sqldf) 


> Fruits

    Fruit Year Location Sales Expenses Profit       Date

1  Apples 2008     West    98       78     20 2008-12-31

2  Apples 2009     West   111       79     32 2009-12-31

3  Apples 2010     West    89       76     13 2010-12-31

4 Oranges 2008     East    96       81     15 2008-12-31

5 Bananas 2008     East    85       76      9 2008-12-31

6 Oranges 2009     East    93       80     13 2009-12-31

7 Bananas 2009     East    94       78     16 2009-12-31

8 Oranges 2010     East    98       91      7 2010-12-31

9 Bananas 2010     East    81       71     10 2010-12-31




> write.csv(Fruits,"Fruits_sql.csv",quote=F,row.names=F)

> fruits_2 <-read.csv.sql("Fruits_sql.csv",

+                       sql="SELECT * FROM file WHERE Year = 2008")

경고메시지:

사용되지 않는 커넥션 3 (Fruits_sql.csv)를 닫습니다 


> fruits_2

    Fruit   Year  Location  Sales Expenses  Profit    Date

1   Apples 2008     West    98       78     20       2008-12-31

2 Oranges 2008     East     96       81     15       2008-12-31

3 Bananas 2008     East     85       76      9        2008-12-31








기본 제공 데이터

> data()

> Nile

Time Series:

Start = 1871 

End = 1970 

Frequency = 1 

  [1] 1120 1160  963 1210 1160 1160  813 1230 1370 1140  995  935 1110  994 1020  960 1180  799  958 1140 1100 1210 1150 1250 1260 1220 1030 1100  774

 [30]  840  874  694  940  833  701  916  692 1020 1050  969  831  726  456  824  702 1120 1100  832  764  821  768  845  864  862  698  845  744  796

 [59] 1040  759  781  865  845  944  984  897  822 1010  771  676  649  846  812  742  801 1040  860  874  848  890  744  749  838 1050  918  986  797

 [88]  923  975  815 1020  906  901 1170  912  746  919  718  714  740



아래의 내용은 기본 데이터 자료 목록












xls (Microsoft Office Excel) 파일로부터 데이터 프레임에 저장하기


> install.packages("XLConnect") 

> library(XLConnect)

> setwd("c:\\r_temp")

> data1=loadWorkbook("fruits_6.xls",create=T)

> data2=readWorksheet(data1,sheet="sheet1",

+                     startRow=1 ,

+                     endRow=8 ,

+                     startCol=1 ,

+                     endCol=5)


> data2

  no   name price  qty

1  1  apple   500   6

2  2 banana   400   4

3  3  peach   300   3

4  4  berry    200   2


 







html 페이지에서 표 형식의 데이터 가져오기


이 페이지에 있는 데이터 가져올 것임

https://en.wikipedia.org/wiki/World_population


> install.packages("XML")

Installing package into ‘C:/Users/seojinsu/Documents/R/win-library/3.1’

( 지면 관계상 설치 과정은 생략하겠습니다.

> library(XML)

>install.packages("httr")

>library("httr")


> pop <- 'http://en.wikipedia.org/wiki/World_population'

> pop

[1] "http://en.wikipedia.org/wiki/World_population"

> pop_table <- readHTMLTable(pop)

> length(pop_table)

[1] 28       // 28 개의 테이블이 있다는 뜻입니다.


> pop_table <- readHTMLTable(pop,which=6)     //위 표는 html 페이지에서 6번째 테이블입니다.

> pop_table

 

   Rank Country / Territory    Population       Date          Approx.혻% of world\npopulation Source

1     1       China[note 2] 1,368,130,000 November 28, 2014                             19%   [83]

2     2               India 1,263,100,000 November 28, 2014                           17.5%   [84]

3     3       United States   319,163,000 November 28, 2014                           4.43%   [85]

4     4           Indonesia   252,164,800      July 1, 2014                             3.5%   [86]

5     5              Brazil   203,505,000 November 28, 2014                           2.82%   [87]

6     6            Pakistan   188,254,000 November 28, 2014                           2.61%   [88]

7     7             Nigeria   178,517,000      July 1, 2014                             2.48%   [89]

8     8          Bangladesh   157,390,000 November 28, 2014                           2.18%   [90]

9     9              Russia   146,068,400      June 1, 2014                             2.03%   [91]

10   10               Japan   127,130,000    August 1, 2014                            1.76%   [92]





> pop_table[,c(2,3)]        //2~3열 읽기

   Country / Territory    Population

1        China[note 2] 1,368,130,000

2                India 1,263,100,000

3        United States   319,163,000

4            Indonesia   252,164,800

5               Brazil   203,505,000

6             Pakistan   188,254,000

( 지면 관계상 이하 내용은 생략합니다 )







출처

더알음 네이버카페 : http://cafe.naver.com/theareum

R라뷰 개정판 실습데이터 모음 :  https://www.dropbox.com/s/16ytsq4q3rdaro4/%EB%8D%94%EB%A7%8E%EC%9D%B4_R%EB%9D%BC%EB%B7%B0_%EA%B0%9C%EC%A0%95%ED%8C%90%EC%9A%A9_%EC%8B%A4%EC%8A%B5%EC%9A%A9_%EB%8D%B0%EC%9D%B4%ED%84%B0_%EB%AA%A8%EC%9D%8C.zip?dl=0

+ Recent posts