R與SQL的結合筆記
以前用R篩選變量時,不斷的給中括號,不知道有SQL這麼好用的方法。
大學時期系上有必修SQL,但是那個時候又愛又恨,因為SQL裝上筆電就快塞滿,
現在大神們開發了SQL包,用R語言就可以使用了,很感謝默默付出的一群大神們。
最近參加國泰大數據競賽,面對近50萬的數據,想拿來練習一下SQL語句,而R中的sqldf包,內含gsubfn、proto、RSQLite,好像主要用到RSQLite包為主。
基本的結構像這樣的,用sqldf函數後面接上"",裡面完全就是SQL的世界拉
newdata <- sqldf("
SELECT Region,Family_composition,Sex,Age,Marital_status
FROM Microdata
WHERE Economic_Activity='1' OR Economic_Activity='2' OR Economic_Activity='3'
")
利用SELECT選擇變量,FROM是導入R的數據名稱,WHERE是篩選變量的方法
原諒今天打到這裡~陸續更新中
留言
張貼留言