R與SQL的結合筆記
以前用R篩選變量時,不斷的給中括號,不知道有SQL這麼好用的方法。 大學時期系上有必修SQL,但是那個時候又愛又恨,因為SQL裝上筆電就快塞滿, 現在大神們開發了SQL包,用R語言就可以使用了,很感謝默默付出的一群大神們。 最近參加國泰大數據競賽,面對近50萬的數據,想拿來練習一下SQL語句,而R中的sqldf包,內含gsubfn、proto、RSQLite,好像主要用到RSQLite包為主。 基本的結構像這樣的,用sqldf函數後面接上"",裡面完全就是SQL的世界拉 newdata <- sqldf(" SELECT Region,Family_composition,Sex,Age,Marital_status FROM Microdata WHERE Economic_Activity='1' OR Economic_Activity='2' OR Economic_Activity='3' ") 利用SELECT選擇變量,FROM是導入R的數據名稱,WHERE是篩選變量的方法 原諒今天打到這裡~陸續更新中