R Select(), Filter(), Arrange(), Pipeline with Example
ฮ ฮฒฮนฮฒฮปฮนฮฟฮธฮฎฮบฮท ฯฮฟฯ ฮฟฮฝฮฟฮผฮฌฮถฮตฯฮฑฮน dplyr ฯฮตฯฮนฮญฯฮตฮน ฯฮฟฮปฯฯฮนฮผฮฑ ฯฮฎฮผฮฑฯฮฑ ฮณฮนฮฑ ฯฮปฮฟฮฎฮณฮทฯฮท ฮผฮญฯฮฑ ฯฯฮฟ ฯฯฮฝฮฟฮปฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ. ฮฮญฯฯ ฮฑฯ ฯฮฟฯ ฯฮฟฯ ฯฮตฮผฮนฮฝฮฑฯฮฏฮฟฯ , ฮธฮฑ ฯฯฮทฯฮนฮผฮฟฯฮฟฮนฮฎฯฮตฯฮต ฯฮฟ ฯฯฮฝฮฟฮปฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ ฯฯฯฮฝฮฟฯ ฯฮฑฮพฮนฮดฮนฮฟฯ. ฮคฮฟ ฯฯฮฝฮฟฮปฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ ฯฯ ฮปฮปฮญฮณฮตฮน ฯฮปฮทฯฮฟฯฮฟฯฮฏฮตฯ ฮณฮนฮฑ ฯฮฟ ฯฮฑฮพฮฏฮดฮน ฯฮฟฯ ฮฟฮดฮทฮณฮตฮฏ ฮญฮฝฮฑฯ ฮฟฮดฮทฮณฯฯ ฮผฮตฯฮฑฮพฯ ฯฮฟฯ ฯฯฮนฯฮนฮฟฯ ฯฮฟฯ ฮบฮฑฮน ฯฮฟฯ ฯฯฯฮฟฯ ฮตฯฮณฮฑฯฮฏฮฑฯ ฯฮฟฯ . ฮฅฯฮฌฯฯฮฟฯ ฮฝ ฮดฮตฮบฮฑฯฮญฯฯฮตฯฮนฯ ฮผฮตฯฮฑฮฒฮปฮทฯฮญฯ ฯฯฮฟ ฯฯฮฝฮฟฮปฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ, ฯฯฯฯ:
- DayOfWeek: ฮ ฯฮฟฯฮดฮนฮฟฯฮฏฯฯฮต ฯฮทฮฝ ฮทฮผฮญฯฮฑ ฯฮทฯ ฮตฮฒฮดฮฟฮผฮฌฮดฮฑฯ ฯฮฟฯ ฮฟ ฮฟฮดฮทฮณฯฯ ฯฯฮทฯฮนฮผฮฟฯฮฟฮนฮตฮฏ ฯฮฟ ฮฑฯ ฯฮฟฮบฮฏฮฝฮทฯฯ ฯฮฟฯ
- ฮฯฯฯฯฮฑฯฮท: ฮ ฯฯ ฮฝฮฟฮปฮนฮบฮฎ ฮฑฯฯฯฯฮฑฯฮท ฯฮฟฯ ฯฮฑฮพฮนฮดฮนฮฟฯ
- MaxSpeed: ฮ ฮผฮญฮณฮนฯฯฮท ฯฮฑฯฯฯฮทฯฮฑ ฯฮฟฯ ฯฮฑฮพฮนฮดฮนฮฟฯ
- TotalTime: ฮ ฮดฮนฮฌฯฮบฮตฮนฮฑ ฯฮต ฮปฮตฯฯฮฌ ฯฮฟฯ ฯฮฑฮพฮนฮดฮนฮฟฯ
ฮคฮฟ ฯฯฮฝฮฟฮปฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ ฮญฯฮตฮน ฯฮตฯฮฏฯฮฟฯ 200 ฯฮฑฯฮฑฯฮทฯฮฎฯฮตฮนฯ ฯฯฮฟ ฯฯฮฝฮฟฮปฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ ฮบฮฑฮน ฮฟฮน ฮดฮนฮฑฮดฯฮฟฮผฮญฯ ฯฯฮฑฮณฮผฮฑฯฮฟฯฮฟฮนฮฎฮธฮทฮบฮฑฮฝ ฮผฮตฯฮฑฮพฯ Monday ฮญฯฯ ฯฮทฮฝ ฮ ฮฑฯฮฑฯฮบฮตฯ ฮฎ.
ฮ ฯฯฯฮฑ ฮฑฯ 'ฯฮปฮฑ, ฯฯฮญฯฮตฮน ฮฝฮฑ:
- ฯฮฟฯฯฯฯฯฮต ฯฮฟ ฯฯฮฝฮฟฮปฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ
- ฮตฮปฮญฮณฮพฯฮต ฯฮท ฮดฮฟฮผฮฎ ฯฯฮฝ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ.
ฮฮฝฮฑ ฮตฯฯฯฮทฯฯฮฟ ฯฮฑฯฮฑฮบฯฮทฯฮนฯฯฮนฮบฯ ฮผฮต ฯฮฟ dplyr ฮตฮฏฮฝฮฑฮน ฮท ฯฯ ฮฝฮฌฯฯฮทฯฮท glimpse(). ฮฯ ฯฮฎ ฮตฮฏฮฝฮฑฮน ฮผฮนฮฑ ฮฒฮตฮปฯฮฏฯฯฮท ฯฮต ฯฯฮญฯฮท ฮผฮต ฯฮฟ str(). ฮฯฮฟฯฮฟฯฮผฮต ฮฝฮฑ ฯฯฮทฯฮนฮผฮฟฯฮฟฮนฮฎฯฮฟฯ ฮผฮต ฯฮทฮฝ glimpse() ฮณฮนฮฑ ฮฝฮฑ ฮดฮฟฯฮผฮต ฯฮท ฮดฮฟฮผฮฎ ฯฮฟฯ ฯฯ ฮฝฯฮปฮฟฯ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ ฮบฮฑฮน ฮฝฮฑ ฮฑฯฮฟฯฮฑฯฮฏฯฮฟฯ ฮผฮต ฯฮฟฮนฮฟฯ ฯฮตฮนฯฮนฯฮผฯฯ ฮฑฯฮฑฮนฯฮตฮฏฯฮฑฮน.
library(dplyr) PATH <- "https://raw.githubusercontent.com/guru99-edu/R-Programming/master/travel_times.csv" df <- read.csv(PATH) glimpse(df)
ฮ ฮฑฯฮฑฮณฯฮณฮฎ:
## Observations: 205 ## Variables: 14 ## $ X <int> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, ... ## $ Date <fctr> 1/6/2012, 1/6/2012, 1/4/2012, 1/4/2012, 1/3/20... ## $ StartTime <fctr> 16:37, 08:20, 16:17, 07:53, 18:57, 07:57, 17:3... ## $ DayOfWeek <fctr> Friday, Friday, Wednesday, Wednesday, Tuesday,... ## $ GoingTo <fctr> Home, GSK, Home, GSK, Home, GSK, Home, GSK, GS... ## $ Distance <dbl> 51.29, 51.63, 51.27, 49.17, 51.15, 51.80, 51.37... ## $ MaxSpeed <dbl> 127.4, 130.3, 127.4, 132.3, 136.2, 135.8, 123.2... ## $ AvgSpeed <dbl> 78.3, 81.8, 82.0, 74.2, 83.4, 84.5, 82.9, 77.5,... ## $ AvgMovingSpeed <dbl> 84.8, 88.9, 85.8, 82.9, 88.1, 88.8, 87.3, 85.9,... ## $ FuelEconomy <fctr> , , , , , , -, -, 8.89, 8.89, 8.89, 8.89, 8.89... ## $ TotalTime <dbl> 39.3, 37.9, 37.5, 39.8, 36.8, 36.8, 37.2, 37.9,... ## $ MovingTime <dbl> 36.3, 34.9, 35.9, 35.6, 34.8, 35.0, 35.3, 34.3,... ## $ Take407All <fctr> No, No, No, No, No, No, No, No, No, No, No, No... ## $ Comments <fctr> , , , , , , , , , , , , , , , Put snow tires o...
ฮฯ ฯฯ ฮตฮฏฮฝฮฑฮน ฯฯฮฟฯฮฑฮฝฮญฯ ฯฯฮน ฮท ฮผฮตฯฮฑฮฒฮปฮทฯฮฎ Comments ฯฯฮตฮนฮฌฮถฮตฯฮฑฮน ฯฮตฯฮฑฮนฯฮญฯฯ ฮดฮนฮฑฮณฮฝฯฯฯฮนฮบฯ ฮญฮปฮตฮณฯฮฟ. ฮฃฯฮนฯ ฯฯฯฯฮตฯ ฯฮฑฯฮฑฯฮทฯฮฎฯฮตฮนฯ ฯฮทฯ ฮผฮตฯฮฑฮฒฮปฮทฯฮฎฯ ฮฃฯฯฮปฮนฮฑ ฮปฮตฮฏฯฮฟฯ ฮฝ ฮผฯฮฝฮฟ ฯฮนฮผฮญฯ.
sum(df$Comments =="")
Code ฮตฮพฮฎฮณฮทฯฮท
- sum(df$Comments ==โโ): ฮฮธฯฮฟฮนฯฮผฮฑ ฯฯฮฝ ฯฮฑฯฮฑฯฮทฯฮฎฯฮตฯฮฝ ฮฏฯฮท ฮผฮต โโ ฯฯฮฑ ฯฯฯฮปฮนฮฑ ฯฮทฯ ฯฯฮฎฮปฮทฯ ฮฑฯฯ ฯฮฟ df
ฮ ฮฑฯฮฑฮณฯฮณฮฎ:
## [1] 181
ฮตฯฮนฮปฮญฮณฯ()
ฮฮฑ ฮพฮตฮบฮนฮฝฮฎฯฮฟฯ ฮผฮต ฮผฮต ฯฮฟ ฯฮฎฮผฮฑ select(). ฮฮตฮฝ ฯฯฮตฮนฮฑฮถฯฮผฮฑฯฯฮต ฮฑฯฮฑฯฮฑฮฏฯฮทฯฮฑ ฯฮปฮตฯ ฯฮนฯ ฮผฮตฯฮฑฮฒฮปฮทฯฮญฯ ฮบฮฑฮน ฮผฮนฮฑ ฮบฮฑฮปฮฎ ฯฯฮฑฮบฯฮนฮบฮฎ ฮตฮฏฮฝฮฑฮน ฮฝฮฑ ฮตฯฮนฮปฮญฮณฮฟฯ ฮผฮต ฮผฯฮฝฮฟ ฯฮนฯ ฮผฮตฯฮฑฮฒฮปฮทฯฮญฯ ฯฮฟฯ ฮธฮตฯฯฮตฮฏฯฮต ฯฯฮตฯฮนฮบฮญฯ.
ฮฯฮฟฯ ฮผฮต 181 ฮตฮปฮปฮตฮฏฯฮฟฯ ฯฮตฯ ฯฮฑฯฮฑฯฮทฯฮฎฯฮตฮนฯ, ฯฯฮตฮดฯฮฝ ฯฮฟ 90 ฯฮฟฮนฯ ฮตฮบฮฑฯฯ ฯฮฟฯ ฯฯ ฮฝฯฮปฮฟฯ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ. ฮฮฌฮฝ ฮฑฯฮฟฯฮฑฯฮฏฯฮตฯฮต ฮฝฮฑ ฯฮฑ ฮตฮพฮฑฮนฯฮญฯฮตฯฮต, ฮดฮตฮฝ ฮธฮฑ ฮผฯฮฟฯฮตฮฏฯฮต ฮฝฮฑ ฯฯ ฮฝฮตฯฮฏฯฮตฯฮต ฯฮทฮฝ ฮฑฮฝฮฌฮปฯ ฯฮท.
ฮ ฮฌฮปฮปฮท ฮดฯ ฮฝฮฑฯฯฯฮทฯฮฑ ฮตฮฏฮฝฮฑฮน ฮฝฮฑ ฮฑฯฮฟฯฯฮฏฯฮตฯฮต ฯฮท ฮผฮตฯฮฑฮฒฮปฮทฯฮฎ Comment ฮผฮต ฯฮฟ ฯฮฎฮผฮฑ select().
ฮฯฮฟฯฮฟฯฮผฮต ฮฝฮฑ ฮตฯฮนฮปฮญฮพฮฟฯ ฮผฮต ฮผฮตฯฮฑฮฒฮปฮทฯฮญฯ ฮผฮต ฮดฮนฮฑฯฮฟฯฮตฯฮนฮบฮฟฯฯ ฯฯฯฯฮฟฯ ฯ ฮผฮต ฯฮฟ select(). ฮฃฮทฮผฮตฮนฯฯฯฮต ฯฯฮน ฯฮฟ ฯฯฯฯฮฟ ฯฯฮนฯฮผฮฑ ฮตฮฏฮฝฮฑฮน ฯฮฟ ฯฯฮฝฮฟฮปฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ.
- `select(df, A, B ,C)`: Select the variables A, B and C from df dataset. - `select(df, A:C)`: Select all variables from A to C from df dataset. - `select(df, -C)`: Exclude C from the dataset from df dataset.
ฮฯฮฟฯฮตฮฏฯฮต ฮฝฮฑ ฯฯฮทฯฮนฮผฮฟฯฮฟฮนฮฎฯฮตฯฮต ฯฮฟฮฝ ฯฯฮฏฯฮฟ ฯฯฯฯฮฟ ฮณฮนฮฑ ฮฝฮฑ ฮตฮพฮฑฮนฯฮญฯฮตฯฮต ฯฮท ฮผฮตฯฮฑฮฒฮปฮทฯฮฎ ฮฃฯฯฮปฮนฮฑ.
step_1_df <- select(df, -Comments) dim(df)
ฮ ฮฑฯฮฑฮณฯฮณฮฎ:
## [1] 205 14
dim(step_1_df)
ฮ ฮฑฯฮฑฮณฯฮณฮฎ:
## [1] 205 13
ฮคฮฟ ฮฑฯฯฮนฮบฯ ฯฯฮฝฮฟฮปฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ ฮญฯฮตฮน 14 ฯฮฑฯฮฑฮบฯฮทฯฮนฯฯฮนฮบฮฌ ฮตฮฝฯ ฯฮฟ step_1_df ฮญฯฮตฮน 13.
ฮฆฮฏฮปฯฯฮฟ()
ฮคฮฟ ฯฮฎฮผฮฑ filter() ฮฒฮฟฮทฮธฮฌ ฮฝฮฑ ฮดฮนฮฑฯฮทฯฮทฮธฮฟฯฮฝ ฮฟฮน ฯฮฑฯฮฑฯฮทฯฮฎฯฮตฮนฯ ฯฯฮผฯฯฮฝฮฑ ฮผฮต ฮญฮฝฮฑ ฮบฯฮนฯฮฎฯฮนฮฟ. ฮคฮฟ filter() ฮปฮตฮนฯฮฟฯ ฯฮณฮตฮฏ ฮฑฮบฯฮนฮฒฯฯ ฯฯฯฯ ฯฮฟ select(), ฯฮตฯฮฝฮฌฯฮต ฯฯฯฯฮฑ ฯฮฟ ฯฮปฮฑฮฏฯฮนฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ ฮบฮฑฮน ฮผฮตฯฮฌ ฮผฮนฮฑ ฯฯ ฮฝฮธฮฎฮบฮท ฯฮฟฯ ฯฯฯฮฏฮถฮตฯฮฑฮน ฮผฮต ฮบฯฮผฮผฮฑ:
filter(df, condition) arguments: - df: dataset used to filter the data - condition: Condition used to filter the data
ฮฮฝฮฑ ฮบฯฮนฯฮฎฯฮนฮฟ
ฮ ฯฯฯฮฑ ฮฑฯ 'ฯฮปฮฑ, ฮผฯฮฟฯฮตฮฏฯฮต ฮฝฮฑ ฮผฮตฯฯฮฎฯฮตฯฮต ฯฮฟฮฝ ฮฑฯฮนฮธฮผฯ ฯฯฮฝ ฯฮฑฯฮฑฯฮทฯฮฎฯฮตฯฮฝ ฯฮต ฮบฮฌฮธฮต ฮตฯฮฏฯฮตฮดฮฟ ฮผฮนฮฑฯ ฮผฮตฯฮฑฮฒฮปฮทฯฮฎฯ ฯฮฑฯฮฌฮณฮฟฮฝฯฮฑ.
table(step_1_df$GoingTo)
Code ฮตฮพฮฎฮณฮทฯฮท
- table(): ฮฮตฯฯฮฎฯฯฮต ฯฮฟฮฝ ฮฑฯฮนฮธฮผฯ ฯฯฮฝ ฯฮฑฯฮฑฯฮทฯฮฎฯฮตฯฮฝ ฮฑฮฝฮฌ ฮตฯฮฏฯฮตฮดฮฟ. ฮฃฮทฮผฮตฮฏฯฯฮท, ฮผฯฮฝฮฟ ฮท ฮผฮตฯฮฑฮฒฮปฮทฯฮฎ ฮตฯฮนฯฮญฮดฮฟฯ ฯฮฑฯฮฌฮณฮฟฮฝฯฮฑ ฮตฮฏฮฝฮฑฮน ฮฑฯฮฟฮดฮตฮบฯฮฎ
- ฯฮฏฮฝฮฑฮบฮฑฯ(step_1_df$GoingTo): ฮฮตฯฯฮฎฯฯฮต ฯฮฟฮฝ ฮฑฯฮนฮธฮผฯ ฯฯฮฝ ฯฮฑฮพฮนฮดฮนฯฮฝ ฯฯฮฟฯ ฯฮฟฮฝ ฯฮตฮปฮนฮบฯ ฯฯฮฟฮฟฯฮนฯฮผฯ.
ฮ ฮฑฯฮฑฮณฯฮณฮฎ:
## ## GSK Home ## 105 100
ฮ ฯฮฏฮฝฮฑฮบฮฑฯ ฯฯ ฮฝฮฑฯฯฮฎฯฮตฯฮฝ() ฯ ฯฮฟฮดฮตฮนฮบฮฝฯฮตฮน ฯฯฮน 105 ฮฒฯฮปฯฮตฯ ฯฮทฮณฮฑฮฏฮฝฮฟฯ ฮฝ ฯฯฮฟ GSK ฮบฮฑฮน 100 ฯฯฮฟ Home.
ฮฯฮฟฯฮฟฯฮผฮต ฮฝฮฑ ฯฮนฮปฯฯฮฌฯฮฟฯ ฮผฮต ฯฮฑ ฮดฮตฮดฮฟฮผฮญฮฝฮฑ ฮณฮนฮฑ ฮฝฮฑ ฮตฯฮนฯฯฯฮญฯฮฟฯ ฮผฮต ฮญฮฝฮฑ ฯฯฮฝฮฟฮปฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ ฮผฮต 105 ฯฮฑฯฮฑฯฮทฯฮฎฯฮตฮนฯ ฮบฮฑฮน ฮญฮฝฮฑ ฮฌฮปฮปฮฟ ฮผฮต 100 ฯฮฑฯฮฑฯฮทฯฮฎฯฮตฮนฯ.
# Select observations if GoingTo == Home select_home <- filter(df, GoingTo == "Home") dim(select_home)
ฮ ฮฑฯฮฑฮณฯฮณฮฎ:
## [1] 100 14
# Select observations if GoingTo == Work select_work <- filter(df, GoingTo == "GSK") dim(select_work)
ฮ ฮฑฯฮฑฮณฯฮณฮฎ:
## [1] 105 14
ฮ ฮฟฮปฮปฮฑฯฮปฮฌ ฮบฯฮนฯฮฎฯฮนฮฑ
ฮฯฮฟฯฮฟฯฮผฮต ฮฝฮฑ ฯฮนฮปฯฯฮฌฯฮฟฯ ฮผฮต ฮญฮฝฮฑ ฯฯฮฝฮฟฮปฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ ฮผฮต ฯฮตฯฮนฯฯฯฯฮตฯฮฑ ฮฑฯฯ ฮญฮฝฮฑ ฮบฯฮนฯฮฎฯฮนฮฑ. ฮฮนฮฑ ฯฮฑฯฮฌฮดฮตฮนฮณฮผฮฑ, ฮผฯฮฟฯฮตฮฏฯฮต ฯ.ฯ.tracฮฟฮน ฯฮฑฯฮฑฯฮทฯฮฎฯฮตฮนฯ ฯฯฮฟฯ ฮฟ ฯฯฮฟฮฟฯฮนฯฮผฯฯ ฮตฮฏฮฝฮฑฮน ฮท ฯฮฟฯฮฟฮธฮตฯฮฏฮฑ ฮฯฯฮนฮบฮฎ ฮบฮฑฮน ฯฯฮฑฮณฮผฮฑฯฮฟฯฮฟฮนฮฎฮธฮทฮบฮฑฮฝ ฮคฮตฯฮฌฯฯฮท.
select_home_wed <- filter(df, GoingTo == "Home" & DayOfWeek == "Wednesday") dim(select_home_wed)
ฮ ฮฑฯฮฑฮณฯฮณฮฎ:
## [1] 23 14
23 ฯฮฑฯฮฑฯฮทฯฮฎฯฮตฮนฯ ฯฮฑฮนฯฮนฮฌฮถฮฟฯ ฮฝ ฮผฮต ฮฑฯ ฯฯ ฯฮฟ ฮบฯฮนฯฮฎฯฮนฮฟ.
Pipeline
ฮ ฮดฮทฮผฮนฮฟฯ ฯฮณฮฏฮฑ ฮตฮฝฯฯ ฯฯ ฮฝฯฮปฮฟฯ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ ฮฑฯฮฑฮนฯฮตฮฏ ฯฮฟฮปฮปฮญฯ ฮปฮตฮนฯฮฟฯ ฯฮณฮฏฮตฯ, ฯฯฯฯ:
- ฮตฮนฯฮฑฮณฯฮณฮฎ
- ฯฯ ฮณฯฯฮฝฮตฯ ฯฮท
- ฮตฯฮนฮปฮฟฮณฮฎ
- ฯฮนฮปฯฯฮฌฯฮนฯฮผฮฑ
- ฮบฮฑฮน ฮฟฯฯฯ ฮบฮฑฮธฮตฮพฮฎฯ
ฮ ฮฒฮนฮฒฮปฮนฮฟฮธฮฎฮบฮท dplyr ฯฯ ฮฝฮฟฮดฮตฯฮตฯฮฑฮน ฮฑฯฯ ฮญฮฝฮฑฮฝ ฯฯฮฑฮบฯฮนฮบฯ ฯฮตฮปฮตฯฯฮฎ, %>%, ฯฮฟฯ ฮฟฮฝฮฟฮผฮฌฮถฮตฯฮฑฮน the ฮฑฮณฯฮณฮฟฯ. ฮ ฮดฯ ฮฝฮฑฯฯฯฮทฯฮฑ ฮดฮนฮฟฯฮญฯฮตฯ ฯฮทฯ ฮบฮฑฮธฮนฯฯฮฌ ฯฮฟฮฝ ฯฮตฮนฯฮนฯฮผฯ ฮบฮฑฮธฮฑฯฯ, ฮณฯฮฎฮณฮฟฯฮฟ ฮบฮฑฮน ฮปฮนฮณฯฯฮตฯฮฟ ฮณฯฮฎฮณฮฟฯฮฟ ฯฮต ฯฯฮฌฮปฮผฮฑฯฮฑ.
ฮฯ ฯฯฯ ฮฟ ฯฮตฮปฮตฯฯฮฎฯ ฮตฮฏฮฝฮฑฮน ฮญฮฝฮฑฯ ฮบฯฮดฮนฮบฯฯ ฯฮฟฯ ฮตฮบฯฮตฮปฮตฮฏ ฮฒฮฎฮผฮฑฯฮฑ ฯฯฯฮฏฯ ฮฝฮฑ ฮฑฯฮฟฮธฮทฮบฮตฯฮตฮน ฮตฮฝฮดฮนฮฌฮผฮตฯฮฑ ฮฒฮฎฮผฮฑฯฮฑ ฯฯฮฟฮฝ ฯฮบฮปฮทฯฯ ฮดฮฏฯฮบฮฟ. ฮฮฌฮฝ ฮตฯฮนฯฯฯฮญฯฮตฯฮต ฯฯฮฟ ฯฮฑฯฮฌฮดฮตฮนฮณฮผฮฌ ฮผฮฑฯ ฮฑฯฯ ฯฮฑฯฮฑฯฮฌฮฝฯ, ฮผฯฮฟฯฮตฮฏฯฮต ฮฝฮฑ ฮตฯฮนฮปฮญฮพฮตฯฮต ฯฮนฯ ฮผฮตฯฮฑฮฒฮปฮทฯฮญฯ ฯฮฟฯ ฯฮฑฯ ฮตฮฝฮดฮนฮฑฯฮญฯฮฟฯ ฮฝ ฮบฮฑฮน ฮฝฮฑ ฯฮนฯ ฯฮนฮปฯฯฮฌฯฮตฯฮต. ฮฯฮฟฯ ฮผฮต ฯฯฮฏฮฑ ฮฒฮฎฮผฮฑฯฮฑ:
- ฮฮฎฮผฮฑ 1: ฮฮนฯฮฑฮณฯฮณฮฎ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ: ฮฮนฯฮฑฮณฮฌฮณฮตฯฮต ฯฮฑ ฮดฮตฮดฮฟฮผฮญฮฝฮฑ gps
- ฮฮฎฮผฮฑ 2: ฮฯฮนฮปฮฟฮณฮฎ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ: ฮฯฮนฮปฮญฮพฯฮต GoingTo ฮบฮฑฮน DayOfWeek
- ฮฮฎฮผฮฑ 3: ฮฆฮนฮปฯฯฮฌฯฮนฯฮผฮฑ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ: ฮฯฮนฯฯฯฮฟฯฮฎ ฮผฯฮฝฮฟ ฯฯฮฟ ฯฯฮฏฯฮน ฮบฮฑฮน ฮคฮตฯฮฌฯฯฮท
ฮฯฮฟฯฮฟฯฮผฮต ฮฝฮฑ ฯฯฮทฯฮนฮผฮฟฯฮฟฮนฮฎฯฮฟฯ ฮผฮต ฯฮฟฮฝ ฮดฯฯฮบฮฟฮปฮฟ ฯฯฯฯฮฟ ฮณฮนฮฑ ฮฝฮฑ ฯฮฟ ฮบฮฌฮฝฮฟฯ ฮผฮต:
# Step 1 step_1 <- read.csv(PATH) # Step 2 step_2 <- select(step_1, GoingTo, DayOfWeek) # Step 3 step_3 <- filter(step_2, GoingTo == "Home", DayOfWeek == "Wednesday") head(step_3)
ฮ ฮฑฯฮฑฮณฯฮณฮฎ:
## GoingTo DayOfWeek ## 1 Home Wednesday ## 2 Home Wednesday ## 3 Home Wednesday ## 4 Home Wednesday ## 5 Home Wednesday ## 6 Home Wednesday
ฮฯ ฯฯฯ ฮดฮตฮฝ ฮตฮฏฮฝฮฑฮน ฮญฮฝฮฑฯ ฮฒฮฟฮปฮนฮบฯฯ ฯฯฯฯฮฟฯ ฮณฮนฮฑ ฮฝฮฑ ฮตฮบฯฮตฮปฮญฯฮตฯฮต ฯฮฟฮปฮปฮญฯ ฮปฮตฮนฯฮฟฯ ฯฮณฮฏฮตฯ, ฮตฮนฮดฮนฮบฮฌ ฯฮต ฮผฮนฮฑ ฮบฮฑฯฮฌฯฯฮฑฯฮท ฮผฮต ฯฮฟฮปฮปฮฌ ฮฒฮฎฮผฮฑฯฮฑ. ฮคฮฟ ฯฮตฯฮนฮฒฮฌฮปฮปฮฟฮฝ ฮบฮฑฯฮฑฮปฮฎฮณฮตฮน ฮผฮต ฯฮฟฮปฮปฮฌ ฮฑฯฮฟฮธฮทฮบฮตฯ ฮผฮญฮฝฮฑ ฮฑฮฝฯฮนฮบฮตฮฏฮผฮตฮฝฮฑ.
ฮฯ ฯฯฮทฯฮนฮผฮฟฯฮฟฮนฮฎฯฮฟฯ ฮผฮต ฯฮฟฮฝ ฯฮตฮปฮตฯฯฮฎ ฮฑฮณฯฮณฮฟฯ %>% ฮฑฮฝฯ' ฮฑฯ ฯฮฟฯ. ฮงฯฮตฮนฮฌฮถฮตฯฮฑฮน ฮผฯฮฝฮฟ ฮฝฮฑ ฮฟฯฮฏฯฮฟฯ ฮผฮต ฯฮฟ ฯฮปฮฑฮฏฯฮนฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ ฯฮฟฯ ฯฯฮทฯฮนฮผฮฟฯฮฟฮนฮฎฮธฮทฮบฮต ฯฯฮทฮฝ ฮฑฯฯฮฎ ฮบฮฑฮน ฯฮปฮท ฮท ฮดฮนฮฑฮดฮนฮบฮฑฯฮฏฮฑ ฮธฮฑ ฯฯฮฟฮญฮปฮธฮตฮน ฮฑฯฯ ฮฑฯ ฯฯ.
ฮฮฑฯฮนฮบฮฎ ฯฯฮฝฯฮฑฮพฮท ฯฮฟฯ ฮฑฮณฯฮณฮฟฯ
New_df <- df %>% step 1 %>% step 2 %>% ... arguments - New_df: Name of the new data frame - df: Data frame used to compute the step - step: Instruction for each step - Note: The last instruction does not need the pipe operator `%`, you don't have instructions to pipe anymore Note: Create a new variable is optional. If not included, the output will be displayed in the console.
ฮฯฮฟฯฮตฮฏฯฮต ฮฝฮฑ ฮดฮทฮผฮนฮฟฯ ฯฮณฮฎฯฮตฯฮต ฯฮฟฮฝ ฯฯฯฯฮฟ ฯฮฑฯ ฯฯฮปฮฎฮฝฮฑ ฮฑฮบฮฟฮปฮฟฯ ฮธฯฮฝฯฮฑฯ ฯฮฑ ฮฒฮฎฮผฮฑฯฮฑ ฯฮฟฯ ฮฑฯฮฑฯฮนฮธฮผฮฟฯฮฝฯฮฑฮน ฯฮฑฯฮฑฯฮฌฮฝฯ.
# Create the data frame filter_home_wed.It will be the object return at the end of the pipeline filter_home_wed <- #Step 1 read.csv(PATH) % > % #Step 2 select(GoingTo, DayOfWeek) % > % #Step 3 filter(GoingTo == "Home",DayOfWeek == "Wednesday") identical(step_3, filter_home_wed)
ฮ ฮฑฯฮฑฮณฯฮณฮฎ:
## [1] TRUE
ฮฮฏฮผฮฑฯฯฮต ฮญฯฮฟฮนฮผฮฟฮน ฮฝฮฑ ฮดฮทฮผฮนฮฟฯ ฯฮณฮฎฯฮฟฯ ฮผฮต ฮญฮฝฮฑ ฮตฮบฯฮปฮทฮบฯฮนฮบฯ ฯฯฮฝฮฟฮปฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ ฮผฮต ฯฮฟฮฝ ฯฮตฮนฯฮนฯฯฮฎ ฯฮฟฯ ฮฑฮณฯฮณฮฟฯ.
ฮบฮฑฮฝฮฟฮฝฮฏฮถฯ()
ฮฃฯฮฟ ฯฯฮฟฮทฮณฮฟฯฮผฮตฮฝฮฟ ฯฮตฮผฮนฮฝฮฌฯฮนฮฟ, ฮผฮฑฮธฮฑฮฏฮฝฮตฯฮต ฯฯฯ ฮฝฮฑ ฯฮฑฮพฮนฮฝฮฟฮผฮตฮฏฯฮต ฯฮนฯ ฯฮนฮผฮญฯ ฮผฮต ฯฮท ฯฯ ฮฝฮฌฯฯฮทฯฮท sort(). ฮ ฮฒฮนฮฒฮปฮนฮฟฮธฮฎฮบฮท dplyr ฮญฯฮตฮน ฯฮท ฮปฮตฮนฯฮฟฯ ฯฮณฮฏฮฑ ฯฮฑฮพฮนฮฝฯฮผฮทฯฮทฯ. ฮฮตฮนฯฮฟฯ ฯฮณฮตฮฏ ฯฮฑฮฝ ฮณฮฟฯฯฮน ฮผฮต ฯฮฟฮฝ ฮฑฮณฯฮณฯ. ฮคฮฟ ฯฮฎฮผฮฑ arrange() ฮผฯฮฟฯฮตฮฏ ฮฝฮฑ ฮฑฮฝฮฑฮดฮนฮฑฯฮฌฮพฮตฮน ฮผฮฏฮฑ ฮฎ ฯฮฟฮปฮปฮญฯ ฯฮตฮนฯฮญฯ, ฮตฮฏฯฮต ฮฑฯฮพฮฟฯ ฯฮฑ (ฯฯฮฟฮตฯฮนฮปฮฟฮณฮฎ) ฮตฮฏฯฮต ฯฮธฮฏฮฝฮฟฯ ฯฮฑ.
- `arrange(A)`: Ascending sort of variable A - `arrange(A, B)`: Ascending sort of variable A and B - `arrange(desc(A), B)`: Descending sort of variable A and ascending sort of B
ฮฯฮฟฯฮฟฯฮผฮต ฮฝฮฑ ฯฮฑฮพฮนฮฝฮฟฮผฮฎฯฮฟฯ ฮผฮต ฯฮทฮฝ ฮฑฯฯฯฯฮฑฯฮท ฮฑฮฝฮฌ ฯฯฮฟฮฟฯฮนฯฮผฯ.
# Sort by destination and distance step_2_df <-step_1_df %>% arrange(GoingTo, Distance) head<step_2_df)
ฮ ฮฑฯฮฑฮณฯฮณฮฎ:
## X Date StartTime DayOfWeek GoingTo Distance MaxSpeed AvgSpeed ## 1 193 7/25/2011 08:06 Monday GSK 48.32 121.2 63.4 ## 2 196 7/21/2011 07:59 Thursday GSK 48.35 129.3 81.5 ## 3 198 7/20/2011 08:24 Wednesday GSK 48.50 125.8 75.7 ## 4 189 7/27/2011 08:15 Wednesday GSK 48.82 124.5 70.4 ## 5 95 10/11/2011 08:25 Tuesday GSK 48.94 130.8 85.7 ## 6 171 8/10/2011 08:13 Wednesday GSK 48.98 124.8 72.8 ## AvgMovingSpeed FuelEconomy TotalTime MovingTime Take407All ## 1 78.4 8.45 45.7 37.0 No ## 2 89.0 8.28 35.6 32.6 Yes ## 3 87.3 7.89 38.5 33.3 Yes ## 4 77.8 8.45 41.6 37.6 No ## 5 93.2 7.81 34.3 31.5 Yes ## 6 78.8 8.54 40.4 37.3 No
ฮ ฮตฯฮฏฮปฮทฯฮท
ฮฃฯฮฟฮฝ ฯฮฑฯฮฑฮบฮฌฯฯ ฯฮฏฮฝฮฑฮบฮฑ, ฯฯ ฮฝฮฟฯฮฏฮถฮตฯฮต ฯฮปฮตฯ ฯฮนฯ ฮปฮตฮนฯฮฟฯ ฯฮณฮฏฮตฯ ฯฮฟฯ ฮผฮฌฮธฮฑฯฮต ฮบฮฑฯฮฌ ฯฮท ฮดฮนฮฌฯฮบฮตฮนฮฑ ฯฮฟฯ ฯฮตฮผฮนฮฝฮฑฯฮฏฮฟฯ .
| ฮกฮฎฮผฮฑ | ฮฃฮบฮฟฯฯฯ | Code | ฮตฮพฮฎฮณฮทฯฮท |
|---|---|---|---|
| ฮผฮฑฯฮนฮฌ | ฮตฮปฮญฮณฮพฯฮต ฯฮท ฮดฮฟฮผฮฎ ฮตฮฝฯฯ df |
glimpse(df) |
ฮ ฮฑฮฝฮฟฮผฮฟฮนฯฯฯ ฯฮฟ ฮผฮต ฯฮฟ str() |
| ฮตฯฮนฮปฮญฮณฯ() | ฮฯฮนฮปฮญฮพฯฮต/ฮตฮพฮฑฮนฯฮญฯฯฮต ฯฮนฯ ฮผฮตฯฮฑฮฒฮปฮทฯฮญฯ |
select(df, A, B ,C) |
ฮฯฮนฮปฮญฮพฯฮต ฯฮนฯ ฮผฮตฯฮฑฮฒฮปฮทฯฮญฯ A, B ฮบฮฑฮน C |
select(df, A:C) |
ฮฯฮนฮปฮญฮพฯฮต ฯฮปฮตฯ ฯฮนฯ ฮผฮตฯฮฑฮฒฮปฮทฯฮญฯ ฮฑฯฯ ฯฮฟ A ฮญฯฯ ฯฮฟ C | ||
select(df, -C) |
ฮฮพฮฑฮนฯฮญฯฯฮต ฯฮฟ C | ||
| ฯฮฏฮปฯฯฮฟ() | ฮฆฮนฮปฯฯฮฌฯฮตฯฮต ฯฮฟ df ฮผฮต ฮฒฮฌฯฮท ฮผฮฏฮฑ ฮฎ ฯฮฟฮปฮปฮญฯ ฯฯ ฮฝฮธฮฎฮบฮตฯ |
filter(df, condition1) |
ฮฮฏฮฑ ฯฯฮฟฯฯฯฮธฮตฯฮท |
filter(df, condition1 |
ฮฑฯฯฮฎ 2) | ||
| ฮบฮฑฮฝฮฟฮฝฮฏฮถฯ() | ฮคฮฑฮพฮนฮฝฮฟฮผฮฎฯฯฮต ฯฮฟ ฯฯฮฝฮฟฮปฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯฮฝ ฮผฮต ฮผฮฏฮฑ ฮฎ ฯฮฟฮปฮปฮญฯ ฮผฮตฯฮฑฮฒฮปฮทฯฮญฯ |
arrange(A) |
ฮฯฮพฮฟฯ ฯฮฑ ฮผฮฟฯฯฮฎ ฮผฮตฯฮฑฮฒฮปฮทฯฮฎฯ ฮ |
arrange(A, B) |
ฮฯฮพฮฟฯ ฯฮฑ ฮผฮฟฯฯฮฎ ฮผฮตฯฮฑฮฒฮปฮทฯฯฮฝ ฮ ฮบฮฑฮน ฮ | ||
arrange(desc(A), B) |
ฮฆฮธฮฏฮฝฮฟฯ ฯฮฑ ฯฮฑฮพฮนฮฝฯฮผฮทฯฮท ฯฮทฯ ฮผฮตฯฮฑฮฒฮปฮทฯฮฎฯ ฮ ฮบฮฑฮน ฮฑฯฮพฮฟฯ ฯฮฑ ฯฮฑฮพฮนฮฝฯฮผฮทฯฮท ฯฮทฯ ฮผฮตฯฮฑฮฒฮปฮทฯฮฎฯ ฮ | ||
| %>% | ฮฮทฮผฮนฮฟฯ ฯฮณฮฎฯฯฮต ฮญฮฝฮฑฮฝ ฮฑฮณฯฮณฯ ฮผฮตฯฮฑฮพฯ ฮบฮฌฮธฮต ฮฒฮฎฮผฮฑฯฮฟฯ |
step 1 %>% step 2 %>% step 3 |
