【发布时间】:2021-07-01 22:53:07
【问题描述】:
我安装了nycflights13 包和tidyverse 包
这是航班数据集的前 6 行
head(flights)
# A tibble: 6 x 19
year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time arr_delay carrier flight tailnum origin
<int> <int> <int> <int> <int> <dbl> <int> <int> <dbl> <chr> <int> <chr> <chr>
1 2013 1 1 517 515 2 830 819 11 UA 1545 N14228 EWR
2 2013 1 1 533 529 4 850 830 20 UA 1714 N24211 LGA
3 2013 1 1 542 540 2 923 850 33 AA 1141 N619AA JFK
4 2013 1 1 544 545 -1 1004 1022 -18 B6 725 N804JB JFK
5 2013 1 1 554 600 -6 812 837 -25 DL 461 N668DN LGA
6 2013 1 1 554 558 -4 740 728 12 UA 1696 N39463 EWR
with 19 variables: year <int>, month <int>, day <int>, dep_time <int>, sched_dep_time <int>, dep_delay <dbl>,
arr_time <int>, sched_arr_time <int>, arr_delay <dbl>, carrier <chr>, flight <int>, tailnum <chr>, origin <chr>,
dest <chr>, air_time <dbl>, distance <dbl>, hour <dbl>, minute <dbl>, time_hour <dttm>
我正在尝试做两件事。
-
1:使用
mutate()在此数据集的末尾添加一个新列 -
2:在这个新列中,我想计算每个目的地的延迟总比例。这意味着我必须计算
arr_delay的总分钟数
这是我正在运行的代码。我使用 select 函数来创建我的数据表。我使用 mutate 函数创建了新列,但我无法编写一行代码来计算每行或目标的比例(有 336,776 行)
new.table<-select(flights, dest, month, day, dep_time, carrier, flight, arr_delay)
mutate(new.table, arr_delay_prop=sum(arr_delay)/(1:336776))
我知道我需要使用 sum 函数来获得到达延迟的总和,但我不确定如何将每一行与总 arr_delay 的比例。
【问题讨论】:
标签: r function datatable tidyverse