【问题标题】:How do I find top 5 values in a data frame column? [duplicate]如何在数据框列中找到前 5 个值? [复制]
【发布时间】:2020-08-02 21:19:45
【问题描述】:

我正在使用“nyclfights13”包和“tidyverse”包。

在“nycflights13”中找到的“planes”数据集中,有一列告诉您飞机的制造商。

如何找出最常见的 5 家制造商?

【问题讨论】:

    标签: r


    【解决方案1】:

    我们可以使用count并获得前5名

    library(dplyr)
    planes %>% 
       count(manufacturer) %>%
       top_n(5)
    

    slice

    planes %>% 
        count(manufacturer) %>%
        arrange(desc(n)) %>% 
        slice(1:5)
    # A tibble: 5 x 2
    #  manufacturer         n
    #  <chr>            <int>
    #1 BOEING            1630
    #2 AIRBUS INDUSTRIE   400
    #3 BOMBARDIER INC     368
    #4 AIRBUS             336
    #5 EMBRAER            299
    

    【讨论】:

      【解决方案2】:

      基础 R 解决方案

      tail(sort(table(planes$manufacturer)), 5)
      
       EMBRAER    AIRBUS   BOMBARDIER INC AIRBUS INDUSTRIE      BOEING 
        299        336         368             400              1630 
      

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2018-03-29
        • 2020-05-26
        • 2021-01-08
        • 2021-04-26
        • 1970-01-01
        相关资源
        最近更新 更多