【问题标题】:How Can I make Multiple Subsets Based On A Column如何根据列创建多个子集
【发布时间】:2017-02-28 15:42:04
【问题描述】:

我正在处理一个非常大的数据集,我需要从数据集中制作多个子集,而不必为每个子集单独编码。我想为第一列中的每个船名创建子集。
我知道如何乘船做这艘船,但我想一次制作多个子集。我包含了我正在使用的数据框的一个小样本。
我想从这个样本数据中得到 3 个子集,一个用于 Dawn Marie、Kraig K 和 Lake Lady。感谢您的帮助。

Boat          Net  Targeted Species     Yellow Perch
Dawn Marie    37     Yellow Perch          500
Kraig K       35     Yellow Perch          400
Dawn Marie    36     Yellow Perch         1100
Dawn Marie    34     Yellow Perch         2000
Lake Lady     30     Yellow Perch          900
Dawn Marie    31     Yellow Perch         1200
Kraig K       33     Yellow Perch         1600
Dawn Marie    44     Yellow Perch          400
Lake Lady     42     Yellow Perch          800
Dawn Marie    40     Yellow Perch          500
Dawn Marie    38     Yellow Perch          600
Lake Lady     39     Yellow Perch          400

【问题讨论】:

  • 您可能正在寻找?split。这将生成一个 data.frames 列表,这通常是此类应用程序的推荐结构。
  • 要查看split 的实际效果,请查看:stackoverflow.com/questions/19327020/…
  • 谢谢你,这似乎是我所需要的。
  • 看看group_by in dplyr

标签: r


【解决方案1】:

试试split函数。

说明

split 将向量 x 中的数据分成由 f 定义的组。替换形式替换对应于这种划分的值。 unsplit 反转 split 的效果。

用法

 split(x, f, drop = FALSE, ...)

https://stat.ethz.ch/R-manual/R-devel/library/base/html/split.html

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2018-05-01
    • 1970-01-01
    • 2014-01-21
    • 2017-07-27
    • 2022-01-19
    • 2022-01-07
    • 2022-12-17
    相关资源
    最近更新 更多