【问题标题】:R, tbl_summary, treating continuous variables correctlyR,tbl_summary,正确对待连续变量
【发布时间】:2021-07-27 00:50:28
【问题描述】:

我遇到了与what this user reported 类似的问题。数值型和连续型变量被视为分类变量。让我们也使用汽车数据集,以便我们可以使用可重现的东西。假设我只是这样做:

tbl_summary(mtcars)

大多数变量将被视为连续变量,但 cyl、gear 和 carb 等变量将被视为分类变量。我了解(根据其他问题)如何将所有变量视为连续变量,但是如果我喜欢我的大部分表格并且只想改变齿轮以被视为连续变量呢?这可能吗?

在我的真实数据集中,我想被视为连续的变量已经是一个数值变量,我真的不明白为什么它被视为分类变量,所以我想指定 gtsummary 应该将该特定变量视为连续。

【问题讨论】:

    标签: r gtsummary


    【解决方案1】:

    根据?tbl_summarytype 参数采用命名list。因此,如果我们需要 gear 为“连续”,则在 type 中将其单独指定为 list,它将被视为该类型,而其他变量将自动判断

    library(gtsummary)
    tbl_summary(mtcars, type = list(gear ~ "continuous"))
    

    -输出

    【讨论】:

      【解决方案2】:

      我也有同样的问题。使用 type= 参数显式指定数据类型可以解决独立汇总表的问题。

      如果您想动态提供行变量列表,则会导致问题。当列出的变量 (type = list(gear ~ "continuous2")) 不在提供的行变量列表中时,它会引发错误。

      最好能全局抑制这个功能。

      【讨论】:

      • 您可以提交功能请求以在 gtsummary GitHub 页面上添加此选项
      • 您也可以使用type = list(where(is.numeric) ~ "continuous2") 一次性分配所有数字列。
      猜你喜欢
      • 1970-01-01
      • 2017-09-09
      • 1970-01-01
      • 1970-01-01
      • 2021-01-10
      • 2014-04-23
      • 1970-01-01
      • 2023-02-14
      • 1970-01-01
      相关资源
      最近更新 更多