【问题标题】:functions not working on dataset of subset within a subset [duplicate]函数不适用于子集内的子集数据集[重复]
【发布时间】:2020-04-02 03:23:07
【问题描述】:

在 R 中,我试图测试美国人口普查中受过大学教育的人与没有受过大学教育的人的平均子女数。但是我了解到,年龄数据存在严重偏差,因此我打算将年龄限制在 18 岁以上。但是,一旦我限制了年龄和大学教育水平,函数将停止处理数据集(创建的数据集看起来很正常)。这些功能仍然不起作用,但我通过将 18> 设为变量来更接近

eighteen<-ACS_2016_CO$NCHILD[ACS_2016_CO$AGE>17]

eighteen[ACS_2016_CO$EDUCD>6]

给出数字数据

eighteen[ACS_2016_CO$EDUCD<7]

给出数字数据

mean(eighteen[ACS_2016_CO$EDUCD<7])

给出不适用

我已经尝试使用 sum 和 length 来尝试解决它,但是这两个函数也给出了 N/A。有没有更快的方法来同时限制年龄和教育水平,或者有人知道 N/A 不断出现的原因吗?谢谢!

【问题讨论】:

    标签: r function dataset subset mean


    【解决方案1】:

    eighteenACS_2016_CO 的子集,长度与ACS_2016_CO$EDUCD 不同。您可以同时包含条件并通过执行来获取mean

    mean(with(ACS_2016_CO,NCHILD[AGE > 17 & EDUCD < 7]), na.rm = TRUE)
    

    【讨论】:

    • 是的,行得通!非常感谢您在过去 2 个小时内试图弄清楚并为这个问题做了一个帐户。祝你有美好的一天!
    猜你喜欢
    • 2021-11-17
    • 2016-10-12
    • 2014-06-08
    • 1970-01-01
    • 2017-04-01
    • 1970-01-01
    • 2019-08-26
    • 1970-01-01
    相关资源
    最近更新 更多