【问题标题】:R programming + Data ProcessingR编程+数据处理
【发布时间】:2021-05-10 19:52:05
【问题描述】:

考虑“ISLR”包中的“College”数据集。

a) 使用函数summary() 生成变量的数字摘要 在数据集中。
b) 使用pairs() 生成数据集中连续变量的散点图。
c) 通过“分箱”变量“Top10perc”创建一个名为“Elite”的新定性变量。我们将根据来自高中的两个 10% 的学生的比例是否超过 50% 将大学分为两组。将此变量添加到您的数据集。
d) 使用表格函数计算精英学校有多少。
e) 使用表格函数计算出有多少精英学校是私立的。
f) 精英学校的毕业率往往更高吗?

在 (e) 和 (f) 方面需要帮助

这是我到目前为止写的:-

#install.packages("ISLR")
library(ISLR)
setwd("~/Desktop/spring 2021/STA/Homework/HW1")
data("College")
head(College)
summary(College)
pairs(College[ ,2:18])
College$Elite <- College$Top10perc > 50
summary(College)
table(College$Elite)

数据集摘要:

【问题讨论】:

    标签: r


    【解决方案1】:

    e) table(College[College$Private=="Yes",]$Elite) 回答问题,因为TRUE 频率是65

    但是,我更喜欢看到“精英”与“非精英”:

    (¬_¬)table(College[College$Private=="Yes",]$Elite)
    
        Elite Non-Elite 
           65       500
    

    f) 你可以做一个单方面的 Welch t.test() 来比较精英学校和非精英学校之间的 Grad.Rate 方法:

    (¬_¬)t.test(Grad.Rate~Elite, College, alternative = "greater")
    
        Welch Two Sample t-test
    
    data:  Grad.Rate by Elite
    t = 12.986, df = 109.94, p-value < 2.2e-16
    alternative hypothesis: true difference in means is greater than 0
    95 percent confidence interval:
     17.37645      Inf
    sample estimates:
        mean in group Elite mean in group Non-Elite 
                   83.38462                63.46352 
    

    【讨论】:

    • 我认为“有多少精英学校是私立的”这个问题的答案应该包括变量ElitePrivate,你不觉得吗? ;-)
    • 怎么看精英和非精英?至于现在我看到上面提到的代码的真假
    猜你喜欢
    • 1970-01-01
    • 2020-07-22
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-06-25
    • 2012-09-13
    • 1970-01-01
    相关资源
    最近更新 更多