【发布时间】:2021-05-10 19:52:05
【问题描述】:
考虑“ISLR”包中的“College”数据集。
a) 使用函数summary() 生成变量的数字摘要
在数据集中。
b) 使用pairs() 生成数据集中连续变量的散点图。
c) 通过“分箱”变量“Top10perc”创建一个名为“Elite”的新定性变量。我们将根据来自高中的两个 10% 的学生的比例是否超过 50% 将大学分为两组。将此变量添加到您的数据集。
d) 使用表格函数计算精英学校有多少。
e) 使用表格函数计算出有多少精英学校是私立的。
f) 精英学校的毕业率往往更高吗?
在 (e) 和 (f) 方面需要帮助
这是我到目前为止写的:-
#install.packages("ISLR")
library(ISLR)
setwd("~/Desktop/spring 2021/STA/Homework/HW1")
data("College")
head(College)
summary(College)
pairs(College[ ,2:18])
College$Elite <- College$Top10perc > 50
summary(College)
table(College$Elite)
【问题讨论】:
标签: r