1.通过代码“from sklearn import tree”引入决策树模块,并通过代码“clf = tree.DecisionTreeClassifier()”构造分类器对象后,训练时要调用的方法是( )。
2.利用tree.DecisionTreeClassifier()训练模型时调用.fit()方法需要传递的第一个参数是( )。
3.通过代码“from sklearn import metrics”引入评价指标模块后,面对真实标签true_label和模型预测标签predicted_label,混淆矩阵可通过调用( )代码得到。
4.用于分类与回归应用的主要算法有( )。
5.决策树中不包含一下哪种结点( )。
6.以下哪种算法是分类算法( )。
7.假设某分类器在一个测试数据集上的分类结果的混淆矩阵如下所示,该分类器的准确率accuracy为( )。
8.假设某分类器在一个测试数据集上的分类结果的混淆矩阵如下所示,该分类器的错误率error rate为( )。
9.为了比较利用不同分类算法构建的分类模型的性能,可以利用图形进行比较,常用的图形包括( )。
10.分类是总结已有类别对象的特点,并根据这些特点,进行未知类别对象的类别预测的过程。又可称为无监督学习。
11.分类模型的误差大致分为两种:训练误差(training error)和泛化误差(generalization error)。
12.在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。
13.留一法是交叉验证法的特殊情况。
14.ID3 的分裂属性选择条件是选择信息增益最大的作为分裂属性。
15.朴素贝叶斯分类基于贝叶斯定理的一种分类方法。
16.假设某分类器在一个测试数据集上的分类结果的混淆矩阵如下所示,请计算该分类器的错误率,以类别yes为正例,计算分类器的查准率precision为 60 %。【保留到整数位】
17.假设某分类器在一个测试数据集上的分类结果的混淆矩阵如下所示,请计算该分类器的错误率,以类别yes为正例,计算分类器的查全率recall为 75 %。【保留到整数位】
相关文章: