中国大学慕课《数据挖掘与python实践》第五单元测验

1.通过代码“from sklearn import tree”引入决策树模块，并通过代码“clf = tree.DecisionTreeClassifier()”构造分类器对象后，训练时要调用的方法是（）。
中国大学慕课《数据挖掘与python实践》第五单元测验
2.利用tree.DecisionTreeClassifier()训练模型时调用.fit()方法需要传递的第一个参数是（）。

3.通过代码“from sklearn import metrics”引入评价指标模块后，面对真实标签true_label和模型预测标签predicted_label，混淆矩阵可通过调用（）代码得到。
中国大学慕课《数据挖掘与python实践》第五单元测验
4.用于分类与回归应用的主要算法有（）。

5.决策树中不包含一下哪种结点（）。

6.以下哪种算法是分类算法（）。

7.假设某分类器在一个测试数据集上的分类结果的混淆矩阵如下所示，该分类器的准确率accuracy为（）。
中国大学慕课《数据挖掘与python实践》第五单元测验
8.假设某分类器在一个测试数据集上的分类结果的混淆矩阵如下所示，该分类器的错误率error rate为（）。

9.为了比较利用不同分类算法构建的分类模型的性能，可以利用图形进行比较，常用的图形包括（）。
中国大学慕课《数据挖掘与python实践》第五单元测验
10.分类是总结已有类别对象的特点，并根据这些特点，进行未知类别对象的类别预测的过程。又可称为无监督学习。

11.分类模型的误差大致分为两种：训练误差（training error）和泛化误差（generalization error）。
中国大学慕课《数据挖掘与python实践》第五单元测验
12.在决策树中，随着树中结点数变得太大，即使模型的训练误差还在继续减低，但是检验误差开始增大，这是出现了模型拟合不足的问题。

13.留一法是交叉验证法的特殊情况。
中国大学慕课《数据挖掘与python实践》第五单元测验
14.ID3 的分裂属性选择条件是选择信息增益最大的作为分裂属性。

15.朴素贝叶斯分类基于贝叶斯定理的一种分类方法。

16.假设某分类器在一个测试数据集上的分类结果的混淆矩阵如下所示，请计算该分类器的错误率，以类别yes为正例，计算分类器的查准率precision为 60 %。【保留到整数位】
中国大学慕课《数据挖掘与python实践》第五单元测验
17.假设某分类器在一个测试数据集上的分类结果的混淆矩阵如下所示，请计算该分类器的错误率，以类别yes为正例，计算分类器的查全率recall为 75 %。【保留到整数位】