1.用一句话总结支持向量机算法的最大特点。

能构造出最大间距的决策边界,从而提高分类算法的鲁棒性

2.在支持向量机里,为什么把类别标识定义为[-1,1]?

可以用一个公式来表达针对两个不同类别的约束函数。

3.什么是松弛系数,它有什么用?

处理线性不可分的数据集,相当于正则项,纠正过拟合。

4.一句话总结什么是核函数?什么是相似性函数?两者有什么关系?

核函数是特征转换函数。

相似性函数:低维度映射到高纬度,扩大特征向量维度

关系:先用相似性函数扩大特征数量,再运行函数。

5.常用的核函数有哪些?分别有什么特点?

多项式核函数:

scikit-learn机器学习——第八章 复习题

可以拟合出复杂的分隔超平面

高斯核函数:

scikit-learn机器学习——第八章 复习题

可以把输入特征映射到无限多维,参数容易选择。

6.运行随书代码ch08.02.ipynb,修改模型参数,观察结果如何变化

scikit-learn机器学习——第八章 复习题

7.阅读scikit-learn官方文档,试着用svm.LinearSVC来解决乳腺癌检测问题,并与逻辑回归模型对比看看哪个效果更好。提示:可以尝试指定penalty参数,使用L1范数作为正则项来构造支持向量机模型,并使用PolynomialFeatures来引入二项多项式特征。

scikit-learn机器学习——第八章 复习题

 

 

 

 

 

 

 

 

 

 

 

 

相关文章: