【动手学数据分析】Task03笔记

前两个task中学会了怎么清洗数据准备数据，相当于得到了喂给模型的建模数据。

判断是否存活，所以是个监督问题。

下面这个图实在是有灵性。

【动手学数据分析】Task03笔记

【思考】

单次使用留出法得到的估计结果往往不够稳定可靠，在使用留出法时，一般要采用若干次随机划分、重复进行模型评估后取平均值作为留出法的评估结果。

参数说明：train_test_split (*arrays，test_size, train_size, rondom_state=None, shuffle=True, stratify=None)

为什么线性模型可以进行分类任务，背后是怎么的数学关系？

设定阈值？概率问题

对于多分类问题，线性模型是怎么进行分类的？

也是算概率？不太记得了

评价评的是模型的泛化能力。

“交叉验证（cross-validation）是一种评估泛化性能的统计学方法，它比单次划分训练集和测试集的方法更加稳定、全面。”

k折越多的情况下会带来什么样的影响？

偏差和方差的问题