【发布时间】:2021-07-19 15:38:24
【问题描述】:
向所有伟大的思想家致敬,
我试图更严格地理解多项式拟合与 scikit 一起工作的方式。更具体地说,我要做的是分解过程,并仅显示具有基于单个值生成的新多项式特征的数据框。
所以我有几个条目的数据,每个条目都是一维的。我想生成一个适合多项式拟合的设计矩阵。我目前正在做的事情是这样的:
pd.DataFrame(PolynomialFeatures(k).fit_transform(X))
这按预期工作。
但是,我正在努力解决的是 fit_transform() 的作用。就我而言,我还没有尝试适合任何安静的东西,只是产生一个具有新构建的多项式特征的数据框。我天真地尝试将 fit_transform() 更改为 transform(),但显然我必须在允许转换之前使用 fit。
如果有人能指出我的错误,我将不胜感激。我还没有尝试在数据上拟合模型,只是为了创建一个具有多项式特征的设计矩阵,那么为什么我必须使用 fit()(或 fit_transform(),就此而言)?事实上,我并不真正理解 fit() 在这里实际上做了什么,documentation 并没有帮助我理解它。
谢谢!
【问题讨论】:
标签: python scikit-learn