【发布时间】:2021-09-11 04:08:30
【问题描述】:
真的已经用了一个多星期了,使用 youtube 喜欢的预测数据集。我不得不将所有非文本特征和非相关特征删除到目标剩余的 3 个特征,并且数据集只是 (26061,12) 数据集。 但是使用线性回归发现我的 MSE 太大了,MAE 也太大了(大约 15,000)。还使用了梯度提升仍然相同,并且还发现它不适用于数据集任何大于 5 的 n_estimators 值。还尝试使用电源变压器转换 X_train 和 X_test 以确保良好的高斯分布,但仍然无法正常工作。 我想不出真正的问题是什么。 这是我的 colab 笔记本的链接https://colab.research.google.com/drive/1dJZuG0n63842DEwHMR7TzLBmssnOKsj4?usp=sharing 链接到数据集https://www.kaggle.com/jinxzed/youtube-likes-prediction-av-hacklive
【问题讨论】:
标签: python machine-learning regression data-science hyperparameters