【问题标题】:Are the green dots separable?绿点是可分离的吗?
【发布时间】:2017-09-07 20:41:31
【问题描述】:

]1

我有一个数据集,我想从中预测患者得病。下图是之后的第一步:

  1. 缩放 3 个功能
  2. 运行 scikit learn 的 PCA 例程
  3. 原始数据集有 25 个特征,但在我们的练习中,我们被要求只使用 3 个特征。然后通过 PCA 将这 3 个功能减少到 2 个

当我看到这些数据时,我的第一反应是绿点(那些不容易患肾病的)是不可分离的。

我的假设正确吗?

【问题讨论】:

  • 谢谢.....!!我也是这么认为的

标签: python-2.7 machine-learning scikit-learn


【解决方案1】:

可能是您的 PCA 没有提供最好的功能来分离您的数据。我建议使用 Random Forest 或 XGBoost 之类的东西,您可以轻松地看到特征重要性,然后使用最好的 3 个特征来尝试对数据进行分类。

【讨论】:

  • Xgboost 变得如此重要和广泛使用。很好的推荐。
【解决方案2】:

不能分开点。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-03-05
    • 1970-01-01
    • 2019-06-02
    相关资源
    最近更新 更多