MLPClassifier 的可解释性答案

【问题标题】：Interpretability of MLPClassifierMLPClassifier 的可解释性
【发布时间】：2019-07-26 19:43:27
【问题描述】：

我有一个关于机器学习算法的可解释性的问题。

我有一个如下所示的数据集： tabular data set

我已经训练了一个分类模型（来自 Scikit-Learn 的 MLPClassifier），想知道哪些特征对决策的影响最大（权重最高）。

我的最终目标是找到不同的解决方案（特征组合），这些解决方案很有可能（>90%）被归类为 1。

有人知道获得这些解决方案的方法吗？

提前致谢！

【问题讨论】：

【解决方案1】：

为了在分类任务中获得特征重要性，分类方法必须是随机森林或决策树，两者都在 sklearn 中实现，

clf = RandomForestClassifier(n_estimators=100, max_depth=2,random_state=0)
clf.fit(X, y)
#After the fit step
clf.feature_importances_

特征重要性会告诉你每个特征有多少权重，如果你的 MLP 分类器训练得当，它会给你网络中的各种特征分配几乎相似的重要性，

【讨论】：