【问题标题】:Interpretability of MLPClassifierMLPClassifier 的可解释性
【发布时间】:2019-07-26 19:43:27
【问题描述】:
我有一个关于机器学习算法的可解释性的问题。
我有一个如下所示的数据集:
tabular data set
我已经训练了一个分类模型(来自 Scikit-Learn 的 MLPClassifier),想知道哪些特征对决策的影响最大(权重最高)。
我的最终目标是找到不同的解决方案(特征组合),这些解决方案很有可能(>90%)被归类为 1。
有人知道获得这些解决方案的方法吗?
提前致谢!
【问题讨论】:
标签:
python
machine-learning
scikit-learn
classification
【解决方案1】:
为了在分类任务中获得特征重要性,分类方法必须是随机森林或决策树,两者都在 sklearn 中实现,
clf = RandomForestClassifier(n_estimators=100, max_depth=2,random_state=0)
clf.fit(X, y)
#After the fit step
clf.feature_importances_
特征重要性会告诉你每个特征有多少权重,如果你的 MLP 分类器训练得当,它会给你网络中的各种特征分配几乎相似的重要性,