【发布时间】:2015-02-23 14:50:46
【问题描述】:
只是阅读此great paper 并尝试实现此:
...我们对待每一个人 树作为一个分类特征,将 一个实例最终落入的叶子的索引。我们使用 1- 这类特征的of-K编码。例如,考虑 图 1 中具有 2 个子树的提升树模型,其中 第一个子树有 3 个叶子,第二个有 2 个叶子。如果 实例在第一个子树的叶子 2 和叶子 1 中结束 第二个子树,线性分类器的整体输入将 是二进制向量 [0, 1, 0, 1, 0],其中前 3 个条目 对应于第一个子树的叶子和最后2个 第二个子树的那些...
有谁知道我如何预测一堆行并为每一行获取集合中每棵树的选定叶子?对于这个用例,我并不关心节点代表什么,只关心它的索引。查看了源代码,我无法很快看到任何明显的东西。我可以看到我需要迭代树并执行以下操作:
for sample in X_test:
for tree in gbc.estimators_:
leaf = tree.leaf_index(sample) # This is the function I need but don't think exists.
...
任何指针表示赞赏。
【问题讨论】:
标签: python-2.7 machine-learning scikit-learn decision-tree