【发布时间】:2021-09-19 06:24:28
【问题描述】:
我一直在尝试为sklearn Pipeline 架构设计一个转换器,它实际上过滤和删除在管道过程中满足特定标准的记录——如果你愿意的话,一个WHERE 子句。我发现this SO answer 说“任何删除或添加样本的转换器,就现有版本的 scikit-learn 而言,不符合 API”,但它来自 7 年前。事情是否发生了变化,如果没有,Pipeline 哲学的一个好的陈述是什么,它解释了为什么删除记录不符合它的概念? (我绝对明白为什么添加样本没有意义,我认为我明白为什么删除可能没有意义,但我想阅读官方原因以便更好地掌握周围的想法API。)
【问题讨论】:
标签: python scikit-learn data-science