【发布时间】:2020-06-28 09:58:00
【问题描述】:
我想知道如何使用在训练时开发的功能来预测新数据。有问题的数据集是来自Predict appointment no show, Github的预约取消数据集
考虑locations.PERCENT_TRUE(no_show) 的功能:在给定位置取消预约的百分比。假设我有新的传入测试数据,其位置与我已经知道这些值的火车数据中的位置相同。如何在测试数据中使用此功能?当然,我可以将测试数据合并到训练数据中,然后使用featuretools.dfs() 重新计算所有特征,但这很耗时。
有没有更简单的方法?
【问题讨论】:
标签: python-3.x feature-extraction feature-engineering featuretools