【发布时间】:2021-02-20 15:25:41
【问题描述】:
【问题讨论】:
标签: python dataframe nan missing-data finance
【问题讨论】:
标签: python dataframe nan missing-data finance
有很多方法可以解决这个问题。
【讨论】:
您的问题没有具体的答案,这是统计中的一个普遍问题,称为“插补”。根据应用程序的不同,答案可能有很多。
首先想到的替代方案很少能解决您的问题,但不要忘记“无数据”几乎总是比“坏/错误数据”好。 如果您有足够多的行而没有包含 NaN 的行,您可以简单地删除它们。 否则您可以考虑以下方法:
我建议您尝试所有方法,看看哪一种效果更好,因为您的问题确实没有具体的答案。您可以在不使用该列的情况下创建机器学习模型并将其性能作为基准,并与基准相比对所有步骤进行性能(准确性)基准测试。
注意:我只是一个研究生,有一些见解,如果我说的不正确,请评论!
【讨论】: