【发布时间】:2020-08-22 00:34:23
【问题描述】:
我正在开展一个项目,以根据许多变量来模拟一个人的幸福感变化。
大多数解释变量是每天(他们吃了多少食物、每天运动、睡眠等),但其中一些是每周 - 他们应该是每周,并且对预测变量有一次影响周。
例如,每周变量之一是一个人在每周同一天称体重时的体重变化。
此数据每周仅提供一次,并且会影响人们当天的幸福感。
在这种情况下,有人可以告诉我如何在没有可用于每周变量的数据的日子里处理 python 中的缺失数据吗?
推断缺失天数的数据是错误的,因为人们的幸福感根本不受这些每周变量在不可用天数的影响。
我创建了一个虚拟变量,当每周数据可用时为 1,否则为 0,但我不知道如何处理丢失的数据。我不能离开 NaN,否则 python 不会运行回归,但我不能输入 0,因为有时数据可用当天的实际变量值(例如:体重变化)可能是 0。
【问题讨论】:
标签: python scikit-learn regression nan missing-data