【发布时间】:2021-02-10 03:55:48
【问题描述】:
我正在寻找根据评估另一个特征变量的条件用 1 或 0 填充缺失值的方法。
数据集的简化形式:
**Show Time_watched Completed**
GOT 400 1
The Office 424 1
Breaking Bad 325 0
GOT 325 0
The Office 344 NaN
Breaking Bad 325 1
我想用以下条件填充缺失值: 如果 Time_watched 大于该节目的平均/第三分位数 time_watched,则填写 1 否则 0
在上面的示例中,要在已完成的列中填充 NaN,理想情况下,函数应将 344 分钟与“办公室”节目的平均观看时间进行比较,并决定插入 1 或 0。
我正在尝试不同的 fillna、groupby、transform 和 lambda 函数组合,但我无法生成所需的输出。 感谢帮助
【问题讨论】:
标签: python-3.x pandas dataframe data-science