【问题标题】:Include survey weighting variable包括调查加权变量
【发布时间】:2020-08-18 15:43:59
【问题描述】:

我正在使用 Python 处理调查数据。 有一个基于年龄、性别和地区的加权变量,应包含在计算中(以使数据代表人口)。

权重变量是一个简单的十进制数,通常介于 >= 0.9 和

我不知道如何将它包含在简单的计算中。大多数变量都有“是/否/不确定”值或其他类别。

例如,如何在此处包含权重变量:

survey['my_variable'].value_counts(normalize=True)

【问题讨论】:

标签: python survey weighting


【解决方案1】:

我想我已经找到了基于此的解决方案:Groupby with weight

所以我的策略是首先按调查周、国家和我感兴趣的分类变量汇总数据框:

survey_c.groupby(['week','country','my_cat_var']).weight.sum().reset_index(name='count')

之后,我可以使用聚合数据进行绘图或其他任何操作。

如果有人有意见或更好的策略,请举手

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2021-09-12
    • 1970-01-01
    • 1970-01-01
    • 2016-08-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多