【发布时间】:2014-07-23 07:03:57
【问题描述】:
我正在尝试使用 SPSS 查找数据库中各种变量的均值的置信区间,但遇到了麻烦。
数据是加权的,因为每个接受调查的人代表总人口的不同部分。例如,我们样本中的一名年轻人可能代表普通人群中的 28000 名年轻人。问题是 SPSS 似乎认为这个年轻人的数据库条目每个都代表 28000 个测量值,而实际上它们只代表一个,这使得 SPSS 认为我们拥有的数据比实际多得多。因此,SPSS 给出了非常低的标准误差估计值和非常非常窄的置信区间。
我尝试通过将每个重量值除以平均重量来解决此问题。这给出了合理的数字和平均权重 1,但我不确定结果数字是否正确。
我的方法合理吗?如果没有,我应该怎么做?
我一直在使用探索命令来查找平均误差和标准误差(除其他外),以防万一。
【问题讨论】:
-
权重如何到达?它来自具有不等选择概率的样本吗? (或某种其他类型的后分层?)对于样本权重,您通常与选择概率成反比。不过我对后分层不太熟悉。
-
老实说,我不确定权重是从哪里来的。我得问问给我数据库的人。
标签: statistics spss s