【发布时间】:2013-07-06 21:48:13
【问题描述】:
我正在尝试生成一组完全反映我拥有的数据集的随机数字(以对其进行测试)。该数据集由 5 个变量组成,这些变量都与不同的均值和标准差以及范围相关(它们是李克特量表相加形成 1 个变量)。我已经能够从MASS 包中获得mvrnorm 来创建一个数据集,该数据集使用观察到的观察次数(经过500,000 次以上的迭代)复制相关矩阵,并且我可以轻松地重新分配均值和标准差。开发。通过 z-score 转换,但我仍然在每个变量向量中都有特定值,这些值远高于或低于我希望复制其分数的可能范围。
对于如何适当地修正范围有什么建议吗?
感谢您分享您的知识!
【问题讨论】:
-
用范围边界值替换每个超出范围的值怎么样?
-
获得正确的数据生成过程需要认真的建模工作。最后,高斯分布的范围与均值和方差的选择直接相关
-
如果经过 z-score 变换后发现数据的极值差异很大,那么可能是原始数据不是正态分布的?
-
这个讨论可能对你有用:r.789695.n4.nabble.com/…
标签: r random range simulation