【发布时间】:2013-05-09 20:35:15
【问题描述】:
我有不同长度的数字向量,范围从 300 到 500。我想将它们“标准化”为 100 的长度,即对于长度为 300 的向量,我取 3 个值的平均值,对于长度 500 5 个值的平均值,以此类推。
如何在不重新排序的情况下对数字向量进行分箱并计算平均值?到目前为止,我还没有成功使用cut。
# numeric vectors of different lengths
v1 = rnorm(300)
v2 = rnorm(500)
# goal: numeric vectors of same length
v1.binned = c(mean(v1[1],v1[2],v1[3]), ...)
v2.binned = c(mean(v2[1],v2[2],v2[3], v2[4], v2[5]), ...)
【问题讨论】:
-
除非所有向量的长度都是 N*100,否则您将计算加权平均值。例如。
v3=rnorm(250)-- 如果你计算 1:100、101:200 和 201:250 的平均值,当你对这三个计算的平均值进行任何操作时,第三组的权重是其他组的两倍。
标签: r statistics bin