【发布时间】:2018-10-01 01:26:34
【问题描述】:
假设我有以下signal 数组,其中每个值对应于time 数组中的一个时间:
np.random.seed(123)
time = np.array([0,2,4,7,10,11,12,17,21,25,29,30,31,40]) # in seconds
signal = np.random.randint(1,5,len(time))
我想要做的是将signal 数组分割成更小的数组,这样每个切片的时间跨度至少 10 秒。然后对每个切片求和 signal。视觉上:
|-----sum------||-----sum------||---sum----||--X--
time = 0, 2, 4, 7, 10, 11, 12, 17, 21, 25, 29, 31, 40
signal = 3, 2, 3, 3, 1, 3, 3, 2, 4, 3, 4, 3, 2
我想要的输出是一个列表,其中包含每 10 秒切片的 signal 的总和:
[12, # 3+2+3+3+1
13, # 1+3+3+2+4
14] # 4+3+4+3
请注意,最后 2 个 signal 元素不会被求和,因为那里的时间差小于 10 秒
我写了以下函数:
def count(x, time, epoch=60):
# calculate time diff
time = time - time[0]
# get indices at time boundaries
num_bins = int(max(time) / epoch)
inds = [0]
for i in range(num_bins):
upper_ind = np.argmax(time >= time[inds[-1]] + epoch)
if time[upper_ind] - time[inds[-1]] >= epoch:
inds.append(upper_ind)
# calculate sums between each boundary
counts = []
for i in range(len(inds) - 1):
lower = inds[i]
upper = inds[i+1] + 1
cur_signal = x[lower:upper]
counts.append(sum(cur_signal))
return counts
调用者:
counts = count(signal, time, epoch=10)
它可以工作,但是对于大型数组来说它很慢并且很hacky。有没有更有效的方法来做到这一点,也许有一些 numpy 魔法,我不必通过来确定边界,然后再通过来得到总和?
如果有一种方法可以在 2 个时间点之间进行线性插值(即,如果前一个时间点略短于 10 秒,而下一个时间点略大于 10 秒),则可以通过在精确 10 秒处估计 signal 的值来获得奖励积分间隔
编辑:
只是为了从 cmets 那里提供一些额外的信息...
至少 10 秒长意味着切片不能短于 10 秒,但可以更长。我将取大于 10s 的第一个时间点。请参阅上面示例中的第二个切片
边界处的信号值将被计算两次。也就是说,一个切片的结束值就是下一个切片的起始值
【问题讨论】:
-
“至少 10 秒长”表示可以选择更长的跨度?!
-
是的。但没有更短的了。我希望第一次至少有 10 秒。我的例子中的第二个切片就是一个例子
-
signal中的某些元素被计算两次(如第 5 个值,1)。澄清一下,一个切片的最后一个元素也是下一个切片的第一个元素? -
是的,没错
-
如果时间的倒数第二个元素不存在并且相应地删除信号中的倒数第二个元素怎么办。即时间是 -
[ 0, 2, 4, 7, 10, 11, 12, 17, 21, 25, 29, 30, 40]和信号 -[ 3, 2, 3, 3, 1, 3, 3, 2, 4, 3, 4, 2, 2]。那么输出必须是什么?在这种情况下,循环代码似乎不起作用,因此这个查询。
标签: python numpy time-series