【发布时间】:2017-03-20 15:29:27
【问题描述】:
我对流分析行为有两个一般性问题。在有关我的问题的文档中,我没有发现任何或(对我而言)误导性信息。
我的两个问题都是针对以 EventHub 作为输入源的流分析。
1.流位置
分析作业开始时,是否只处理启动后传入的事件?仍在事件中心管道中的旧事件是否被忽略?
2。长跨度时间窗口
在文档中是这样写的
“窗口的输出将是基于聚合函数的单个事件,时间戳等于窗口结束时间。”
如果我创建了一个带有例如 7 天滚动窗口的 select 语句。在关闭窗口并发送结果集之前,作业可以在内存中保存多少个输出元素是否有任何限制?我的意思是在我繁重的工作量 eventthub 上,这可能是数百万个输出结果。
【问题讨论】: