京东城市计算郑宇等人与高校联合发表在2019 KDD上的一篇论文。[paper][code]
任务
端到端的深度学习框架,以粗粒度的城市网格流量和天气、日期时间等其他影响因素作为输入,最后得到细粒度的城市网格流量。下图左侧是一个粗粒度级的网格人流量,右侧是一个细粒度级的网格人流量。多个细粒度级区域的流量之和等于一个粗粒度级区域的流量。
挑战
1、空间相关性
- 空间层级结构:多个细粒度级区域的流量之和等于一个粗粒度级区域的流量。
- 相邻区域之间的相互影响关系。
2、外部因素的影响:天气、一天中的第几个小时(time of day)、星期几、特殊事件、POI等。
模型
模型主要由外部因素和结构约束推理两个模块组成。(结构约束即任意两个粗粒度区域均由互不重合的两组细粒度级区域组成。)如下图:
推理网络首先通过Feature Extraction模块提取特征;然后通过Distributional Upsampling计算子区域中的流量分布系数;最后对父区域进行上采样后,两者进行按元素相乘,就得到了细粒度级下各个子区域的流量值。下图是从一个superregion(粗粒度级)推测出多个subregions(细粒度级)的过程,上采样因子(upscaling factor)为2:
实验
进行了两个实验:北京市出租车流量预测和北京欢乐谷人流量预测。
数据集
北京市出租车流量数据集TaxiBJ和北京欢乐谷人流量数据集HappyValley(通过腾讯位置大数据接口获得heat.qq.com)。两个数据集均包含城市流量数据和外部因素数据,其中HappyValley受外部因素票价的影响程度很高。
*注:Github上只有TaxiBJ中的P1数据。