[置顶]京东城市时空数据引擎JUST亮相中国数据库技术大会(附PPT链接)



受疫情影响,第十一届中国数据库技术大会(DTCC2020)从原定的5月份,推迟到了8月份,再推迟到了12月份。尽管如此,依然没有减退国人对数据库技术的热情。2020年12月21日-12月23日,北京国际会议中心人头攒动,各大厂商争奇斗艳。在NoSQL技术专场,京东智能城市研究院的李瑞远博士给大家带来了《京东城市时空数据引擎JUST的架构设计与应用实践》的主题报告,受到了大家的广泛关注。以下为李瑞远...

WWW2021:细粒度城市流量预测(附论文链接)



城市流量预测在智慧城市建设中扮演着非常重要的角色,有利于城市交通管理以及保障公共安全。京东城市时空AI团队针对该方向,已提出一系列研究成果[1-9]。然而,目前工作多是围绕粗粒度的预测任务,而面向城市精细化管理需求,需要提供更细粒度的精准流量预测。基于此,京东城市时空AI团队提出一种新型时空AI模型——时空关系网络来预测细粒度的城市流量。相比于传统粗粒度城市流量预测问题,细粒度城市流量预测有两大难...

如何加快城市路网中最短路径查询效率?



一、介绍最短路查询算法是图论中的经典算法,被广泛地应用在不同场景,例如计算机网络中的路由算法。在时空场景下,最短路算法更是支撑了很多应用,例如在路径规划和推荐中最短路是一种最直接的方案,而目前主流的基于隐马尔科夫模型的轨迹地图匹配算法也会产生大量的最短路查询 [1]。具体如图1所示,在计算相邻两个轨迹点之间可能的匹配路段时,地图匹配算法会首先做一个范围查询确定候选路段,为了计算候选路段之间的转移概...

基于遥感影像及轨迹数据融合的地图自动化生成器



自动化的地图生成对于城市服务及基于位置服务非常重要,现有的工作研究主要利用遥感影像或可以充分反映地图路网情况的车辆轨迹数据生成地图,数据源较为单一,如果能将遥感影像数据及轨迹数据融合起来,地图生成的质量将进一步提高。本文介绍了复旦大学等机构在国际人工智能领域顶会AAAI’20 上发表的论文《DeepDualMapper: A Gated Fusion Network for Automatic M...

WWW2021: AutoSTG面向时空图预测的神经网络结构搜索(附论文链接)



近年来,随着智能城市建设的大力推进,学术界和工业界开始出现大量关于城市时空数据分析与挖掘的研究工作。面向城市中不同时空预测任务(如交通流量预测、区域客流量预测等),京东智能城市时空AI团队也已提出一系列研究成果[1]。然而针对具体应用任务的神经网络设计需要丰富的领域知识和大量的实验验证,人力成本较高,无法高效支撑实际城市项目落地中复杂多样的时空应用。自动化网络结构搜索是针对深度模型网络设计提出的一...

​从轨迹中预训练情境时间感知的、用于用户位置预测的地点嵌入



对轨迹数据进行预训练地点嵌入能够用于用户下一个地点预测任务。现有的基于轨迹数据预训练的地点嵌入方法,将一个地点用单一的向量表达。然而在现实世界中,一个地点通常在不同的场景下扮演不同的功能。如果轨迹中的地点嵌入能够准确表达其功能,用户下一个地点预测的性能可以得到提升。本文介绍北京交通大学等机构在国际人工智能领域顶会AAAI’21上发表的论文《Pre-training Context and Time...

​HBsae与时空索引技术杂谈



一、背景近年来智能城市建设在云计算和大数据技术的推动下,取得了飞跃式的发展,产生了海量可记录的数据,如文本、视频、传感器读数等。每年移动互联网接入流量消费超过711亿GB,其中,80%的数据都与时空相关。北京出租车三个月内产生了远超790万条轨迹数据,NASA卫星数据档案库已经超过500TB。迅速产生的时空数据,背后蕴藏着巨大的对智能城市发展有用的信息。如,根据交通轨迹来优化交通信号灯的时间、实时...

WhereCOVID-19: 全球疫情数据时空可视分析



作者:王少华WhereCOVID-19是面向多尺度时空数据的可视化并预测COVID-19分布特征,同时提供在线空间决策支持系统,可用于识别有风险的人群以指导有针对性的医疗保健干预措施。该平台是UIUC CyberGIS Center与流行病学研究人员以及公共卫生部门合作开发的开放式软件平台,目的在于提供一站式地理空间数据和分析系统,以支持前沿研究和及时决策。WhereCOVID-19 项目是美国伊...

Spark任务中空间数据的序列化



一、引言Spark是目前主流的分布式计算框架,通过利用内存存储中间计算结果的方式,优化了MapReduce框架并不擅长的迭代式计算。同时,Spark使用有向无环图(Directed Acyclic Graph,DAG)统筹和优化整个计算流程。另外,Spark基于弹性分布式数据集RDD(Resilient Distributed Datasets)提供了丰富的数据分析算子,大大简化了分布式计算应用的...

ICDE 2021: 针对具有噪音和低采样率轨迹的时空相似算法(附论文链接)



随着定位技术的发展以及IOT设备的普及,大量的轨迹数据可以被采集分析。轨迹数据一般被表示成位置与其采集时间的序列。了解轨迹之间的相似度,有非常多的应用,例如:密切接触者追踪,伴侣检测,个性化推荐等。然而,实际应用中,轨迹中的位置信息往往是有噪声的;同时,不同轨迹的采样率有所不同,在某些场景中,轨迹的采样率甚至可能很低。这都为轨迹相似度的比较带来很大的挑战。本文将介绍香港科技大学、台湾交通大学、台湾...