Motivation

----------------------------------------------------------------------------------------------------

过去的工作集中于讨论空间众包的静态离线场景，但是空间众包是一个实时平台，工人和任务可以动态在线，并且其位置事先未知；
最近的一些工作探索了SC中的在线分配方法，其中根据当前任务分配，将新到达的任务分配给合适的工人，并未考虑未进入系统的未来工人/任务；
现有研究表明，大多数人都具有重复性的旅程，例如往返工作地点，这使得根据其旅行历史预测工人的位置/路线成为可能；此外通过分析任务执行轨迹，可以获得有关工人任务执行行为的宝贵见解，可以进一步利用这些见解来提高空间众包的质量；

Problem Statement

----------------------------------------------------------------------------------------------------

DPSTA Framework Overview

----------------------------------------------------------------------------------------------------

作者提出一个新颖的空间众包框架DPSTA，包括两个组件：

左边是预测组件，根据工人的历史任务执行轨迹和任务的发布历史，来预测未来的时空分布

针对工人和任务的预测提出了不同的策略，具体来看就是，通过将工人的历史任务执行记录视为序列数据，利用频繁模式挖掘的方法来挖掘工人的频繁时间实例。并每个工人在其可用时间内提出了两种空间分布预测策略：

1. 基于时空的循环神经网络（ST-RNN）的位置预测；

2. 基于混合模型的路线预测；

由于可以将空间任务视为空间点事件，因此作者设计了路径约束DeepWalk模型来获取每个时间点下未来任务的数量，然后采用核密度估计方法来预测未来时间实例中任务的位置分布。

右边是任务分配组件

在工人时间和行进路线的限制下，将任务分配给合适的工人来最大化的任务分配数。首先为每个工人计算MaxVTS，因为在枚举MaxVTS的所有可能组合时，必须解决巨大搜索空间中的计算问题，因此作者提出了贪心任务分配和最优任务分配算法。

Worker Prediction

----------------------------------------------------------------------------------------------------

工人可用时间预测

工人的任务执行历史对应的时间戳其实就是工人的可用时间，所以通过使用频繁模式挖掘算法可以从工人的任务执行历史中挖掘工人更可能执行任务的频繁时间实例，从而预测工人未来的可用时间；

频繁模式：在超市的销售记录里，常常会发现牛奶和面包、啤酒和尿布等经常被一起购买的，所以牛奶和面包可以看成是一个频繁模式。比较经典的频繁模式挖掘算法有FP树,它是根据给定的原始数据，构建FP树，然后根据FP树来获取频繁模式。

FP树算法：FP树算法了解

工人起始位置预测

关于位置的预测，作者受考虑时空信息的循环神经网络模型 ST-RNN 的启发。

这个ST-RNN模型最初提出是用于发现POI之间的顺序相关性，预测下一个将要去的兴趣地,现在把它用于预测每个未来工人在其可用时间开始时的位置。

RNN是一类用于处理序列数据的神经网络。基础的神经网络包含输入层、隐层和输出层，通过激活函数控制输出，层与层之间通过权值连接，训练“学“到的东西就蕴含在“权值“中。 RNN与基础神经网络最大的不同之处就是可以将上一个输出结果以信息方式储存在隐藏层中。ST-RNN基于RNN，融入时间和地理信息。

这个模型的输入层是工人w在ti时访问的位置的向量；隐藏层是关键组成部分，可以计算工人w在时间戳t时的向量表示；最后通过计算输出层中工人和位置的内积来得出预测工人的起始位置；

同时模型中涉及到的参数是使用时间反向传播算法来学习的，这个时间反向传播算法是常用的训练RNN的方法，中心思想和BP算法相同，就是沿着需要优化的参数的负梯度方向不断寻找更优的点直至收敛。（梯度下降法）

工人行进路线预测

基于GPS对工人过去在道路网中的出行的观测来预测工人的潜在路线

1.通过基于特征点的道路拐角提取（CP-RCE）方法从大规模历史轨迹中提取道路拐角，基于这些道路拐角的轨迹映射方法表示预测的预测值，生成以道路拐角为中心的路线

2.采用MDL-DBSCAN算法，通过聚类检测在历史轨迹汇总频繁出现的道路拐角

3.采用模式匹配方法：前缀投影的模式挖掘（ PrefixSpan ），从历史轨迹中发现隐藏的移动频繁模式

4.路线预测过程中，模式匹配方法用于根据发现的频繁移动模式来预测未来路线，当遇到无模式匹配时，ST-RNN模型可用于预测下一个行驶中的道路拐角

5.使用工人的最新速度作为其未来的速度来计算其在可用时间内的行驶距离

PrefixSpan算法：PrefixSpan算法了解

Task Prediction

----------------------------------------------------------------------------------------------------

思路

空间任务是在特定位置被完成的，因此将这些任务视为空间点事件。通过将研究区域划分为不相交且均匀的网格进行预测，首先估计在将来的时间实例中可能落入每个网格单元中的潜在任务（具有不同类型）的数量，之后采用平面KDE方法来计算空间任务的密度，进而预测任务发生的位置。

网格内任务数量的预测：构建网络，采用改进的DeepWalk模型：PC-DeepWalk，学习网络节点表示，进而计算任务数量
网格内任务分布的预测：根据历史数据采用KDE平面核密度估计，通过对在可能位置上出现的概率排序，选取前k个位置作为最终的预测位置

KDE：平面核密度估计已被广泛用于空间点事件分析和检测，通过计算事件强度作为在空间上生成点事件的密度估计

DeepWalk：从网络的被截断的随机游走中学习节点的潜在表示（向量）DeepWalk算法了解

任务数量预测

基于划分好的网格，要构建一个网络G，其中网络的节点有两种，一种是基于时间单元的TC节点，它代表在时间戳tj下的单元格Ci；另一种是基于任务的节点ST，它表示一种任务类型m;

网络的边同样有两类，一类是空间邻近边，这类边连接TC节点，对应的权值与两个单元格之间的空间距离成负相关；另一类是任务相关边，连接TC节点和ST节点，它的存在表示在时间戳tj,单元格Ci下有类型为m的任务发布；

因为节点和边属于多种类型，所以作者提出的基于空间任务的网络是一个异构信息网络(HIN). 因此考虑到异构信息网络的特性，在已有的相关研究的启发下，作者设计了三种类型的路径来捕获时空信息和任务相关信息。（这三种路径分别是空间路径、任务相关路径、按照时序的任务相关路径）然后提出了一种路径约束的DeepWalk（PC-DeepWalk）算法，就是按照这三种路径进行随机游走，得到长度为λ的节点序列，通过训练SkipGram模型将网络的原始节点表示为向量。

任务位置预测

Task Assignment

----------------------------------------------------------------------------------------------------

贪心任务分配

最优任务分配

计算每个工人的有效任务集的所有可能组合时，主要的挑战在于巨大的搜索空间，相对于工人的数量呈指数增长。

思路：首先构造一个工人的工作依赖依赖图。通过在该图上采用图划分方法并以树形结构组织每个子图的工作集，原问题将分解为多个独立的子问题。然后设计了深度优先搜索算法以找到最佳任务分配。

Experiment

----------------------------------------------------------------------------------------------------

数据集

Twitter-Foursquare（TF）

从Twitter带有类别信息的签到数据，2010年9月-2011年1月，Lon ∈[40.231, 41.231], Lat∈[-74.435, -73.435]，包括20046位用户的29046签到数据

假设用户是SC系统中的工人，对于每个签到地点，分别使用其位置和一天中最早的签到时间作为任务的位置和发布时间。因此，签到的类别被视为任务的类别，并且在现场签到等同于接受任务。

gMission（GM）

基于研究的通用空间众包平台，包括532个工人和713个任务，其中每个工人都有自己的位置，到达时间和最后期限，每个任务都与一个位置，发布时间，截止日期和用于对任务进行分类的任务描述相关联。由于gMission系统中缺少有关工人/任务的历史数据，因此，我们生成的工人/任务在历史记录，对于每个工人/任务，将其位置设置为中心，以高斯分布随机产生其历史位置，该位置的出现时间每天都均匀分布。

1. 通过将工人的日常工作地点输入“城市机动性模拟”中，生成GPS轨迹，模拟每个工人每天的轨迹；

2. 70％的工人/任务位置数据进行训练，20％进行测试，其余10％作为验证集；

结果

Conclusion

----------------------------------------------------------------------------------------------------

数据驱动的预测性空间任务分配（DPSTA）框架
两种新颖的策略来根据工人的出行历史预测他们的未来位置和路线
一种有效的图嵌入机制来估计任务的时空分布
贪心和最优的任务分配算法

ICDE2020｜Predictive Task Assignment in Spatial Crowdsourcing: A Data-driven Approach相关推荐

ICDE-2020 论文简析:空间众包中的预测任务分配 : 一种数据驱动的方法 Predictive Task Assignment in Spatial Crowdsourcing
ICDE-2020 论文简析:空间众包中的预测任务分配:一种数据驱动的方法 Predictive Task Assignment in Spatial Crowdsourcing: A Data-dr ...
ICDE-2020 论文简析:依赖感知空间众包中的任务分配 - Task Allocation in Dependency-aware Spatial Crowdsourcing
ICDE-2020 论文简析:依赖感知空间众包中的任务分配 - Task Allocation in Dependency-aware Spatial Crowdsourcing 研究背景研究目标 ...
ICDE2020论文简析:空间众包实时交叉在线匹配 - Real Time Cross Online Matching in Spatial Crowdsourcing
ICDE2020论文简析:空间众包实时交叉在线匹配 - Real Time Cross Online Matching in Spatial Crowdsourcing 研究现状作者贡献概念定义 ...
第二章-空间众包（spatial crowdsourcing）概述
1.什么是空间众包? 空间众包,Spatial Crowd-Sourcing,其流程是:Requester将自己的的任务及其任务附带的信息提交到众包平台(platform),平台将一组与位置相关的任务 ...
无人机任务分配 matlab,Multi-UAV Task Assignment Benchmark
Multi-UAV Task Assignment Benchmark 多无人机任务分配算法测试基准 Introduction A benchmark for multi-UAV task assig ...
【DS实践 | Coursera】Assignment 2 | Applied Plotting, Charting Data Representation in Python
文章目录一.问题分析 1.1 问题描述 1.2 问题分析二.具体代码及注释 2.1 代码 2.2 绘图结果一.问题分析 1.1 问题描述 Before working on this assig ...
【DS实践 | Coursera】Assignment 3 | Applied Plotting, Charting Data Representation in Python
文章目录一.问题分析 1.1 问题描述 1.2 问题分析二.具体代码及注释 2.1 代码及注释 2.2 绘图结果一.问题分析 1.1 问题描述 In this assignment you mu ...
AAAI-19录用论文清单
AAAI-19于1月27日在夏威夷召开,今年是33届会议. 会议录用论文清单, workshop16个,tutorials24个. 标题的词云分析: 作者单位词云(按作者人数计算/一篇文章可能有多个作 ...
众包综述——关于众包的一些研究方向
文章目录准备 1. 结果汇聚(真值推理) 2. 激励机制 3. 空间众包(移动众包) 4. 任务标价 5. 任务分解与分配 6. 众包与社交网络 7. 质量控制 8. 众包安全与隐私保护 9. 众包 ...

ICDE2020｜Predictive Task Assignment in Spatial Crowdsourcing: A Data-driven Approach

Motivation

Problem Statement

DPSTA Framework Overview

Worker Prediction

工人可用时间预测

工人起始位置预测

工人行进路线预测

Task Prediction

任务数量预测

任务位置预测

Task Assignment

贪心任务分配

最优任务分配

Experiment

数据集

结果

Conclusion

ICDE2020｜Predictive Task Assignment in Spatial Crowdsourcing: A Data-driven Approach相关推荐

最新文章

热门文章