Motivation

----------------------------------------------------------------------------------------------------

  1. 过去的工作集中于讨论空间众包的静态离线场景,但是空间众包是一个实时平台,工人和任务可以动态在线,并且其位置事先未知;
  2. 最近的一些工作探索了SC中的在线分配方法,其中根据当前任务分配,将新到达的任务分配给合适的工人,并未考虑未进入系统的未来工人/任务;
  3. 现有研究表明,大多数人都具有重复性的旅程,例如往返工作地点,这使得根据其旅行历史预测工人的位置/路线成为可能;此外通过分析任务执行轨迹,可以获得有关工人任务执行行为的宝贵见解,可以进一步利用这些见解来提高空间众包的质量;

Problem Statement

----------------------------------------------------------------------------------------------------

DPSTA Framework Overview

----------------------------------------------------------------------------------------------------

作者提出一个新颖的空间众包框架DPSTA,包括两个组件:

  • 左边是预测组件,根据工人的历史任务执行轨迹和任务的发布历史,来预测未来的时空分布

针对工人和任务的预测提出了不同的策略,具体来看就是,通过将工人的历史任务执行记录视为序列数据,利用频繁模式挖掘的方法来挖掘工人的频繁时间实例。并每个工人在其可用时间内提出了两种空间分布预测策略:

1. 基于时空的循环神经网络(ST-RNN)的位置预测;

2. 基于混合模型的路线预测;

由于可以将空间任务视为空间点事件,因此作者设计了路径约束DeepWalk模型来获取每个时间点下未来任务的数量,然后采用核密度估计方法来预测未来时间实例中任务的位置分布。

  • 右边是任务分配组件

在工人时间和行进路线的限制下,将任务分配给合适的工人来最大化的任务分配数。首先为每个工人计算MaxVTS,因为在枚举MaxVTS的所有可能组合时,必须解决巨大搜索空间中的计算问题,因此作者提出了贪心任务分配和最优任务分配算法。

Worker Prediction

----------------------------------------------------------------------------------------------------

工人可用时间预测

工人的任务执行历史对应的时间戳其实就是工人的可用时间,所以通过使用频繁模式挖掘算法可以从工人的任务执行历史中挖掘工人更可能执行任务的频繁时间实例,从而预测工人未来的可用时间;

频繁模式:在超市的销售记录里,常常会发现牛奶和面包、啤酒和尿布等经常被一起购买的,所以牛奶和面包可以看成是一个频繁模式。比较经典的频繁模式挖掘算法有FP树,它是根据给定的原始数据,构建FP树,然后根据FP树来获取频繁模式。

FP树算法:FP树算法了解

工人起始位置预测

关于位置的预测,作者受考虑时空信息的循环神经网络模型 ST-RNN 的启发。

这个ST-RNN模型最初提出是用于发现POI之间的顺序相关性,预测下一个将要去的兴趣地,现在把它用于预测每个未来工人在其可用时间开始时的位置。

RNN是一类用于处理序列数据的神经网络。基础的神经网络包含输入层、隐层和输出层,通过激活函数控制输出,层与层之间通过权值连接,训练“学“到的东西就蕴含在“权值“中。 RNN与基础神经网络最大的不同之处就是可以将上一个输出结果以信息方式储存在隐藏层中。ST-RNN基于RNN,融入时间和地理信息。

 

这个模型的输入层是工人w在ti时访问的位置的向量;隐藏层是关键组成部分,可以计算工人w在时间戳t时的向量表示;最后通过计算输出层中工人和位置的内积来得出预测工人的起始位置;

同时模型中涉及到的参数是使用时间反向传播算法来学习的,这个时间反向传播算法是常用的训练RNN的方法,中心思想和BP算法相同,就是沿着需要优化的参数的负梯度方向不断寻找更优的点直至收敛。(梯度下降法)

工人行进路线预测

基于GPS对工人过去在道路网中的出行的观测来预测工人的潜在路线

1.通过基于特征点的道路拐角提取(CP-RCE)方法从大规模历史轨迹中提取道路拐角,基于这些道路拐角的轨迹映射方法表示预测的预测值,生成以道路拐角为中心的路线

2.采用MDL-DBSCAN算法,通过聚类检测在历史轨迹汇总频繁出现的道路拐角

3.采用模式匹配方法:前缀投影的模式挖掘( PrefixSpan ),从历史轨迹中发现隐藏的移动频繁模式

4.路线预测过程中,模式匹配方法用于根据发现的频繁移动模式来预测未来路线,当遇到无模式匹配时,ST-RNN模型可用于预测下一个行驶中的道路拐角

5.使用工人的最新速度作为其未来的速度来计算其在可用时间内的行驶距离

PrefixSpan算法:PrefixSpan算法了解

Task Prediction

----------------------------------------------------------------------------------------------------

思路

空间任务是在特定位置被完成的,因此将这些任务视为空间点事件。通过将研究区域划分为不相交且均匀的网格进行预测,首先估计在将来的时间实例中可能落入每个网格单元中的潜在任务(具有不同类型)的数量,之后采用平面KDE方法来计算空间任务的密度,进而预测任务发生的位置。

  • 网格内任务数量的预测:构建网络,采用改进的DeepWalk模型:PC-DeepWalk,学习网络节点表示,进而计算任务数量
  • 网格内任务分布的预测:根据历史数据采用KDE平面核密度估计,通过对在可能位置上出现的概率排序,选取前k个位置作为最终的预测位置

KDE:平面核密度估计已被广泛用于空间点事件分析和检测,通过计算事件强度作为在空间上生成点事件的密度估计

DeepWalk:从网络的被截断的随机游走中学习节点的潜在表示(向量)DeepWalk算法了解

任务数量预测

基于划分好的网格,要构建一个网络G,其中网络的节点有两种,一种是基于时间单元的TC节点,它代表在时间戳tj下的单元格Ci;另一种是基于任务的节点ST,它表示一种任务类型m;

网络的边同样有两类,一类是空间邻近边,这类边连接TC节点,对应的权值与两个单元格之间的空间距离成负相关;另一类是任务相关边,连接TC节点和ST节点,它的存在表示在时间戳tj,单元格Ci下有类型为m的任务发布;

因为节点和边属于多种类型,所以作者提出的基于空间任务的网络是一个异构信息网络(HIN). 因此考虑到异构信息网络的特性,在已有的相关研究的启发下,作者设计了三种类型的路径来捕获时空信息和任务相关信息。(这三种路径分别是空间路径、任务相关路径、按照时序的任务相关路径)然后提出了一种路径约束的DeepWalk(PC-DeepWalk)算法,就是按照这三种路径进行随机游走,得到长度为λ的节点序列,通过训练SkipGram模型将网络的原始节点表示为向量。

任务位置预测

Task Assignment

----------------------------------------------------------------------------------------------------

贪心任务分配

最优任务分配

计算每个工人的有效任务集的所有可能组合时,主要的挑战在于巨大的搜索空间,相对于工人的数量呈指数增长。

思路:首先构造一个工人的工作依赖依赖图。 通过在该图上采用图划分方法并以树形结构组织每个子图的工作集,原问题将分解为多个独立的子问题。 然后设计了深度优先搜索算法以找到最佳任务分配。

Experiment

----------------------------------------------------------------------------------------------------

数据集

  • Twitter-Foursquare(TF)

从Twitter带有类别信息的签到数据,2010年9月-2011年1月,Lon ∈[40.231, 41.231], Lat∈[-74.435, -73.435],包括20046位用户的29046签到数据

假设用户是SC系统中的工人,对于每个签到地点,分别使用其位置和一天中最早的签到时间作为任务的位置和发布时间。因此,签到的类别被视为任务的类别,并且在现场签到等同于接受任务。

  • gMission(GM)

基于研究的通用空间众包平台,包括532个工人和713个任务,其中每个工人都有自己的位置,到达时间和最后期限,每个任务都与一个位置,发布时间,截止日期和用于对任务进行分类的任务描述相关联。由于gMission系统中缺少有关工人/任务的历史数据,因此,我们生成的工人/任务在历史记录,对于每个工人/任务,将其位置设置为中心,以高斯分布随机产生其历史位置,该位置的出现时间每天都均匀分布。

1. 通过将工人的日常工作地点输入“城市机动性模拟”中,生成GPS轨迹,模拟每个工人每天的轨迹;

2. 70%的工人/任务位置数据进行训练,20%进行测试,其余10%作为验证集;

结果

Conclusion

----------------------------------------------------------------------------------------------------

  1. 数据驱动的预测性空间任务分配(DPSTA)框架
  2. 两种新颖的策略来根据工人的出行历史预测他们的未来位置和路线
  3. 一种有效的图嵌入机制来估计任务的时空分布
  4. 贪心和最优的任务分配算法

ICDE2020|Predictive Task Assignment in Spatial Crowdsourcing: A Data-driven Approach相关推荐

  1. ICDE-2020 论文简析:空间众包中的预测任务分配 : 一种数据驱动的方法 Predictive Task Assignment in Spatial Crowdsourcing

    ICDE-2020 论文简析:空间众包中的预测任务分配:一种数据驱动的方法 Predictive Task Assignment in Spatial Crowdsourcing: A Data-dr ...

  2. ICDE-2020 论文简析:依赖感知空间众包中的任务分配 - Task Allocation in Dependency-aware Spatial Crowdsourcing

    ICDE-2020 论文简析:依赖感知空间众包中的任务分配 - Task Allocation in Dependency-aware Spatial Crowdsourcing 研究背景 研究目标 ...

  3. ICDE2020论文简析:空间众包实时交叉在线匹配 - Real Time Cross Online Matching in Spatial Crowdsourcing

    ICDE2020论文简析:空间众包实时交叉在线匹配 - Real Time Cross Online Matching in Spatial Crowdsourcing 研究现状 作者贡献 概念定义 ...

  4. 第二章-空间众包(spatial crowdsourcing)概述

    1.什么是空间众包? 空间众包,Spatial Crowd-Sourcing,其流程是:Requester将自己的的任务及其任务附带的信息提交到众包平台(platform),平台将一组与位置相关的任务 ...

  5. 无人机任务分配 matlab,Multi-UAV Task Assignment Benchmark

    Multi-UAV Task Assignment Benchmark 多无人机任务分配算法测试基准 Introduction A benchmark for multi-UAV task assig ...

  6. 【DS实践 | Coursera】Assignment 2 | Applied Plotting, Charting Data Representation in Python

    文章目录 一.问题分析 1.1 问题描述 1.2 问题分析 二.具体代码及注释 2.1 代码 2.2 绘图结果 一.问题分析 1.1 问题描述 Before working on this assig ...

  7. 【DS实践 | Coursera】Assignment 3 | Applied Plotting, Charting Data Representation in Python

    文章目录 一.问题分析 1.1 问题描述 1.2 问题分析 二.具体代码及注释 2.1 代码及注释 2.2 绘图结果 一.问题分析 1.1 问题描述 In this assignment you mu ...

  8. AAAI-19录用论文清单

    AAAI-19于1月27日在夏威夷召开,今年是33届会议. 会议录用论文清单, workshop16个,tutorials24个. 标题的词云分析: 作者单位词云(按作者人数计算/一篇文章可能有多个作 ...

  9. 众包综述——关于众包的一些研究方向

    文章目录 准备 1. 结果汇聚(真值推理) 2. 激励机制 3. 空间众包(移动众包) 4. 任务标价 5. 任务分解与分配 6. 众包与社交网络 7. 质量控制 8. 众包安全与隐私保护 9. 众包 ...

最新文章

  1. CES Asia专题|微鹅展示无线充电,智能手机的无线充电时代何时来临?
  2. 《网络攻防实践》第八周作业
  3. Android 图像合成技术Xformodes图片剪裁
  4. 字符串去掉空格 trim()方法
  5. 有助于建立使用者对套件的信任 GitHub释出管理服务
  6. vim编写python_用vim写python代码
  7. LeetCode 1863. 找出所有子集的异或总和再求和(DFS)
  8. “两弹一星”元勋年轻时的考卷,连标点符号都找不到错
  9. 教你一招用 Python Turtle 库画出“精美碎花小清新风格树”,速取代码! | 原力计划...
  10. @程序员,你真得了解每天打交道的字节吗?
  11. luogu_P3345[zjoi2015]幻想乡战略游戏
  12. html全局事件,HTML5全局属性和事件
  13. html4音频插件,js音频插件audio.js
  14. 【元胞自动机】基于matlab元胞自动机模拟SEIR传播模型【含Matlab源码 2156期】
  15. 用超级鹰来识别B站图片验证
  16. DTOI 10.25 测试 T3 雪人
  17. 亚裔在澳大利亚难登事业巅峰?会说英语是关键
  18. Java中IO流体系
  19. 微耕门禁显示通信不上服务器,微耕中性门禁控制器通讯不上是怎么回事?主要有什么注意事项...
  20. 轻松解决win10不能联网问题

热门文章

  1. 读书笔记:《经验的疆界》
  2. Hololens远程视频通话与AR标注
  3. 如何聪明的提问(职场的必踩坑)
  4. 猫影视配置2022.06.04
  5. 论相对性原理2-洛仑兹坐标变换的数学原理
  6. windows启动引导管理
  7. SSD-2(代码部分介绍)
  8. 工业相机的速度(帧频/行频)
  9. 从书中学爬虫靠谱吗?深夜读《爬虫实战 从数据到产品》
  10. Java:获取当前日期当前季度、上一季度开始结束日期时间