点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入!

影响力最大化是指在社交网络中选择少量种子节点,以最大限度地扩大这些种子的影响力,这在过去二十年中已经得到了广泛的研究。在规范环境中,整个社会网络及其扩散参数被作为输入。在本文中,我们考虑更现实的采样设置,其中网络是未知的,并且我们只有一组被动观察级联,记录在每个扩散步骤的激活节点集。我们研究了这些级联样本(IMS)的影响最大化任务,并在种子集分布的温和条件下给出了该任务的常数近似算法。为了达到优化目标,我们还提出了一种新的网络推理方法,即从级联数据中学习扩散参数和网络结构。与以前的解决方案相比,我们的网络推理算法需要较弱的假设,并且不依赖于最大似然估计和凸规划。我们的IMS算法通过允许一个恒定的近似比(即使在扩散参数难以学习时)来增强学习和优化方法,并且我们不需要任何与网络结构或扩散参数相关的假设。

本期AI TIME PhD直播间我们邀请到中科院博士生——张智杰,为我们带来报告分享《网络推断与数据驱动的影响力最大化问题》。

张智杰:

中科院计算所五年级博士生,导师为张家琳研究员。研究兴趣包括组合优化、近似算法、机器学习。最近的研究课题包括次膜优化与影响力最大化。

01

 背   景 

组合优化领域包含许多非常有趣的问题,比如最大覆盖、集合覆盖、最小/最大割、MST、斯坦纳树,可满足性,背包,箱子包装等。这些问题大都可以定义为下图中统一的形式:

这里我们举一个最大覆盖问题的例子,如下图所示,输入一个二部图,其目标函数是寻找k个左边的点,使得这k个点的邻居尽可能地多。这个目标函数是一个覆盖函数,它在集合S上的取值是其邻居的个数,符合上面定义了组合优化的目标函数形式。

从传统上来讲,目标函数f是已知的,而在大数据时代,目标函数往往是未知的,必须从被动观测的数据中学习。如何学习目标函数也是需要去研究的一个问题,并且有了一整套理论来刻画学习效果的好坏,如下面的两项工作:

但是,我们可以根据用来学习目标函数的数据来优化目标函数吗?下面这项工作提出了一个样本优化模型——OPS,该算法的输入不是目标函数f,而是样本以及其对应的函数值。然后我们要求根据这些样本找到目标函数近似最优解,因为是近似解,因此这个解是常数近似的。在这个工作中,算法只能通过样本被动地知道f(S)的解。

有了上面的理论,一个很自然的方法是先学习目标函数的替代函数,然后去优化这个替代函数。但是这种方法没有理论依据,我们在研究下面两项工作发现,无论样本数据的分布如何,最大覆盖问题无法得到常数近似解。而前人工作已经证明覆盖函数是可学习的,所以说明给定样本数据的函数是可学习的并不意味着是可优化的。

那我们如何避开OPS问题下这种不可近似的结果呢?目前已经有了一些方法去尝试解决这种问题。

02

 OPSS 算法 

我们提出了Optimization from structured samples(OPSS)方法,假设数据是带结构的,期望从数据中获取更多的信息,从结构化数据中进行优化。通过OPSS,我们希望能得到一个全局最优解。

看下面左图覆盖函数的例子,OPS样本是以样本和函数值作为函数对,而OPSS方法是以样本和其邻居作为函数对。因此在我们的模型中,我们不仅能看到函数值、还能看到覆盖的邻居点是哪些,因此这个样本点是带结构的,给我们的信息更强一些。

另外一个例子是右图的影响力函数,它其实是概率图版本的覆盖函数。影响力函数定义在一个有向图上,这个有向图称为社交网络。图中黄色点是种子集合,表示在初始时携带一些信息,每个点都会以边上定义的概率激活自己的邻居,激活意味着将自己节点的信息传给邻居。影响力函数的目标函数定义为给定初始种子节点,最终能激活的节点的期望个数。影响力最大化问题是要求选取最多k个节点,去最大化影响力。这里相比OPS样本只给出样本和影响力函数值,我们的结构化样本会把传播过程信息给出来,同样获取了更多更强的信息。

下面是OPSS方法对于不同优化问题的结构化样本定义,

我们所要解决的问题是给定合理的种子集合D,去解决最大覆盖问题和影响力最大化问题。集合D需要满足的假设如下:

03

 OPSS算法结果 

对于最大覆盖问题的采样方法,OPSS算法的结果如下。在样本分布满足Assumption*下,如果在函数已知时有一个α近似算法,那在OPSS采样模型下就会有一个α/2的近似算法。

下面是我们的方法对于影响力最大化问题的结果。

论文链接:

https://arxiv.org/pdf/2106.03403.pdf

点击“阅读原文”,即可观看本场回放

整理:AI Timer

审核:张智杰

直播预告

2月17日 - 3月16日  NeurlPS  专场

近百位NeurlPS一作来分享啦!

记得关注直播信息哦!

往期精彩文章推荐

记得关注我们呀!每天都有新知识!

关于AI TIME

2019年,清华大学人工智能研究院院长张钹院士、唐杰教授和李涓子教授等人联合发起“AI TIME science debate”,希望用辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

AI TIME是清华大学计算机系一群关注人工智能发展,并有思想情怀的青年学者创办的圈子。AI TIME旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法、场景、应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家与爱好者,打造成为全球AI交流与知识分享的聚集地。

我知道你

在看

~

点击 阅读原文 查看回放!

干货!网络推断与数据驱动的影响力最大化问题相关推荐

  1. 【转】如何从计算视角研究网络传播影响力最大化问题?

    电商中对社交网络的两个应用方向,基于社交网络做推荐和基于社交网络做裂变广告.有意思的是做电商的往往做不起社交,电商和社交数据很难打通,而不管做推荐还是做广告,所有的建模和分析都是基于用户行为数据的,不 ...

  2. 社交网络中基于位置的影响力最大化 CIKM2015 译文

    社交网络中基于位置的影响力最大化 摘要 这篇文章的目的是通过研究在LBSN平台中基于位置的影响最大化来实现O2O模式上的产品推广.随着O2O环境下存在的消费行为,传统的线上影响力扩散模型不能准确描述产 ...

  3. 一种有效的基于路径的社交网络影响力最大化方法【论文阅读】

    文章目录 一.论文的亮点 二.HIPA算法具体过程 三.论文的优缺点 四.自己的收获点 五.未来可能的突破点 [摘要]本文是关于影响力最大化相关内容:内容的是关于论文An efficient path ...

  4. Information Sciences 2022 | 利用图嵌入和图神经网络实现社交网络中的影响力最大化

    目录 前言 1. 影响力最大化 2. SGNN 2.1 标签生成 2.2 struc2vec 2.3 GNN特征处理 2.4 回归预测 2.5 整体框架 3. 实验 3.1 数据集 3.2 评价指标 ...

  5. scGEMA:基于单细胞多组学增强子的基因调控网络推断

    本文介绍由德国RWTH亚琛大学医学院的Ivan G Costa通讯发表在 bioRxiv 的研究成果:为了利用单细胞多组学数据定量表征基因调控,作者提出了scGEMA模型,一种基于单细胞多组学增强子的 ...

  6. Influence Maximization影响力最大化

    在现代社会,信息是最重要的.如果目前我们有了一份信息,而我们想要 最大化地传播信息,则我们得考虑如何选择切入点,选择哪些人作为初始传播 的节点,可以使全网受到信息的影响最大. 一个公司想向市场推广一个 ...

  7. 影响力最大化,传播模型

    基本传播模型 IC LT IM算法分类 贪心算法 KK(2003) CELF(2007)https://www.cnblogs.com/aaronhoo/p/6548760.html DegreeDi ...

  8. 干货 | 因果推断在项目价值评估中的应用

    作者简介 野生梨,携程算法工程师,关注因果推断在实际工业项目上的探索和应用. 一.背景介绍 我们的日常生活中充斥着各种需要推断原因和结果的问题,比如,吸烟是否会导致肺癌,大学教育是否能够提高收入水平? ...

  9. 会议笔记_一种带时间约束的影响力最大化算法

    引入时间因素 节点或者人在不同时间影响其他节点的属性不同 两个创新点: 最早激活时间:超过时间约束不会被激活 累计传播延时:激活一个节点需要多少时间 种子选择方法(三步): 第一步·设计包含时间约束的 ...

最新文章

  1. ubuntu安装vasp_VASP 软件在ubuntu10.04下的安装过程
  2. 手机无法服务器获取信息,荒野行动获取服务器信息一直不动怎么办 获取服务器信息为0解决方法...
  3. 新物种爆炸:认知升级时代的新商业思维
  4. MBTI职业性格测试(Psytopic特别版)
  5. 在excel文件上设置下拉选项
  6. 2019抖音最近火的歌曲精选1000多首无损音乐
  7. 微信小程序操作教程(个人用户注册)
  8. JavaScript 解析json例子
  9. 如何在 R 中读取 Zip 文件
  10. 亚马逊云科技 BuildOn 第三季 【基于 Serverless 构建零售创新应用】过程介绍及个人思考及总结
  11. Discuz! X2如何禁止帖子发外链和签名链接
  12. html页面滚动 锚点,页面实现锚点滚动的滑动效果
  13. 速学堂 JAVA 300集 第四章练习
  14. 流媒体协议HLS解析
  15. 远程PLC监控调试,PLC通用中转服务器,多客户端tcp中转 服务器源代码,socket多线程并发通讯
  16. SAP-PP 工艺路线的作用
  17. LabVIEW自适应屏幕分辨率缩放
  18. 爪哇——初识Java
  19. 灵活使用segue导航
  20. 关闭Chrome 安全策略

热门文章

  1. 大数据分析师高级证书_数据分析师资格证书好考吗_大数据分析师认证
  2. 发现ramnit样本一枚
  3. 3款电脑必装软件,功能强大且免费,打死也舍不得卸载
  4. macos各版本汇总
  5. C#通用类库整理--字符串处理类
  6. 国庆弯道超车正当时,推荐一个免费的刷题网站。。。Python小伙伴可以看过来了
  7. 埃拉托色尼筛选法------筛选质数
  8. 查看自己电脑的主板支持多大的内存
  9. Android ijkplayer播放rtsp直播流
  10. 一篇工作调动时的旧文