社交影响力可以通过用户之间的社交活动体现出来,表现为用户的行为和思想等受他人影响发生改变的现象。在线社交网络影响力分析主要涉及三方面的内容:1.影响力自身的识别,如何从繁杂的因素中鉴别影响力和相关要素的区别与联系,就成为首要问题。2.社交影响力的度量,如何设计和选择既具有一定普适性又能充分发觉社交网络特性的度量方法,是该领域的核心问题之一。3.社交影响力的动态传播。

社交影响力的相关因素包括影响力、同质性、互惠性等因素。社交影响力只有通过人们的交互活动才能体现出来,目前大部分研究都针对社交网络结构及其上的交互信息和用户行为特征进行量化和分析,因此可以把能对信息传播过程或他人行为产生影响的个体视为具有社交影响力。同质性指具有相似特征的个体悬选择彼此作为朋友的倾向。仅从改练上就可以发现同质性和影响力具有较强的关联,而对这两者的鉴别想来是社交影响力分析和建模的关键问题之一,二者最大的区别体现在动态效应上,即影响力需要更长时间的交互活动才能发挥线性效果。其中Aral等人设计了动态匹配的取样估计方法,在动态网络上对影响力和同质性进行了鉴别。互惠性指用户在社交过程中处于礼貌或习惯等原因对其它用户的行为基于相应的回应的现象。由于用户行为的结果相同而原因迥异,互惠性、影响力和同质性的区分依然是影响力分析的热点问题。目前的工作主要集中在三者的差异性分析上,对它们的内在联系及其在演化过程中的作用规律所知甚少。社交网络的外部因素也会对影响力和信息传播产生作用,Myers等人利用曝光曲线对社交网络上的外部影响力进行了建模,认为随机出现在节点上,以“跳跃”形式分布的信息受外部影响力驱动。

社交网络中影响力度量的主要任务是分析和预测用户社交影响力的大小和演化规律,为基于社交影响力的研究和用那个用提供技术支持和理论依据,常用的影响力度量方法大致可以划分为基于网络拓扑结构、基于用户行为和基于交互信息的度量等类型。

基于网络拓扑结构的度量分为节点的度量和连接的度量。

节点的度量
1.基于社交网络上最短路径的方法:紧密中心度和介数中心度,前者关心距离与传播速度,后者关心位置重要性和影响力。
2.利用随机游走特征度量影响力:特征向量中心度、Katz中心度和PageRand度量。
3.局部聚集系数。

节点的度基本上就表示某节点和邻居节点之间的关联程度,而且基于节点的度的方法表达的意义直观,计算代价小,但基于度的方法智能反映用户及其邻居之间的联系,是对用户局部影响力的度量,无法很好地衡量用户在整个社交网络中的影响力。相比基于度的方法,基于最短路径的方法能够从社交网络整体对用户影响力进行度量,但是它的计算复杂度比前者高,而且用户的影响力通过最短路径发挥作用是一种理想状态,在显示环境中很难实现。

连接的度量是对连个用户相互之间影响程度的度量。
1.两个节点的邻居重叠程度越高,这两个节点之间的关系越紧密,它们之间的影响力越强烈。利用Jaccard相似度、Overlap相似度、Cosine相似度计算。
2.边介数

在线社交网络中的用户行为有发布信息、购买商品、话题评论、转发信息、建立好友关系等。基于用户行为的影响力度量方法有LIM、Goyal等,如下表

其中连续模型能更细致地刻画影响力的传播过程,相比离散模型具有更强的预测能力,但计算代价过高,而离散模型则可以比较搞笑地用各种启发式方法进行求解;无参模型对社交网络的约束较少,但描述真实环境的能力有限,适用于理论分析,而参数化模型刻画真实世界的能力较强,但其预测精度有赖于模型中参数的具体取值。

基于用户交互信息的度量方法包括基于交互信息内容的度量和基于话题信息的度量:

基于交互信息内容的度量:由于用户的社交影响力能够促进信息的传播,所以分析在线社交网络中信息内容的传播范围和时间,能够比较准确地反映用户的影响力。Bakshy等人使用消息扩散产生的树结构计算和预测用户的影响力。除了信息传播范围,用户发布的信息在社交网络中流传的时间长短可以反映用户影响力的深远程度,也是衡量社交影响力的重要指标。Romero等人同时分析了Twitter上的流行标签在传播范围和时间上的特点,发现不同标签的传播存在明显区别。他们把标签曝光次数和用户采用该标签的概率之间的关系称为标签的粘着性。其它研究成果表明,用户自身的属性(如活跃度专注度等)也能对信息焕波过程和影响力的计算结构产生影响。

上述工作主要从用户交互信息的传播范围和时间等因素出发,从广度和深度两方面对用户影响力进行了定性分析,基于交互信息的度量方法引发出了另一个重要问题:由于信息本身具有内在的传播属性,那么交互信息在社交网络中的传播,其自身所起作用和用户影响力的作用各占几何,应如何区分和度量?

基于话题的度量:

1.将影响力分为隐形影响力(直接从话题内容和用户对话题的参与度构建用户和话题之间的联系)和显性影响力(用户之间通过好友申请或被关注等行为建立的社交网络拓扑结构作为模型输入)。

2.Tang等人研究了用户间基于话题的影响力问题定义了一种话题因子图TFG。

3.Cui等人研究了信息条目与社交影响力的关系并据此设计了预测影响力的方法最后用投影梯度矩阵因子分解法进行求解。

4.Weng等人使用两阶段策略:首先用文本分析的方法提取用户感兴趣的话题,从而建立起话题之间的关系;再使用TwitterRank算法分析了由话题相似度和网络结构两部分构成的用户影响力。这种策略能够改善话题敏感类算法的功能和预测精度。

目前的在线社交网络除了文本数据,还包含大量的图像声音等多媒体信息,在这种异质网络中进行建模是基于话题的影响力分析需要应付的新挑战;其次,隐性影响力能够揭示更为隐秘的社会关系,那么它和来自同一社交网络的显性影响力之间是互补关系抑或代替关系,如何量化它们之间的联系;再次,话题的改变会导致用户影响力在计算时产生变化,不同话题的传播过程也可能遵循不同的传播模型,但现实环境中用户的影响力具有相对稳定性,因此话题信息对在线社交网络中用户影响力的影响程度和方式,还有待深入研究和探索。

社交影响力本质上具有动态属性,既随着每个人的社会属性和言行变化也随着社交活动在社交网络中进行传播。因此,对影响力动态传播过程的分析和研究,对认识影响力的本质特性,理解社交网络的形成和演化等具有重要意义。

意见领袖指能在相应环境下对其他人产生影响的个体,意见领袖发掘方法大致分为基于网络结构的方法和基于以交互信息为主的方法。基于网络结构的方法模型简单计算效率高,能够处理大规模的社交网络,但是准确率相对较低,在真实网络环境中存在误判的可能性;基于交互信息的分析方法得到的结构客官准确,但是由于涉及到大量信息的预处理和内容相关性计算,难以适应规模交大的社交网络。结合两者有点,采用两阶段的选择策略提高算法的效率和准确度:先利用基于网络结构的方法筛选意见领袖的备选集合,然后再基于交互信息的方法选取真正的意见领袖。

影响力最大传播问题就是在社交网络中勋在最具有影响力的成员集合。Kempe和Kleinberg等人形式化表示了该问题,并总结出独立级联模型、线性阈值模型和两种模型的泛化模型,随后=采用离散优化方法对该问题进行了求解。

目前的影响力最大传播模型只考虑到最小初始用户集合的选取,并没有将激活用户的代价和时间计算在内。

声明:本文是阅读吴信东等人所著《在线社交网络影响力分析》论文之后撰写的总结,只供个人回顾使用。

在线社交网络影响力分析——总结相关推荐

  1. 《大数据》2015年第3期“研究”——社交网络影响力传播研究(下)

    社交网络影响力传播研究 陈卫 (微软亚洲研究院 北京 100080) 摘要:随着互联网和大数据的研究应用日益广泛,对社交网络影响力传播的研究成为数据挖掘和社交网络分析中的热点.从影响力传播模型.影响力 ...

  2. 《大数据》2015年第3期“研究”——社交网络影响力传播研究(上)

    社交网络影响力传播研究 陈卫 (微软亚洲研究院 北京 100080) 摘 要:随着互联网和大数据的研究应用日益广泛,对社交网络影响力传播的研究成为数据挖掘和社交网络分析中的热点.从影响力传播模型.影响 ...

  3. 基于持续同调的在线社交网络传播研究

    摘要 为了对在线社交网络进行全面的可视化分析,运用持续同调的计算方法对在线社交网络传播进行计算与分析.首先,将在线社交网络看作距离子空间,构造出该空间的不同子复形:然后,通过计算单纯复形的同调得到相应 ...

  4. [INFOCOM 2019] NeuralWalk:使用神经网络的在线社交网络中的信任评估

    NeuralWalk: Trust Assessment in Online Social Networks with Neural Networks | IEEE Conference Public ...

  5. 2021中青杯数学建模C题 在线教学的分析与研究

    在线教学的分析与研究 随着教育信息化的发展,在线教学与传统教学深度融合已成为必然趋势.多媒体课件的展示,或 MOOC 教学在高校中已经是非常常见的一种教学模式.在线教学智能教室的建设,正在不断颠覆传统 ...

  6. 2017云栖大会·杭州峰会:《在线用户行为分析:基于流式计算的数据处理及应用》之《数据可视化:构建实时动态运营数据分析大屏》篇...

    实验背景介绍 了解更多2017云栖大会·杭州峰会 TechInsight & Workshop. 本手册为云栖大会Workshop之<在线用户行为分析:基于流式计算的数据处理及应用> ...

  7. 大数据workshop:《在线用户行为分析:基于流式计算的数据处理及应用》之《实时数据分析:海量日志数据多维透视》篇...

    实验背景介绍 了解更多2017云栖大会·成都峰会 TechInsight & Workshop. 本手册为云栖大会Workshop之<在线用户行为分析:基于流式计算的数据处理及应用> ...

  8. java在线支付---09,10,11,12_在线支付_分析易宝支付网关的应答协议与处理代码,完成用于处理支付响应的Servlet的初步编写和调试,完成处理支付网关响应结果的Servlet,支付实现

    09_在线支付_分析易宝支付网关的应答协议与处理代码 创梦综合技术qq交流群:CreDream:251572072 对支付结果返回的数据加密生成md5-hmac public static boole ...

  9. 数学建模题目之在线教学的分析与研究

    目录 前言 题目描述 论文正文 组合教学方案的设计 摘要 一.问题重述 二.问题分析 三.模型假设 四.符号说明 五.模型建立 六.模型求解 七.模型评价 八.模型推广 九.参考文献 十.附件 小结 ...

最新文章

  1. 用子函数的方法求一个3*4的数组的转置数组
  2. 2010 PDC Party @深圳 免费技术交流活动公告
  3. [Mac技巧]Mac下显示隐藏文件
  4. 关闭服务器 找不到文件,在服务器上找不到文件时阻止代码崩溃的方法?
  5. 【转】Unity中的单位长度与像素之间的关系
  6. 备份数据 宝塔linux_宝塔面板旧版本升级教程汇总—升级宝塔面板
  7. python 读取txt文件没读到400行_400行Python代码实现文语处理助手(3) - 音频显示-嵌入式系统-与非网...
  8. win10文件同步到服务器失败,win10系统同步时间同步失败的解决方法
  9. Jquery操作DOM节点
  10. 练习作品,javascript模拟select
  11. 数据挖掘导论 第四章 重点习题解答
  12. android 删除系统服务,不ROOT卸载系统自带应用
  13. iPhone提示“软件更新失败”下载时出错怎么办?教你解决!
  14. mongodb 什么比mysql快_MongoDB为什么比mysql效率高
  15. 如何查看微信小程序的源码存放路径
  16. 图像工作回顾之三:极线匹配
  17. 7654劫持火狐解决办法
  18. 学习 React.js 需要了解的一些概念
  19. 使用git时代码被冲掉
  20. printf的计算和输出顺序

热门文章

  1. HDU 3068 2017 Multi-University Training Contest - Team 1 1006 Fuction: 循环节+最后一步
  2. 北风修仙笔记—2020年5月
  3. 我的世界服务器领地范围显示,我的世界领地圈地最大范围值设置方法介绍
  4. 不规则三角网(TIN)
  5. activiti 多实例任务
  6. 解决AS升级3.4 ERROR: All flavors must now belong to a named flavor dimension.Learn more at https://d.and
  7. 如何播放html文件类型,m3u8格式如何播放
  8. 磁盘被格式化了的文件恢复办法
  9. mysql 的字符集、比较规则和服务端、客户端的相关配置
  10. 加ing形式的单词有哪些_英语单词后面加ing的有哪四种情况?