深度学习核心技术精讲100篇(二)-图网络中的社群及社群发现算法
前言
本篇博文主要讲解Graph中社群的概念,然后介绍了一种简单的社群发现算法Louvain Algorithm,最后提供可重叠的社群发现,提出BigCLAM算法,用来识别节点从属关系。
01 Granovetter's theory
马克·格兰诺维特(Mark Granovetter,1943年10月20日-),美国社会学家,斯坦福大学教授。格兰诺维特是论文被引用最多的学者之一,根据 Web of Science 的数据,社会学论文被引数排名第一和第三的文章皆出自格兰诺维特之手。格兰诺维特因为对社会网络和经济社会学的研究而成名。其最著名成就是1974年提出的弱连接理论:与自己频繁接触的亲朋好友之间是一种“强连接”,通过这种连接获取到的往往是同质性的信息;但社会上更为广泛的是一种并不深入的人际关系,这种弱关系能够使个体获得通过强关系无法获取到的信息,从而在工作和事业上、在信息的扩散上起到决定作用。
格兰诺维特的研究认为如果两个人之间有共同的朋友,那他们成为朋友的可能性较大。
格兰诺维特的研究也在真实的数据上得到了验证:
1. Edge Overlap
简单解释下,Edge Overlap表示两个节点的邻居节点的重合程度(本身节点不在计算范围内),下图中右边部分右上图,N(i)=4,N(j)=4,去除本身i, j所以N(i)=4,N(
深度学习核心技术精讲100篇(二)-图网络中的社群及社群发现算法相关推荐
- 深度学习核心技术精讲100篇(五十四)-阿里文娱多模态视频分类算法中的特征改进
前言 类目体系是视频网站运营中的重要工具,也是推荐算法中提升冷启效果的重要手段.因此一套设计合理.准确率.覆盖率高的基础类目必不可少.阿里文娱类目体系建设团队与运营.审核一起建立的一二级类目体系,目前 ...
- 深度学习核心技术精讲100篇(二十八)-由浅入深概览机器学习优化算法
前言 学习算法一直以来是机器学习能根据数据学到知识的核心技术.而好的优化算法可以大大提高学习速度,加快算法的收敛速度和效果.本文从浅层模型到深度模型纵览监督学习中常用的优化算法,并指出了每一种优化算法 ...
- 深度学习核心技术精讲100篇(二十)-如何通过树模型实现梯度提升树(GBDT)+LR,随机森林(RandomForest) +LR
前言 在讲如何通过树模型做特征工程之前,首先让我们回顾一下一个机器学习(除去深度学习项目部分)项目的大致流程: 从业务场景中抽象出问题--分类问题,回归问题,还是聚类问题等, 接下来是数据获取,数据清 ...
- 深度学习核心技术精讲100篇(二十四)-简单谈下深度学习在中文分词中的应用
前言 随着深度学习的普及,有越来越多的研究应用新模型到中文分词上,让人直呼"手快有,手慢无".不过这些神经网络方法的真实水平如何?具体数值多少?以Sighan05中的PKU数据集为 ...
- 深度学习核心技术精讲100篇(五)-通过CTR预估对比深度学习模型(deepfm)梯度提升模型(catboost)
前言 CTR预估模型的特点: 毫无疑问这个任务的是个二分类任务,预测点击与否. CTR 预估的特征一般是 用户的日志特征和画像特征,包含类别特征和数值型特征两种. 此任务的评估指标是 AUC 得分 或 ...
- 深度学习核心技术精讲100篇(六)-keras 实战系列之知识蒸馏(Knowledge Distilling)
前言 深度学习在这两年的发展可谓是突飞猛进,为了提升模型性能,模型的参数量变得越来越多,模型自身也变得越来越大.在图像领域中基于Resnet的卷积神经网络模型,不断延伸着网络深度.而在自然语言处理领域 ...
- 深度学习核心技术精讲100篇(五十八)- 如何量化医学图像分割中的置信度?
前言 在过去的十年里,深度学习在一系列的应用中取得了巨大的成功.然而,为了验证和可解释性,我们不仅需要模型做出的预测,还需要知道它在做出预测时的置信度.这对于让医学影像学的临床医生接受它是非常重要的. ...
- 深度学习核心技术精讲100篇(三十五)-美团餐饮娱乐知识图谱——美团大脑揭秘
前言 " I'm sorry. I can't do that, Dave." 这是经典科幻电影<2001: A Space Odyssey>里HAL 9000机器人说 ...
- 深度学习核心技术精讲100篇(八)-keras 实战系列之深度学习中的多任务学习(Multi-task learning)
多任务学习(Multi-task learning)简介 多任务学习(Multi-task learning)是迁移学习(Transfer Learning)的一种,而迁移学习指的是将从源领域的知识( ...
最新文章
- 用ssh建立机器之间的信任机制
- camel_Apache Camel 2.14中的更多指标
- SkyWalking之高级玩法
- 安卓飞机大战(三) 弹出对话框
- 安卓手机用久了会卡顿,那么到底应该删掉手机里的哪些东西?
- 以拯救之因 强制恢复导致ORA-600 4000错误案例
- 牛客多校第九场H Cutting Bamboos(主席树 区间比k小的个数)题解
- 源码推荐-380套大型商业源码
- 微信推送封面尺寸_微信公众号文章封面图尺寸是多少?如何快速制作封面图?...
- python中shift函数_Pandas Shift函数的基础入门学习笔记
- 7-1 厘米换算英尺英寸 (15 分)Java
- 涉密计算机不得接入互联网等公共信息网络,在涉密场所使用的与国际互联网或者其他公共网络连接的计算机不得安装视频、音频等输入装置 - 作业在线问答...
- 优漫动游:带你了解UI图片比例技巧
- 已有123所大学将云创大数据人工智能免费直播课引入课堂!
- 计算机专业的,颜值很高是一种怎样的赶脚?
- 从violate到ConcurrentHashMap,我通过引导面试官,过了多场技术面试
- 小米笔记本电脑怎么使用U盘重装系统教学
- 让孩子进阶中产的唯一路径是编程?
- 复杂美公司Chain33区块链开发
- c语言如何写gba文件,GBA开发文档.doc
热门文章
- ios开发中,User Defined Runtime Attributes的应用
- Web数据库:信息化持续改善的最佳工具
- 第1部分:Ajax 入门简介
- Oracle 查看被锁的表语句
- 你真的明确知道它们的用法吗-从基础学起
- python Clipping input data to the valid range for imshow with RGB data解决方法
- oracle怎么查询成绩学号,oracle学习(简单查询)
- envi 文件 生成mat_JVM 内存分析工具 MAT 的深度讲解与实践——入门篇
- 一部分 数据 迁移_软件测试员12小时惊魂记:数据库迁移出大事故,如何测试?...
- linux内核时间second,闰秒(leap second)和linux/unix时间