项目实训记录系列博客

一马当先,争做国家栋梁。

博客说明

本博客初衷是用于学校项目实训知识梳理、工作内容、收获感悟的记录。
若能在您的学习之路上有所帮助,不胜荣幸。但若需转载,也请注明出处。

博客包含以下内容(也是开篇提到的),但不意味着每一篇都会囊括所有;同时,也并非意味着博客的目录结构就是如此。每篇博客内容请看后文中具体的目录。
知识梳理:为了完成目标算法,将会广泛地查阅有关文献资料。将所学知识、资料进行整理。会加入个人理解,一起进行分享。
工作内容:作为项目参与者,在整个项目中所担任的角色、完成的任务。包括个人任务,团队沟通与合作。
收获感悟:您可以简单理解为鸡汤。不过,不同于空洞的话语,在这里所记录的感悟和总结都是结合自身实际、结合项目实际的,相信您能看到博主是怎样的人,也愿您能从中获得启发和前进的动力。

项目实训系列博客目录

1-关键词提取-任务理解&工作分配
2-关键词提取-代码运行云平台colab的使用
3-关键词提取-论文研读-RaKUn算法(1)
4-关键词提取-论文研读-RaKUn算法(2)
5-关键词提取-论文研读-betweenness centrality相关算法(1)
6-关键词提取-论文研读-betweenness centrality相关算法(2)
7-关键词提取-论文研读-load centrality的合理性探讨
8-在IDEA或Pycharm中解决编码问题
9-python:sort()和sorted()使用及对比
10-python:set的使用
11-python:most_common()函数
12-python:enumerate()函数
13-networkx的基础使用
14-收尾工作-答辩内容整理
15-收尾工作-组织协调


本博客目录

  • 项目实训记录系列博客
    • 博客说明
    • 项目实训系列博客目录
    • 补充研究
      • edge lengths
      • edge weights/multiplicities

补充研究

多重边和边的权重问题,是本文一开始提到的”伏笔“。本质上是对于不同种类的图的研究,包括有边长的图、有权重的图和多边图三种。个人感觉泛用性会很好,所以在这里多研究了一下论文的这一部分变种算法。

这里“有边长(edge length)的图”就是我们常说的加权图,边的长度不再是1,边加权;“有权重(weight)的图”并非是通常意义的边长权重,而是运算的时候需要考虑到权重问题,也就是在网络中的重要性,在这里用路径的值(path’s edge values)相乘的方式表达。多边图(multigraph)就是允许自环和两点之间有多条边,这跟传统的定义说法一致。

edge lengths

值(value), 也就是边长(path length), 这个变种算法很像是单源最短路的算法,在基础算法上多考虑的是边的长度不再是1,而是有很多赋值的情况,还是很好理解的。

edge weights/multiplicities

首先看权重的问题,算法中作为因子跟σ[v]直接相乘,这一点也很好理解。关键是为何多边图也可以跟权重问题放在一起呢?在反复阅读论文中的定义描述之后我终于弄清楚了。

假设现在有一个简单图(simple graph),也就是之前一直在用的图模型。对于任意e=(a,b)∈E,选择从a到b的这条边,将其三倍化,得到三条跟原来一样的边。现在问题情况并不是简单的三边加和,因为三条等长的边都是从a到b的可行路径,并且如果ab的前后还有路径连接其他的顶点,最终所有包含a到b的路径都会三倍化。对于a,若原本是σ[a],三倍化之后,用数学运算来表达就是3σ[a].类比于权重的公式就令人恍然大悟了:这里边的倍数,正是此处边的权重。数学公式上可以合并,但是实际意义可以这样理解吗?也可以。若将多边图上每条边的倍数看做是这条边的权重,就可以将多边图转化为一个简单有权重图。

关键词提取-论文研读-betweenness centrality相关算法(2)相关推荐

  1. 项目实训-关键词提取-论文研读-load centrality的合理性探讨

    项目实训记录系列博客 一马当先,争做国家栋梁. 博客说明 本博客初衷是用于学校项目实训知识梳理.工作内容.收获感悟的记录. 若能在您的学习之路上有所帮助,不胜荣幸.但若需转载,也请注明出处. 博客包含 ...

  2. 论文研读-多因子进化算法中的自适应知识迁移MFEA-AKT

    论文研读-多因子进化算法中的自适应知识迁移MFEA-AKT Toward Adaptive Knowledge Transfer in Multifactorial Evolutionary Comp ...

  3. 人工智能综述性论文_人工智能论文研读:深度学习算法与架构综述(包含详细统计表)...

    综述一共26页 总体内容概括 本文综述了几种提高训练精度和缩短训练时间的优化方法.深入研究了最近深度网络中使用的训练算法背后的数学原理.将描述当前的缺点.增强和实现.本文还介绍了深度卷积网络.深度残差 ...

  4. 人工智能论文研读:深度学习算法与架构综述(包含详细统计表)

    https://www.toutiao.com/a6687884910335623691/ 总体内容概括 本文综述了几种提高训练精度和缩短训练时间的优化方法.深入研究了最近深度网络中使用的训练算法背后 ...

  5. 项目实训-关键词提取-任务理解工作分配

    项目实训记录系列博客 一马当先,争做国家栋梁. 博客说明 本博客初衷是用于学校项目实训知识梳理.工作内容.收获感悟的记录. 若能在您的学习之路上有所帮助,不胜荣幸.但若需转载,也请注明出处. 博客包含 ...

  6. NLP算法-关键词提取之Gensim算法库

    Gensim工具包 引入 Gensim简介 一些基础概念 Gensim的使用方式 1. 训练语料的预处理 2.主题向量的变换 LDA模型 demo LSA/LSI 算法 LSA/LSI算法原理 LSA ...

  7. 自然语言处理NLP中文分词,词性标注,关键词提取和文本摘要

    NLP相关工具包的介绍 1.1 jieba "结巴"中文分词,理念是做最好的 Python 中文分词组件. 支持三种分词模式: (1)精确模式,试图将句子最精确地切开,适合文本分析 ...

  8. 区块链相关论文研读7:通过分片(Sharding)扩展区块链

    本文首发在https://zhuanlan.zhihu.com/p/89933683 这篇论文发表在顶会SIGMOD 2019上,题目为<Towards Scaling Blockchain S ...

  9. 文本处理算法_关键词提取和文本摘要算法TextRank详解及实战

    关键词提取和文本摘要算法TextRank详解及实战 写在前面 最近一直没有更新文章,实在惭愧.伴随着小老弟的职业方向由风控转向了NLP,后面的文章也会集中在NLP领域,希望大家能够继续支持~ 导读 本 ...

最新文章

  1. cmd orcal 中文乱码
  2. 前嗅ForeSpider中数据采集界面介绍
  3. 埃尔米特插值(等距节点,只用一个点的导数构造n+1阶Hermite多项式)Python实现
  4. 3.2 选择最可能的句子-深度学习第五课《序列模型》-Stanford吴恩达教授
  5. Training little cats
  6. VTK:可视化算法之TensorAxes
  7. sql中union和union all的区别
  8. 计算机数学基础模拟试题,计算机数学基础》模拟考试试题.doc
  9. 傲游浏览器新浪微博插件v2发布
  10. TCP/IP数据包结构详解
  11. 深入理解ThreadLocal变量的功能和使用
  12. 在java中如何输入角度_在Java中以特定角度绘制一条线
  13. docker+redis 持久化配置(AOF)
  14. http请求webservice接口
  15. 随机森林+python代码实现
  16. 脱壳之aspack压缩壳
  17. 联想笔记本电脑重装系统按F几
  18. 运用limma对基因进行差异分析
  19. Java简易实现凯撒密码——英文句子加密
  20. starUML4.0导出的图片去除水印的方法

热门文章

  1. vue 日期时间选择器_Vue日期时间选择器
  2. github 这个网站到底有什么用?
  3. Linux下kafka安装
  4. 微型计算机硬故障举例,计算机信息系统维护与维修
  5. rock64 linux,挑战树莓派:PINE64 发布 Rock64 Media Board Computer 开发者主板
  6. 如何下载Onon Office
  7. Qt 实现的时间轴 Timeline 用于视频非线形编辑工具
  8. vim最新版本安装 安装vim9
  9. 判断是ios终端还是安卓终端
  10. JAVA结合AE(Adobe After Effects)实现类似于传影(视频DIY)的核心功能,程序也可以是艺术。