1 外文文献关键词词频统计与可视化

在前一章节介绍知识单元完整频次统计中已经对关键词ID和DE字段进行词频统计。在回顾知识点的基础上,进一步进行可视化操作。可以新建一个ipynb文件,在导入功能库和文件后,为了查阅方便,只显示前两条记录。

直接把前面封装好的multi_element_count()函数复制粘贴过来,进行多元素字段的词频统计。

可将上述的频数统计结果,借用词云图可视化结果输出。首先需要将多元素字段频数统计的结果进行处理,形成绘制词云图的DataFrame数据格式,即第一列为标签字段中多元素的分类名称,第二列就为各类名称出现的频数统计。然后在将两列的数据合并,组成分类名称和频数一一对应的列表,即words变量(词云图的核心就是在于words变量的构造),如果有需求可以对图形的标题进行注解,比如这里将NAME赋值为ID,就是表明当前展示的词云图结果来自于ID字段。

ID字段的多元素词频统计结果词云可视化输出如下。元素的频数统计值越大,在词云图中的文字越大。通过滑动鼠标,放置在元素上,会自动显示对应的频数。

【科学文献计量】关键词的挖掘与可视化相关推荐

  1. 【科学文献计量】外文文献及中文文献关键词的挖掘与可视化

    1 关键词的挖掘与可视化 1.1 外文文献关键词词频统计与可视化 在前一章节介绍知识单元完整频次统计中已经对关键词ID和DE字段进行词频统计.在回顾知识点的基础上,进一步进行可视化操作.可以新建一个i ...

  2. 【科学文献计量】文本主题挖掘与可视化

    文本主题挖掘与可视化 1 文献记录的摘要主题标签提取,标签与关键词相似度计算 2 基于Sklearn库文本数据主题挖掘(NMP和LDA模型) 3 基于Gensim库文本数据主题挖掘与pyLDAvis的 ...

  3. 【科学文献计量】科学文献知识网络分析基础

    科学文献知识网络分析基础 1 知识网络分析基础 2 知识网络图构成 2.1 简单网络图绘制 2.2 完整网络图绘制 3 知识网络图中的术语 3.1 术语和统计量概念 3.2 获取术语信息实例 3.3 ...

  4. 【科学文献计量】中英文文献标题及摘要可读性指标分析与可视化

    中英文文献标题及摘要可读性指标分析与可视化 1 文本可读性指标原理以及计算流程 2 中文文献标题及摘要可读性指标分析与可视化 3 外文文献标题及摘要可读性指标分析与可视化 新建一个ipynb文件,导入 ...

  5. 【科学文献计量】中英文文献标题及摘要用词情感分析与可视化

    中英文文献标题及摘要用词情感分析与可视化 1 文本词典准备 2 文本数据用词情感分析步骤 3 针对英文文献数据进行用词情感分析 4 针对中文文献数据进行用词情感分析 5 中英文献文摘要句数统计分析 6 ...

  6. 【科学文献计量】将Endnote中的文献读入python中进行数据分析,并顺便将结果保存为Excel文件,并封装函数直接调用

    将Endnote中的文献读入python中进行数据分析,并顺便将结果保存为Excel文件 1 需求 2 功能完成 2.1 文献下载 2.2 文献导入到Endnote 2.3 文献导出 2.4 文件加载 ...

  7. 【科学文献计量】CSSCI数据采集,转化为python中的DataFrame格式,并存放到MySQL数据库

    CSSCI数据采集,转化为python中的DataFrame格式,并存放到MySQL数据库 1 CSSCI数据采集 2 数据加载到python中并进行DataFrame类型转化 3 将DataFram ...

  8. 【科学文献计量】知识单元文献时间序列分析

    知识单元文献时间序列分析 1 知识单元文献时间序列分析 1 知识单元文献时间序列分析 数据时间序列分析即是对文献按照某一时间区域划分,进行文献数量统计的过程.即是将知识单元的频次统计按照时间进行分组统 ...

  9. 【科学文献计量】networkx绘制网络图的基本属性,图形读写以及无向/有向图形绘制详解

    networkx绘制网络图基本属性,图形读写以及无向/有向图形绘制详解 1 Properties of graph 图像属性 1.1 案例 1.2 代码详解 2 Read and write grap ...

  10. 文献计量分析方法与工具

    当要研究某个领域时,需先对现有的相关研究进行调研.一般采用文献计量分析方法并进行可视化. 文献计量分析的主要思路有: 1.发表数量:文献年度发表数量.累计数量: 2.作者:作者发文数量.作者分布.作者 ...

最新文章

  1. 听说你有10年的工作经验?还是你把1个经验反复用了10年?
  2. 黑马程序员-异常介绍与处理
  3. mysql varchar最多可以存多少汉字_MySql的这几个坑你踩过没?真是防不胜防!
  4. 【Spring MVC学习】spring mvc入门示例
  5. 番石榴的对象类:Equals,HashCode和ToString
  6. Oracle报错:IO Error: Invalid number format for port number
  7. Maven 项目关于 plexus-utils:jar的错误解决
  8. MySQL字符串转日期
  9. linux 占用缓存前10_Linux安装软件时很多人会遇到这个报错,如何解决?
  10. 20162309《程序设计与数据结构》第二学期课程总结
  11. base64 能放数组里面么_手把手教你Vue解析pdf(base64)转图片【实践】
  12. HTML 小练习(休假申请单)
  13. “经历”重于“技术”
  14. Oracle数据库链接源文件
  15. 阿里云送你Hands-on Labs X linux联名T恤——阿里云高校计划《Linux命令入门》训练营
  16. H5小游戏源码在哪里可以免费获取?
  17. Pygame安装教程及基本配置(详细图文)
  18. 千字文(粱敕员外散骑侍郎周兴嗣撰)
  19. pythonturtle画飞机_Python获取航线信息并且制作成图的讲解
  20. 【开源】发布一个软件“WeNote 微便签”,比系统自带的便笺好用,每个便签可独立设倒计时

热门文章

  1. envi栅格图像镶嵌_影像镶嵌(基于像素的图像镶嵌)
  2. 中年危机也许只是个幻觉
  3. # ** Error: ../tb/bfm/bfm_tb_ddr3/bfm_tb_ddr3.v(186): Illegal task output argument.
  4. UE4面试基础知识(一)
  5. 无向有权图的邻接矩阵实现(C++)
  6. 项目管理知识体系指南 PMBOK(第6版)十大知识领域思维导图(总览图)
  7. 儿童护眼灯哪个品牌最好?儿童护眼灯十大排行榜
  8. python 天天向上求几天数_Python十题(第2课)
  9. 2020-11-16 MHF-NET乱读集锦
  10. php setfield什么意思,thinkphp教程专题