R语言文献计量分析笔记

参考文献:如何用 R 快速了解科研领域?; BiblioShiny使用介绍; R语言快速实现文献计量分析

GitHub:https://github.com/massimoaria/bibliometrix

biblioshiny教程:http://bibliometrix.org/biblioshiny/assets/player/KeynoteDHTMLPlayer.html


文章目录

  • bibliometrix
    • 描述
    • 安装
    • 数据
      • 提示
    • 开始分析
    • How to use ?
      • 作者研究
      • 文献研究
      • 主题研究
      • 未来展望

bibliometrix

描述

Bibliometrix软件包为文献计量学和科学计量学的定量研究提供了一套工具。

它提供了从’SCOPUS’ (https://scopus.com)、‘Clarivate Analytics Web of Science’ (https://www.webofknowledge.com/)、‘Digital Science Dimensions’ (https://www.dimensions.ai/)、“Cochrane Library”(https://www.cochranelibrary.com/)和“PubMed”(https://pubmed.ncbi.nlm.nih.gov/)数据库,进行文献计量分析,构建共被引、耦合、科学合作和共词分析网络。

Bibliometrix支持学者在三个关键的分析阶段:

  • 数据导入及转换为R格式;
  • 出版物数据集的文献计量分析;
  • 为co-citation, coupling, collaboration 和 co-word分析建立和绘制矩阵。矩阵是执行网络分析、多重对应分析和任何其他数据约简技术的输入数据。

安装

我们运行以下代码块,安装包,并导入包:

install.packages("bibliometrix", dependencies=TRUE)  #bibliometrix
library(bibliometrix)
biblioshiny()

注意,dependencies默认为FALSE,设置为TRUE就是下载bibliometrix包时顺便下载并安装bibliometrix包的依赖包。

如果不设置为TRUE(就像我第一次下载那样),执行biblioshiny()时就可能出现没有"withSpinner"这个函数的错误.

好的,我将dependencies设置为TRUE,并重新装以下bibliometrix,导入包,并执行biblioshiny()打开biblioshiny(针对非编码者的bibliometrix,为bibliometrix提供web界面的应用程序):

数据

以下摘自知乎学习导读:

我是做信息科学的。出于近便原则,本文的样例分析对象,是信息科学领域的一份权威期刊:Management Information Systems Quarterly (下文简称 MIS Quarterly)。

注意你在分析的时候,并不需要局限在某一本或者几本期刊。完全可以使用关键词搜索相关文献。

MIS Quarterly 的文献数据,我是从 Web of Science 下载的。

我对结果进行了精炼,只选择了其中的 Articles 类型。

一共 743 篇文章,导出选择的格式,为 BibTex 。

因为 Web of Science 每次导出记录数量,不能超过500,因此前后下载了2个 BibTex 格式文件。

我把它们打包成了一个 zip 文件(Archive.zip)。这个文件,我为你放在了这个位置(http://t.cn/EPIs99X)。你可以直接下载使用。

如果你希望自己从 Web of Science 下载文献记录,可以参考我的研究生吴查科和同学合作的这份视频教程(http://t.cn/EPIsjtk)。教程是关于 VosViewer 的。但其中4分钟以后,就有 Web of Science 文献记录检索和导出的完整介绍与展示。

(以下为GoatBishop言)

看完知乎上的导读,我把他提供的数据放到了我的蓝奏云上方便大家下载,密码为rrrr

提示

最近我上web of science的时候,发现他网页更新了:

Export下拉菜单里的内容也与旧版有点不同,我试了试,点击Plain text file,按照如下操作导出txt文件,并将txt文件打包为zip 文件(Archive.zip),也是可以在bibliometrix中进行分析的:

开始分析

  • 在biblioshiny中导入下载的文献信息。

为了方便起见,我将下载下来的Archive.zip放在我的桌面,在biblioshiny界面的导航栏中,选择 Data 下拉菜单,再点击Import or Load files

出现以下界面:

进行以下设置:

备注:知乎文章上选择的是,但是现在的选项里没有,在网上查了一下Web of Knowledge与Web of Science的关系:Web of Knowledge与Web of Science之间是什么关系?

点击 Start,可以看到,界面中间出现了加载动画:

等待一会,导入完毕后,展示结果列表如下:

How to use ?

作者研究

如果我们想查看最高产作者,可以点击 Authors下拉菜单,再点击 Most Relevant Authors

此时就会出现如下界面:

其中,Fractionalized Frequency是作者对于论文的贡献率:

点击Apply!,进入 Table选项卡,可以看到我们想要的结果:

备注:Authors下拉菜单的其他选项的意思为:

Most Local Cited Sources:高被引期刊(当前文献集)

Author’s Production over Time:高产作者近期发文

Lotka’s law:洛特卡定律(核心作者)

Author Impact:作者影响因子

Most Relevant Affiliations:最高产机构

Corresponding Author’s Country:合著作者的国籍

Country Scientific Production:各个国家发文量

Most Cited Countries:高被引国家以及被引次数

文献研究

我们查看在web of science中被引文献的情况,点击 Documents下拉菜单中的 Most Global Cited Documents

此时就会出现如下界面:

点击Apply!,进入 Table选项卡,可以看到我们想要的结果:

备注: Documents下拉菜单的其他选项的意思为:

Most Local Cited Documents:在当前数据集中高被引文献

Most Local Cited References:在当前数据集中高被引的参考文献

Reference Spectroscopy:每年参考文献的数量

Most Frequent Words:高频词

WordCloud:词云

TreeMap:树图

Word Dynamics:词出现次数,展示词变化趋势

Trend Topics:根据今年词出现频次推测热点话题

主题研究

如果我们想知道哪些主题更值得研究,可以通过词云图,直观的得到想要的信息,点击document下拉菜单中的worldcloud

我们在左侧的Field选项中,选择 Author Keywords 即作者自己列出的关键词,并进行一些列自定义设置,最后点击Apply!

点击 Conceptual Structure 下拉菜单,选择其中的Factorial Analysis把主题归类一下:

这里我就不更改左侧的参数选项了,点击左侧 Apply!,得到词汇地图:

由结果可知,我们大概可以把研究关注点聚焦在两个类别上,并且可以知道每个类别是如何被关键词描述的。

未来展望

我们可以通过绘制主题地图(Thematic Map),分析未来哪些主题可能会有长远发展:

主题地图中,横轴代表中心度(Centrality),纵轴代表密度(Density),并据此绘制出4个象限:

  • 第一象限(右上角):motor-themes,既重要,又已有良好发展(well-developed);
  • 第二象限(左上角):Niche themes,已有良好发展,但是对于当前领域不重要;
  • 第三象限(左下角):emerging or disappearing themes,边缘主题,也没有好的发展,可能刚刚涌现,也许即将消失;
  • 第四象限(右下角):basic themes,对领域很重要,但是未获得良好发展。一般是指基础概念。

随着时间变化,可以研究主题演化过程:

在biblioshiny中的具体操作为,点击 Conceptual Structure 下拉菜单中的 Thematic Map

在左侧进行一些设置,并点击 Apply!

R语言观察日志(part23)--bibliometrix包相关推荐

  1. R语言观察日志(part22)--glmnet包

    学习笔记,仅供参考,有错必究 文章目录 glmnet包 描述 用法 参数 细节 值 示例代码 glmnet包 使GLM具有Lasso或Elasticnet正则化. 描述 用惩罚极大似然拟合广义线性模型 ...

  2. R语言观察日志(part20)--包的组件之R代码

    学习笔记,仅供参考,有错必纠 文章目录 R代码 R代码的工作流程 组织函数 代码风格 对象名称 空格 余下的请看R语言观察日志(part16)--Google's R Style Guide 顶层代码 ...

  3. R语言观察日志(part13)--从GitHub中下载R包

    学习笔记,仅供参考,有错必纠 从GitHub中下载R包 这里,我们将介绍两种下载并加载R包的方式,即通过在线安装和本地安装. 在线安装 我们在使用在线安装的方法时,可能会遇到各种各样的问题,这里,我们 ...

  4. R语言观察日志(part16)--Google‘s R Style Guide

    学习笔记,仅供参考 自翻,有错必究 文章目录 Google's R Style Guide summary R语言风格 R语言规则 符号和命名 文件名 标识符 每行长度(注意) 缩进 空格 花括号 被 ...

  5. R语言观察日志(part15)--R的缺点

    学习笔记,仅供参考,有错必纠 摘自:基于R语言的机器学习 R的缺点

  6. R语言观察日志(part12)--关于.Rprofile文件

    学习笔记,仅供参考,有错必纠 关于.Rprofile文件 帮助文档 除非--no-init-file被给出,R会搜索一个用户配置文件,一个包含R代码的文件.这个文件的路径可以由R_PROFILE_US ...

  7. R语言观察日志(part4)--paste函数

    学习笔记 转载自:R语言中字符串的拼接操作 paste函数 在R语言中 paste 是一个很有用的字符串处理函数,可以连接不同类型的变量及常量.函数paste的一般使用格式为: paste(..., ...

  8. R语言观察日志(part5)--利用readr和readxl包读写数据

    学习笔记,仅供参考 利用readr和readxl包读写数据 读取数据 相关函数 函数包readr和readxl提供了一系列的数据读入功能,主要函数如下: #readr包read_delim(file, ...

  9. R语言观察日志(part21)--包的组件之元数据

    学习笔记,仅供参考,有错必纠 文章目录 包的元数据 依赖:包需要什么 版本 其他依赖 标题和描述:包是做什么的 作者:你是谁 许可证:谁能使用包 版本 其他域 包的元数据 依赖:包需要什么 Impor ...

最新文章

  1. 互联网研发中负载均衡算法一点探索
  2. 算法65----字符串
  3. php 桥接 微信80端口,解决MAC系统在做微信开发时候tomcat无法使用80端口问题
  4. python 魔法方法常用_Python魔法方法指南
  5. inotify-tools对文件及目录访问进行记录
  6. Dart 12-Day
  7. sql中带in条件的查询及提高效率
  8. uml的图与代码的转换——类图
  9. java回车不终止_java 在console行输入一串String后回车,仍无法停止。 下面的程序是计算相似度的,当用户输入关键字后...
  10. easyui datagrid 列的内容超出所定义的列宽时,自动换行
  11. linux系统中rsync的安装和使用,以及配置rsync开机启动
  12. 无法打开预编译头文件的解决方法及预编译头原理[ZZ] 转
  13. Atitit 施政策略总结 目录 1. 行政综合方面的策略 2 1.1. 加强宣传无处不在策略 占领各大网络与实体阵地 2 1.2. 装点门面,不花钱或者少花钱的东西体系全部搞起来 2 1.3. 加大
  14. 趣味程序设计_打印日历
  15. 怎样用计算机画图合成图片,如何用电脑自带画图软件将多张截图拼成一张图,自动生成的那种...
  16. 尚硅谷_2019互联网大厂高频重点面试题(第二季)思维导图脑图笔记完整版
  17. ArrayList的add方法详解——让我们好好看看一个元素是如何插入到ArrayList集合当中(源码级别)
  18. 先验概率与后验概率是什么
  19. 计算机工程与网络学术会议怎么样,我校成功举办第九届计算机工程与网络(CENet2019)国际学术会议...
  20. 实现字符和Unicode码互换 (Java经典编程案例)

热门文章

  1. 04_ReplaceBlank
  2. suse php5,简简单单搭建linux SuSE LAMP环境
  3. 时序轮转的意思_天地是景框时序轮转的风景----(傻女人)
  4. Rust中文论坛已更新上线
  5. python全栈_007_Python3格式化输出
  6. 详解ScheduledExecutorService的周期性执行方法
  7. Atitit.js图表控件总结
  8. PHP学习笔记——Php文件引入
  9. Vijos 1100 (区间DP)
  10. 站长手记20100920部署更新