来源微信公众号 【学术点滴】

本文仅以该图为案例,其他软件如VOSviewer做的图也存在各种问题

上图你一定很熟悉,利用CiteSpace软件制作的时区图(TimeZone)

该图通过关键词出现年份进行排列,用以展示主题的演化过程

具体原理可参考我之前的推文:《CiteSpace的时区图谱含义详细解读》

但是,该图存在一个致命问题

这个问题在以前并不是问题

而是随着期刊公开方式的变化而产生的

以前,中国知网公开的期刊都是已经印刷完成的,已经有纸质版本了,所以文章的发表时间是确定的了

但是,近年来随着期刊公开方式的转变,尚未印刷已经录用的文章会通过网络首发的方式进行公开,如下:

当纸质版印刷后,再把网络首发删除,公开正式版本

现在几乎每个期刊都会通过网路首发公开自己刚刚录用的文章,这是非常好的事情,能够让读者及时了解到最新研究成果,打破了文章从录用到出版的时滞问题

但是,网路首发的文章对于我们做文献计量与知识图谱就会存在致命问题

为什么呢?

因为网络首发的文章
缺失时间
缺失时间
缺失时间

缺失时间有什么重要后果呢?

比如,我们做时区图,有一个关键词是【新型冠状病毒】,显然该词出现于2020年,但是由于缺失时间,CiteSpace会默认补充一个1990年或者其他年份,这就出现问题啦。

同样针对研究前沿探测也会出现此问题

另外,VOSviewer软件也具备时间-关键词叠加图,由于网路首发导致的缺失时间,该软件也会出现相应的问题

上述缺陷会导致结果错误

而你可能并不知道

最终结果就是看着错误的图给出错误的解析

不知道你以前注意过此问题吗?

可能并没有,也可能注意到了但不知道如何解决

下面给出解决方案
中文数据利用Data数据园软件综合提取功能,看是哪篇文献缺失时间,然后回到原TXT文本里补充时间

英文数据利用WOS全字段挖掘软件综合提取功能,看是哪篇文献缺失时间,然后回到原TXT文本里补充时间

这个数据预处理功能一定要重视

知识图谱与文献计量你一定做错了! citespace相关推荐

  1. 【01误区解读】知识图谱与文献计量你一定做错了~CiteSpace时区图

    本文仅以该图为案例,其他软件如VOSviewer做的图也存在各种问题 上图你一定很熟悉,利用CiteSpace软件制作的时区图(TimeZone) 该图通过关键词出现年份进行排列,用以展示主题的演化过 ...

  2. CiteSpace知识图谱

    一.准备 1.数据准备 新建文件夹,包含四个子文件夹:input.output.data.project 在中国知网上检索相关主题的论文,选中,导出参考文献,格式为Refworks,导出,以downl ...

  3. 文献计量常用软件功能比较

    随着大数据时代的到来,科学发现从以计算科学为主的第三范式转为以数据密集型科学为主的第四范式,基于科学数据进行挖掘的科研创新成为重要趋势.科学知识图谱作为科学数据挖掘的重要手段,已成为科研人员的得力助手 ...

  4. 科学知识图谱绘制方法、步骤及工具

    1.知识图谱的起源与发展 2.知识图谱的绘制方法 2.1 文献计量方法 2.2 统计分析方法 3.知识图谱绘制的步骤 4.知识图谱绘制的工具 科学知识图谱(简称知识图谱)是现实科学知识发展进程与结构关 ...

  5. 带你看懂基于Citespace的文献计量学及可视化分析

    带你看懂基于Citespace的文献计量学及可视化分析 ​ 编辑切换为居中 添加图片注释,不超过 140 字(可选) 你知道文献计量学分析吗? 听过,据说可以用citespace等特殊软件完成,做出很 ...

  6. 科研工具-Citespace和vosviewer文献计量及其可视化

    文献计量学是指用数学和统计学的方法,定量地分析一切知识载体的交叉科学.它是集数学.统计学.文献学为一体,注重量化的综合性知识体系.特别是,信息可视化技术手段和方法的运用,可直观的展示主题的研究发展历程 ...

  7. Pubmed数据库改版后如何做计量分析与知识图谱

    新版本Pubmed数据库如何做计量分析与知识图谱,bicomb不可以用了 最近一些人想做Pubmed数据库计量分析,但是由于Pubmed数据库刚刚改版,由于数据格式问题,原先的一些软件无法继续使用. ...

  8. 资源推荐 | 知识图谱顶会文献集锦(附链接)

    来源:专知 作者:WDS Research Group 本文附资源,建议阅读5分钟. 本知识库包含了关于知识图谱的会议论文的链接. [ 导读 ]知识图谱是通过将应用数学.图形学.信息可视化技术.信息科 ...

  9. 【知识图谱】本周文献阅读笔记(3)——周二 2023.1.10:英文)知识图谱补全研究综述 + 网络安全知识图谱研究综述 + 知识图谱嵌入模型中的损失函数 + 图神经网络应用于知识图谱推理的研究综述

    声明:仅学习使用~ 对于各文献,目前仅是泛读形式,摘出我认为重要的点,并非按照原目录进行简单罗列! 另:鉴于阅读paper数目稍多,对paper内提到的多数模型暂未细致思考分析.目的是总结整理关于KG ...

最新文章

  1. solr7.6 安装配置
  2. Java中的单利模式介绍
  3. python 装饰器实现事件绑定_Python装饰器是怎么实现的?
  4. 概率统计:第八章:假设检验
  5. redis缓存穿透-解决方案
  6. apex 查询_加速器关联好司机下载器下载的apex
  7. excel单元格内容合并
  8. 下面哪个字段是http请求中必须具备的_理解HTTP协议-HTTP协议详解总结
  9. WEB攻防实战篇,思维导图
  10. javaScript一种优化模式-初始化时分支
  11. [SDOI2006]保安站岗 树dp
  12. centos安装桌面和远程连接
  13. NFS==network file system
  14. 觅风易语言智能辅助开发视频教程(高清带源码)
  15. ubuntu20.04 firefox flashplayer 安装教程
  16. 【ORACLE】关于多态表函数PTF(Polymorphic Table Functions)的使用
  17. node生成图形验证码
  18. 实验指南:BGP路由汇聚(下)
  19. Allegro在PCB中区域规则设置方法
  20. 越狠越有饭吃,越不狠越没饭吃

热门文章

  1. (二)永磁同步电机矢量控制(三电平)——三电平传统SVPWM调制算法原理
  2. Restorator 2005 v3.51 b1457
  3. .cs文件与aspx.cs文件之间的区别是什么???他们的作用是什么???ASPX文件的作用是什么?...
  4. 线程池面试题灵魂三问
  5. Python 的itchat 的微信文件传输助手和朋友性别,签名,所在城市分析
  6. 【GIS数据网盘免费分享】含77个城市建筑轮廓矢量图、POI数据,OSM数据~持续更新,长期有效
  7. vue上传录音_vue中添加mp3音频文件的方法
  8. RTK差分共享猫APP后台系统已开源
  9. 『NLP学习笔记』工业级自然语言处理spaCy开源库的使用
  10. pdf转换成txt格式的方法与步骤