(一)如何在CiteSpace中控制节点的取舍

CiteSpace提供了几种方式来控制最终生成的网络将由哪些节点构成:Top N

Top N%

Threshold Interpolation

Select Citers

第一种办法最简单,最适于初学阶段,所以目前版本将其放在首位。其余几种办法逐渐变得复杂,最好等熟悉系统之后再考虑。下面简要介绍一下各个方法的细节。

Top N:系统设定N=30,意为在每个timeslice中提取N个被引次数最高的文献。N越大生成的网络将相对更全面一些。

Top N%: 将每个timeslice中的被引文献按被引次数排序后,保留最高的N%作为节点。

ThresholdInterpolation:设定三个time slices的值,其余timeslices的值由线性插值赋值。三组需要设置的slices为第一个,中间一个,和最后一个slice。每组中的三个值分别为c,cc,和ccv。c为最低被引次数。只有满足这个条件的文献才能参加下面的运算。cc为本slice内的共被引次数。ccv为规范化以后的共被引次数(0~100)。

SelectCiters:与以上方法不同的是这个方法先选施引文献,然后需再用方法1-3之一。先Check TCDistribution然后填写Use TC Filter 后面的两个数字:最低和最高TC值(TimeCited),选定User TC Filter前的选项。按Continue,再设定方法1,2,或3。

节点总数在ProgressReports中给出。节点总数越大需要内存越多。下回将介绍如何选择网络的连接密度。

CiteSpace提供了多项参数选择,初学者难免有时不知从何下手。这里介绍一些要点以供参考。

CiteSpace的功能类似一架照相机,只是它拍摄的对象是科学文献而不是自然景色。设置CiteSpace的各项参数大致相当于取景,调焦,对光圈。不过这些过程在如今的相机中基本都已完全透明。所以,参数设置对CiteSpace所产生的图谱有直接影响。最初使用时,最简单的办法是先采用系统的预定参数;熟悉之后,再按下面提供的要点调整参数。

那么什么样的CiteSpace图谱才算好图谱呢?CiteSpace的设计实际上是有针对性的。能满足CiteSpace设计要求的图谱才视为好图谱。CiteSpace要展现的是一个领域的知识发展的历史和现状。这是CiteSpace的取景范围。由于深受库恩《科学革命的结构》的影响,对CiteSpace来说,焦点自然是在范式(paradigm)和范式转移(paradigm shift)。近年来大家倾向于这种认识:范式是一种更为广泛的现象,可以在各个层次上出现。换句话说,并非50年一遇或100年一遇。所以CiteSpace竭尽全力所要甄别,显示,突出的就是在广义的范式转移中起关键作用的转折点。与广义范式相对应的是科学文献中自然呈现的聚类。转折点便是联结不同聚类的桥梁。如果CiteSpace生成的图谱能清晰的显示出这些要素,这种图谱便属上乘之作。

有了这个目标以后,图谱如能显示俩三个或更多的自然网络聚类,而且各聚类之间有少量的联系,便为最佳。这样的图谱很容易带来有趣的和有意义的发现。相反,如果图谱中所有节点都纠缠在一起,则很难理出头绪。如果碰到这种情况,检查下面几种原因:数据范围是否过窄,门槛设置是否过高(threshold),曝光时间是否过短(time slice)。另外,可用CiteSpace中的链接剔除功能(pruning)来剔除一些次要的链接以突出核心结构。成像以后,CiteSpace可提供进一步的指标。比如,modularity大约在0.4~0.8时的图谱通常会符合或接近上述要求。另外,如果可能从每年或每个时间段中选取数量大致相当的数据,会比每年都使用同样的门槛要更有效(相对于上述目标而言)。

做专利分析的时候,发现转换德温特专利的数据;还有就是,C、CC和CCV阈值的选择有没有什么标准呢?TopN 和TopN% 更直接,建议你用这两项。c,cc,ccv的选择灵活但较为复杂,参考2004年我的PNAS文章。从前,c有选5次以上的,ccv有选25%以上等等在文献中都可见到。阈值低的覆盖面会稍微广一些。考虑到文献数据本身的误差,以及大部分人的注意力往往集中在最有代表性的工作,所以阈值的选择总是相对的。WOS并不包括所有的文献。另外,信息和噪音比也是一个考虑因素。

关于阙值的选择,我是不是可以这样理解,就是说,知识图谱是需要不断探索和试验的,对所选择领域文献的分析必须是基于文献实际情况的,而不只是就图说图,理想的知识图谱应该是能够正确反映文献实际情况的那一张图。所以,知识图谱的绘制并不是一蹴而就的,阈值的不断切换就是为了找到符合实际情况的知识图谱;在操作过程中经常会遇到有的文献被引频次很高,但是中心度却很低,而有的文献被引频次很低,中心度却很高,对于这样的现象我该怎样去理解?这两类文献中那一种才是关键文献或重要文献?为什么会出现这样的情况。另外,阈值设定中:top N per slice或者Threshold(c,cc,ccv)数值大小,选用Pathfinder或者Minimum Spanning Tree,即使小小的变化,软件选择出的被引文献或者关键词其中心度变化很大。如果选择了其中的一组数据进行分析,自己都无法解释选择为什么要选择这组数据?我应该依据什么去选择分析?被引频次和中心度是两种不同的度量。中心度是定义在网络结构上的。至于什么是关键文献或重要文献,取决于你要研究什么问题。如果波动很大说明你选的top N还不够大。

使用默认的top30与设置c、cc,ccv的差别很大,不知什么原因常常软件跑不动了,能给出点阈值调节的具体知道吗?c/cc/ccv的选法不太容易掌握(由下往上选),所以现在系统界面推荐top N的选法(由上往下选)。建议先用系统预定参数,然后根据选入节点的数量等在调节参数:top N: 30, 50, 100, ... 由低望高增加。c/cc/ccv:,c: 30, 25, 20, 15, 10, 5, ... 由高往低减少。cc: 30, 25, 20, 15, 10, 5, ...,ccv:30, 25, 20, 15, 10, 5,

(二)如何解读CiteSpace产生的图谱

CiteSpace的核心功能是产生由多个文献共被引网络组合而成的一种独特的共被引网络,以及自动生成的一些相关分析结果。每个文献共被引网络对应于一个历时一年或几年的时间段。最终显示的网络不是各个网络之间的简单叠加,而是要满足一些条件(详见2004年PNAS的论文)。解读这样的网络(我称为递进式知识领域分析)的要点包括:网络整体结构,网络聚类,各聚类之间的关联,关键节点(转折点)和路径。解读时可从直观显示入手,然后再参照各项指标。

结构:是否能看到自然聚类(未经聚类算法而能直观判定的组合),是否包括转折点(有紫色外圈的节点),通过算法能得到几个聚类?每个节点大小代表它的总被引次数。大圈则总被引高。

时间:每个自然聚类是否有主导颜色(出现时间相对集中),是否有明显的热点(节点年轮中出现红色年轮,即被引频率是否曾经或仍在急速增加)?通过各个年轮的色彩可判断被引时间分布。时间线显示将每一聚类按时间顺序排列,相邻聚类常常对应相关主题(聚类间共引)。聚类之间的知识流向也可从时间(色彩)上看到(由冷色到暖色)。

内容:每个聚类的影响(被引时涉及的主题,摘要,和关键词)和几种不同算法所选出的最有代表性的名词短语?

指标:每个聚类是否具有足够的相似性(silhouette值是否足够大,太小则无明确主题可言),整个聚类是否有足够节点(太少则很可能全都出自同一篇文献的参考文献,因而缺乏普遍意义)?

Tips:每个节点上,右键弹出的选择中,有一项是通过DOI连接到原文出版社提供的网页。可用CiteSpace的图谱作为一个直接浏览相关文献的界面。

spss citespace mysql_Citespace软件操作详解!相关推荐

  1. 工程之星android版使用,安卓版工程之星软件网络1+1模式及网络cors连接操作详解...

    原标题:安卓版工程之星软件网络1+1模式及网络cors连接操作详解 现在,越来越多用户开始使用安卓版工程之星进行作业,科力达技术工程师总结了安卓版工程之星网络1+1模式及网络CORS连接方式操作步骤, ...

  2. java控制mac录音代码_操作详解丨如何用 Cybery 控制 mac OS系统下的录音软件(DAW)...

    原标题:操作详解丨如何用 Cybery 控制 mac OS系统下的录音软件(DAW) Cybery可以在各主流平台/操作系统下实现MIDI控制功能:mac OS(可通过蓝牙.USB线或者借助其它硬件连 ...

  3. spss聚类分析_【SPSS数据分析】SPSS聚类分析的软件操作与结果解读 ——【杏花开生物医药统计】...

    在对数据进行统计分析时,我们会遇到将一些数据进行分类处理的情况,但是又没有明确分类标准,这时候就需要用到SPSS聚类分析. SPSS聚类分析分为两种:一种为R型聚类,是针对变量进行的聚类分析:另一种为 ...

  4. SVN的Windows和Linux客户端操作详解

    SVN的Windows和Linux客户端操作详解 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.Windows客户端操作 1.安装SVN客户端 a>.去官网下载svn软件 ...

  5. SCCM 2007 R2部署、操作详解系列之部署篇

    SCCM 2007 R2部署.操作详解系列之部署篇 导语: 大家好,我是John Cai(蔡建涛),欢迎大家来到我的博客-E网情深http://johncai.blog.51cto.com/.今天,我 ...

  6. python列表切片后得到剩余列表_python列表切片和嵌套列表取值操作详解

    python列表切片和嵌套列表取值操作详解 给出列表切片的格式: [开头元素::步长] # 输出直到最后一个元素,(最后一个冒号和步长可以省略,下同) [开头元素:结尾元素(不含):步长] # 其中, ...

  7. windowsterminal设置初始大小_这是我见过最全面的金蝶操作详解了,从初始化到财务使用全流程...

    今天橘子和小伙伴们分享一套<金蝶操作全流程>,这是我见过最详细的了,从金蝶软件如何安装到有关业务操作详解,非常全面,很适合自学和公司内部培训. 目录 一.金蝶KIS专业版产品安装 二.金蝶 ...

  8. python excel库pip install_超全整理|Python 操作 Excel 库 xlwings 常用操作详解!

    原标题:超全整理|Python 操作 Excel 库 xlwings 常用操作详解! 来源:早起Python 作者:陈熹.刘早起 大家好,我是早起. 在之前的文章中我们曾详细的讲解了如何使用openp ...

  9. Java学习软件安装详解

    Java学习软件安装详解 一直对Java的学习马马虎虎,新换的电脑,在重装java软件时遇到很多问题,安装了半天,想着以后自己也可能用到,所以写下来,以供大家参考. 1.准备工作 我的电脑:windo ...

最新文章

  1. 减少Building 'Xxx' Gradle project info等待时间
  2. OEM, ODM, OBM
  3. DNA甲基化与表观遗传学数据挖掘与分析学习会 (10月26-27 上海)
  4. 从寻找可敬的人类开始,扩展未来人类生存的8个维度
  5. 每天一道LeetCode-----两个有序数组合并后的第K个数
  6. dial tcp xxx: connectex: A connection attempt failed
  7. ubuntu重置root密码
  8. 华为机试HJ65:查找两个字符串a,b中的最长公共子串
  9. STM32——库函数版——交叉闪烁灯程序
  10. 易筋SpringBoot 2.1 | 第三十篇:SpringBoot Reactor响应式编程介绍
  11. 威联通qnap SMB速度慢 只有30M、50M的解决方法
  12. 分布式数据库NoSQL(五)——MongoDB 之滴滴、摩拜都在用的索引
  13. 苹果计算机恢复计算器,苹果自带计算器删除怎么恢復
  14. 爬取新型冠状病毒的历史数据
  15. CCF试题 201903-2 二十四点
  16. ensp 移动主机搜索不到AP信道_有颜值更有才华,乘风破浪的天融信面板AP接受硬核实测...
  17. k8s简单集群搭建和应用(包括虚拟机的开启)①
  18. Java学习路线·入门
  19. win7系统下u盘安装linux系统,Win7下U盘安装CentOS-7-x86_64-DVD-1503-01(入门版)
  20. PythonOCC封装:2.重新封装pythonocc

热门文章

  1. 67.220.92.12 forum index.php,index.asp
  2. 哪些企业使用CEGBU低代码平台能获得最大信息化投资回报率
  3. python中for语句用法_详解Python中for循环的使用_python
  4. esp8266 nodemcu 自制mp3
  5. Maxthon简易收藏板
  6. 客户关系管理及客户服务简介(译)
  7. 【网络】无线路由器的AP、Client、WDS、WISP使用功能图解(清晰明了)
  8. 研磨时光的文房四宝之砚台鉴赏:混沌初开砚,匠心所在
  9. 移动,联通,电信三家4G手机技术上有什么区别,TD-LTE和FDD-LTE的区别
  10. 终端服务器 cal,如何解决Windows终端服务许可证问题