由于不同数据库厂商所提供下载的数据格式有所差异,为了能够使用CiteSpace对不同数据库的数据进行分析,CiteSpace专门提供了数据的转换界面,用于将CNKI、CSSCI、以及SCOPUS等数据转换为WoS数据格式,供CiteSpace进行分析。
进入CiteSpace数据预处理功能模块的步骤为:运行CiteSpace后,选择功能参数区菜单栏的Data—>Import/Export,即可得到数据的预处理界面。目前CiteSpace可以对WOS、arXiv、CNKI、CSSCI、Derwent、NSF、Scopus、SDSS等数据进行预处理。

一、WOS数据过滤与除重
1.数据的过滤
点击CiteSpace功能参数区的Data菜单,选择Filter后按照提示操作即可。Filter过程结束后会在原始数据的文件夹中得到一个“Filter”文件夹,里面提取了过滤后的数据,CiteSpace也对这些数据进行了分时处理(将相同时间的数据归类到同样的txt文档中)。在此过程结束后,在CiteSpace功能参数区的Process Report中会显示处理的整体结果。
2.数据的除重
(1)建立两个文件夹:“Original data”用于存储原始数据;“Duplicates Removal”用于保存处理后的数据。(原始数据文件夹中放入按要求下载和命名的数据)
(2)点击Data—>Import/Export,进入CiteSpace功能界面,并在菜单中选择数据的预处理菜单,进入数据预处理功能界面。
(3)加载数据和除重。将原始数据加载到Input Directory,将保存处理后的数据文件夹加载到Output Directory。当数据加载结束后,点击”Remove duplicates(WoS)”后等待软件执行除重过程。
二、文献数据格式的转换
在CiteSpace的Data—>Import/Export中还提供了数据格式转换的功能。默认界面为CiteSpace Built—in Data,如果要对数据转换,需要点击后面的标签,例如WOS,arXiv,CNKI等。
1.CNKI数据转换
建立文件夹Input用于存储原始数据,建立文件夹Output用于存储转换后的数据;点击“CNKI”标签,选定原始数据所在文件夹和对应输出文件夹;点击“Format Conversion”,完成转换后会显示“Finished”。
2.CSSCI数据转换
按照前面的步骤下载好CSSCI数据后,与CNKI的处理过程类似。CSSCI转换后的数据记录会在原数据文本名称后加WoS。
3.Scopus数据转换
4.Derwent数据转换
【注】:
1.当前CiteSpace可以直接分析的数据格式为Web of Science格式,因此用户在分析一些非Web of Science数据格式的资料时,可以通过编程将数据转换为Web of Science格式。
2.登录http://paperscape.org/可进入arXiv的可视化检索界面。例如通过该系统检索了关键词包含safety的论文,能够发现这些论文主要集中的领域。
3.如果已经下载了数据,还想比较快和清晰地了解数据的结构,那么可以使用Notepad++或sublimetext文档编辑器来查看,不仅打开文档速度快,而且数据结构也是一目了然。
4.在 web of science下载数据的输出页面上Record Content 一定要选择Full Record and Cited References,否则将无法进行共被引分析。
5.在中国社会科学引文索引中,每次检索显示的记录最多为2000条,每次可以下载的数据量为400条。当检索的检索超过2000条时,可以通过时间分段来下载所有的数据。
6.CiteSpace可以处理的数据

7.CiteSpace可以处理的数据源及可用功能

CiteSpace学习笔记(三)——数据预处理相关推荐

  1. 深度学习笔记8 数据预处理

    数据预处理标准流程 自然灰度图像 (1)灰度图像具有平稳特性,对每个数据样本分别做均值消减(即减去直流分量)--每个图像块,计算平均像素值,并将图像每个像素点减去均值.每个图像块有一个不同的均值. x ...

  2. 大数据HiveSQL学习笔记三-查询基础语法以及常用函数

    大数据HiveSQL学习笔记三-查询基础语法以及常用函数 一.基础语法 1.SELECT -列名- FROM -表名- WHERE -筛选条件- 如:需要根据城市,性别找出匹配的10个用户 user_ ...

  3. 吴恩达《机器学习》学习笔记三——多变量线性回归

    吴恩达<机器学习>学习笔记三--多变量线性回归 一. 多元线性回归问题介绍 1.一些定义 2.假设函数 二. 多元梯度下降法 1. 梯度下降法实用技巧:特征缩放 2. 梯度下降法的学习率 ...

  4. Python数据分析入门笔记5——数据预处理之异常值

    系列文章目录 Python数据分析入门笔记1--学习前的准备 Python数据分析入门笔记2--pandas数据读取 Python数据分析入门笔记3--数据预处理之缺失值 Python数据分析入门笔记 ...

  5. Python数据分析入门笔记9——数据预处理案例综合练习(男篮女篮运动员)

    系列文章目录 Python数据分析入门笔记1--学习前的准备 Python数据分析入门笔记2--pandas数据读取 Python数据分析入门笔记3--数据预处理之缺失值 Python数据分析入门笔记 ...

  6. J2EE学习笔记三:EJB基础概念和知识 收藏

    J2EE学习笔记三:EJB基础概念和知识 收藏 EJB正是J2EE的旗舰技术,因此俺直接跳到这一章来了,前面的几章都是讲Servlet和JSP以及JDBC的,俺都懂一些.那么EJB和通常我们所说的Ja ...

  7. Ethernet/IP 学习笔记三

    Ethernet/IP 学习笔记三 原文为硕士论文: 工业以太网Ethernet/IP扫描器的研发 知网网址: http://kns.cnki.net/KCMS/detail/detail.aspx? ...

  8. mysql没法修改数据_MySQL学习笔记之数据的增、删、改实现方法

    本文实例讲述了MySQL学习笔记之数据的增.删.改实现方法.分享给大家供大家参考,具体如下: 一.增加数据 插入代码格式: insert into 表明 [列名-] values (值-) creat ...

  9. iView学习笔记(三):表格搜索,过滤及隐藏列操作

    iView学习笔记(三):表格搜索,过滤及隐藏某列操作 1.后端准备工作 环境说明 python版本:3.6.6 Django版本:1.11.8 数据库:MariaDB 5.5.60 新建Django ...

  10. 学习笔记之数据可视化(二)—— 页面布局(下)

    续上一章 2.7 地图区域(.map) 2.7.1 实现步骤: 2.8 用户统计模块 2.8.1 布局: 2.8.2 柱状图 2.9 订单模块 2.9.1 订单区域布局 2.9.2 订单区域(orde ...

最新文章

  1. Linux 平台一种进程代码注入方法
  2. React Native获取手机的各种高度
  3. matlab均线程序化交易,【策略分享】Matlab量化交易策略源码分享
  4. 怎么获取插入的最新自动生成的ID
  5. 最短路径(迪杰斯特拉算法)
  6. android 万能倒计时,时分秒倒计时
  7. SQL SERVER 备份数据库到指定路径语句
  8. Atitit php pdo的api使用 目录 1.1. PHP PDO简介 1 1.2. 若要使用数据库长连接,:PDO::ATTR_PERSISTENT 1 2. 其他设置 2 2.1. )、P
  9. python反编译安卓_APK反编译得工具总结(转载)
  10. python 爬虫基础——淘宝评论
  11. 光伏蓄电池单相并网模型。光伏+MPPT+boost升压电路+桥式逆变 带参考文件,模型说明文件
  12. Ubuntu安装桌面环境以及远程桌面连接
  13. echarts 时间轴处理_图样图森破-pyecharts之时间轴
  14. Pytorch基础知识之pth文件与DataLoader数据加载器
  15. 服务器跑项目,如何使用远程服务器跑项目
  16. 常用linux 命令 -网络相关
  17. 烽火2640路由器命令行手册-07-安全配置命令
  18. 类 ApplicationInfo详解
  19. freemarker 遍历 map
  20. Linux实战(一):服务器应用迁移

热门文章

  1. python xlsx转xls_使用python将.xlsx和xls(最新版本)转换为pdf
  2. 设计模式大作业:在线制作方便面
  3. 新手入坑GMSSL(三)GMSSL双证书与360国密浏览器通讯
  4. Osm地图osmdroid下载离线地图,第三方瓦片地图
  5. oracle银行勾兑,鸿富兴企业银行对账系统
  6. Windows系统安全登录日志分析工具logonTracer汉化修正版
  7. 《设计模式之禅》-建造者模式
  8. LSF_管理软件许可证和其他共享资源
  9. hackgame blackbap攻略
  10. 将导入到Revit中的CAD图纸分解——炸开