CiteSpace学习笔记(三)——数据预处理
由于不同数据库厂商所提供下载的数据格式有所差异,为了能够使用CiteSpace对不同数据库的数据进行分析,CiteSpace专门提供了数据的转换界面,用于将CNKI、CSSCI、以及SCOPUS等数据转换为WoS数据格式,供CiteSpace进行分析。
进入CiteSpace数据预处理功能模块的步骤为:运行CiteSpace后,选择功能参数区菜单栏的Data—>Import/Export,即可得到数据的预处理界面。目前CiteSpace可以对WOS、arXiv、CNKI、CSSCI、Derwent、NSF、Scopus、SDSS等数据进行预处理。
一、WOS数据过滤与除重
1.数据的过滤
点击CiteSpace功能参数区的Data菜单,选择Filter后按照提示操作即可。Filter过程结束后会在原始数据的文件夹中得到一个“Filter”文件夹,里面提取了过滤后的数据,CiteSpace也对这些数据进行了分时处理(将相同时间的数据归类到同样的txt文档中)。在此过程结束后,在CiteSpace功能参数区的Process Report中会显示处理的整体结果。
2.数据的除重
(1)建立两个文件夹:“Original data”用于存储原始数据;“Duplicates Removal”用于保存处理后的数据。(原始数据文件夹中放入按要求下载和命名的数据)
(2)点击Data—>Import/Export,进入CiteSpace功能界面,并在菜单中选择数据的预处理菜单,进入数据预处理功能界面。
(3)加载数据和除重。将原始数据加载到Input Directory,将保存处理后的数据文件夹加载到Output Directory。当数据加载结束后,点击”Remove duplicates(WoS)”后等待软件执行除重过程。
二、文献数据格式的转换
在CiteSpace的Data—>Import/Export中还提供了数据格式转换的功能。默认界面为CiteSpace Built—in Data,如果要对数据转换,需要点击后面的标签,例如WOS,arXiv,CNKI等。
1.CNKI数据转换
建立文件夹Input用于存储原始数据,建立文件夹Output用于存储转换后的数据;点击“CNKI”标签,选定原始数据所在文件夹和对应输出文件夹;点击“Format Conversion”,完成转换后会显示“Finished”。
2.CSSCI数据转换
按照前面的步骤下载好CSSCI数据后,与CNKI的处理过程类似。CSSCI转换后的数据记录会在原数据文本名称后加WoS。
3.Scopus数据转换
4.Derwent数据转换
【注】:
1.当前CiteSpace可以直接分析的数据格式为Web of Science格式,因此用户在分析一些非Web of Science数据格式的资料时,可以通过编程将数据转换为Web of Science格式。
2.登录http://paperscape.org/可进入arXiv的可视化检索界面。例如通过该系统检索了关键词包含safety的论文,能够发现这些论文主要集中的领域。
3.如果已经下载了数据,还想比较快和清晰地了解数据的结构,那么可以使用Notepad++或sublimetext文档编辑器来查看,不仅打开文档速度快,而且数据结构也是一目了然。
4.在 web of science下载数据的输出页面上Record Content 一定要选择Full Record and Cited References,否则将无法进行共被引分析。
5.在中国社会科学引文索引中,每次检索显示的记录最多为2000条,每次可以下载的数据量为400条。当检索的检索超过2000条时,可以通过时间分段来下载所有的数据。
6.CiteSpace可以处理的数据
7.CiteSpace可以处理的数据源及可用功能
CiteSpace学习笔记(三)——数据预处理相关推荐
- 深度学习笔记8 数据预处理
数据预处理标准流程 自然灰度图像 (1)灰度图像具有平稳特性,对每个数据样本分别做均值消减(即减去直流分量)--每个图像块,计算平均像素值,并将图像每个像素点减去均值.每个图像块有一个不同的均值. x ...
- 大数据HiveSQL学习笔记三-查询基础语法以及常用函数
大数据HiveSQL学习笔记三-查询基础语法以及常用函数 一.基础语法 1.SELECT -列名- FROM -表名- WHERE -筛选条件- 如:需要根据城市,性别找出匹配的10个用户 user_ ...
- 吴恩达《机器学习》学习笔记三——多变量线性回归
吴恩达<机器学习>学习笔记三--多变量线性回归 一. 多元线性回归问题介绍 1.一些定义 2.假设函数 二. 多元梯度下降法 1. 梯度下降法实用技巧:特征缩放 2. 梯度下降法的学习率 ...
- Python数据分析入门笔记5——数据预处理之异常值
系列文章目录 Python数据分析入门笔记1--学习前的准备 Python数据分析入门笔记2--pandas数据读取 Python数据分析入门笔记3--数据预处理之缺失值 Python数据分析入门笔记 ...
- Python数据分析入门笔记9——数据预处理案例综合练习(男篮女篮运动员)
系列文章目录 Python数据分析入门笔记1--学习前的准备 Python数据分析入门笔记2--pandas数据读取 Python数据分析入门笔记3--数据预处理之缺失值 Python数据分析入门笔记 ...
- J2EE学习笔记三:EJB基础概念和知识 收藏
J2EE学习笔记三:EJB基础概念和知识 收藏 EJB正是J2EE的旗舰技术,因此俺直接跳到这一章来了,前面的几章都是讲Servlet和JSP以及JDBC的,俺都懂一些.那么EJB和通常我们所说的Ja ...
- Ethernet/IP 学习笔记三
Ethernet/IP 学习笔记三 原文为硕士论文: 工业以太网Ethernet/IP扫描器的研发 知网网址: http://kns.cnki.net/KCMS/detail/detail.aspx? ...
- mysql没法修改数据_MySQL学习笔记之数据的增、删、改实现方法
本文实例讲述了MySQL学习笔记之数据的增.删.改实现方法.分享给大家供大家参考,具体如下: 一.增加数据 插入代码格式: insert into 表明 [列名-] values (值-) creat ...
- iView学习笔记(三):表格搜索,过滤及隐藏列操作
iView学习笔记(三):表格搜索,过滤及隐藏某列操作 1.后端准备工作 环境说明 python版本:3.6.6 Django版本:1.11.8 数据库:MariaDB 5.5.60 新建Django ...
- 学习笔记之数据可视化(二)—— 页面布局(下)
续上一章 2.7 地图区域(.map) 2.7.1 实现步骤: 2.8 用户统计模块 2.8.1 布局: 2.8.2 柱状图 2.9 订单模块 2.9.1 订单区域布局 2.9.2 订单区域(orde ...
最新文章
- Linux 平台一种进程代码注入方法
- React Native获取手机的各种高度
- matlab均线程序化交易,【策略分享】Matlab量化交易策略源码分享
- 怎么获取插入的最新自动生成的ID
- 最短路径(迪杰斯特拉算法)
- android 万能倒计时,时分秒倒计时
- SQL SERVER 备份数据库到指定路径语句
- Atitit php pdo的api使用 目录 1.1. PHP PDO简介	1 1.2. 若要使用数据库长连接,:PDO::ATTR_PERSISTENT	1 2. 其他设置	2 2.1. )、P
- python反编译安卓_APK反编译得工具总结(转载)
- python 爬虫基础——淘宝评论
- 光伏蓄电池单相并网模型。光伏+MPPT+boost升压电路+桥式逆变 带参考文件,模型说明文件
- Ubuntu安装桌面环境以及远程桌面连接
- echarts 时间轴处理_图样图森破-pyecharts之时间轴
- Pytorch基础知识之pth文件与DataLoader数据加载器
- 服务器跑项目,如何使用远程服务器跑项目
- 常用linux 命令 -网络相关
- 烽火2640路由器命令行手册-07-安全配置命令
- 类 ApplicationInfo详解
- freemarker 遍历 map
- Linux实战(一):服务器应用迁移