文献挖掘:SATI文献题录信息统计分析工具初试
最近帮王总做了一个文献关键词信息挖掘的简单工作,利用关键词的在不同文章中的共现信息,对关键词进行相似度的比较。主要使用到了SATI这个工具,当然为了把最后所有的图弄出来,还用到了Ucinet6,NetDraw还有spss。主要参考
刘启元, 叶鹰. 文献题录信息挖掘技术方法及其软件SATI的实现——以中外图书情报学为例[J]. 信息资源管理学报,
2012(1):50-58.
1.使用SATI抽取关键词共现信息
这一次做的是国内校园欺凌文献关键词信息的挖掘,拿到手的数据已经是处理好的XML数据(如何从各大平台获得XML形式的数据不在本文讨论范围之内),用SATI直接打开,选择你需要的题录信息,笔者这里需要的是关键词频率,然后依次构建了三类共现矩阵:相似度,相异度和边数。关键词的个数设定为30。点击矩阵按钮等待生成然后保存Excel文件即可。
2.使用Ucinet进行层次聚类分析
层次聚类分析的原理很简单,其实用R语言或者Python写也比较方便,不过为了使用NetDraw画图,需要Uncinet生成的network文件,这里就用Ucinet来聚类了。
Ucinet可以导入Excel文件作为矩阵,这里使用相似度矩阵
点击确定后会在输出文件夹输出Ucinet数据文件,分别是##h文件和##d文件。
用Ucinet打开对应的##h文件,然后就可以再工具菜单中选择聚类分析了。
3.使用NetDraw绘制共现知识网络图谱
直接使用NetDraw打开##h文件即可。
之后可以进行各种编辑。
4.使用Spss进行多维尺度分析
讲道理MDS之前在统计机器学习的课上接触过,但没有自主实现,这次用Spss相当于看看效果。直接用Spss打开Excel文件(相异度矩阵),然后选择多维尺度分析。
将所有关键词作为构建新空间的变量(这个没有全选真的伤),选好参数后就可以输出了。
5.计算关键词类的向心度和密度值
根据层次聚类图和多维尺度分析图,可以将关键词大致分为有意义的类别。采用总和均值法计算类的向心度和密度值, 即聚类向心度为类内所有结点与其他类团内所有结点的边数总和的均值,聚类密度为类内所有结点之间边数总和的均值。类别分好过后,用一个Python程序读取存储边数的共现矩阵然后进行计算就可以轻松搞定了。
文献挖掘:SATI文献题录信息统计分析工具初试相关推荐
- Zotero安装配置插件教程: 多端同步、自动翻译、抓取题录信息、参考文献等
Zotero 作为一款文献管理软件,支持Windows.MacOs.Linux.IOS等,且可以保持多端同步,即在不同的设备和操作系统上(甚至包括网页版)能保持文献.笔记等内容的完全同步 选择 Zot ...
- 知网研学导入文献题录和引用文献的方法
步骤一:在百度学术上找到文献,点击引用 步骤二:在弹出的页面点击RefMan,自动下载文献题录信息,下载后不用对文件改名 步骤三:打开知网研学,点击导入题录 步骤四:在弹出的页面,点击"选择 ...
- 科技文献挖掘工具平台与关键技术综述
摘要 [目的]对科技文献挖掘的主要工具.系统平台和关键技术进行全面系统梳理,指出未来发展趋势,为相关研究提供参考.[方法]通过网络和文献调研等方法梳理科技文献挖掘的历史发展脉络,总结科技文献挖掘的主要 ...
- 如何用python获取文献_[python]eutilities获取文献题录
之前这篇文章(路人乙小明:用entrez eutilities来查pubmed文献)提过如何利用entrez eutilities查找文献.当时在最后面获取论文摘要和题录的部分直接用了text的模式. ...
- Endnote | 如何快速分享文献给别人(包含题录+备注+pdf文件)| endnote保存备份
endnote文献分享与保存备份 一.保存备份 二.压缩库(.enlx) 三.保存备份与压缩库的优缺点 之前写过一篇zotero与endnote之间互转的文章( Zotero | 文献的导入及导出 | ...
- python知网工具,一个中国知网的爬虫工具,给定作者,可以获得该作者的所有文献的题录...
cnki-spyder-tool 一个中国知网的爬虫工具,给定作者,可以获得该作者的所有文献的题录 范例 使用时需要将文件tool.py放在正确的位置 import sys sys.path.appe ...
- 计算机有关的文献检索题目,文献检索第二次计算机检索实习题目(2016.4.10).doc
文档介绍: 第二次计算机检索实****题目本次实****目的是使学生对以下三个外文数据库:PENDEX数据库.荷兰SDOS数据库.德国Springer数据库的使用方法有所了解.通过题目,使学生分别掌握 ...
- 计算机类文献检索考试题,文献检索试题精选2
文献检索试题精选2 1.在SCI E数据库检索高晋生老师发表的文章,检索式正确的是: A.AU=gao jinsheng B.AU=gao js C.AU=js gao D.AU=gao, J-S B ...
- 一种辅助整理知网论文题录文档的方法(Excel、Word)
知网导出的题录文件通常用于NoteExpress.EndNote等文献管理软件,想要做成表格一览无余或是Word文档怎么操作呢? 继之前写过的一篇WoS英文题录翻译整理之后,本次尝试将知网导出的题录文 ...
- python英文文献_python英文文献
php英文文献_计算机软件及应用_IT/计算机_专业资料.php 英文文献翻译及... 浅谈我眼中的 python 吴凡摘要: 作为一门非常有潜力的高级语言,python 正在编程上发挥着越来越大的作 ...
最新文章
- Python数据结构学习笔记——树和图
- AndroidService 深度分析(2)
- BeetleX服务网关授权配置
- python语言中包含的标准数据类型_python标准数据类型(笔记一)
- 三十、详测 Generics Collections: TObjectList、TObjectQueue、TObjectStack
- 【图解+全文】工信部关于印发“十四五”大数据产业发展规划的通知
- 华为的型号命名规则_iQOO新品入网;三星Galaxy S21首张官方渲染图曝光;华为nova8真机曝光...
- 如何在钉钉上开发自己的应用_对企业来说无代码开发平台是否安全
- mysql5.7 密码不过期,mysql5.7 密码过期问题
- 找回计算机管理账户,怎样找回原来的电脑用户账号?
- 华为手机字体改简体_华为手机字体怎么更换简体
- 7.20-7.22作业代码
- 华为设备常用软件包名
- win 7系统怎么看计算机配置,windows7系统怎么查看电脑配置
- Silvaco TCAD仿真8——网格mesh的意义(举例说明)
- 如何在linux centos 环境下运行.exe文件
- GEE:两种遥感影像的中值合成方法
- 成功激励格言精选汇编
- TC358746A/748XBG:MIPI CSI转RGB、RGB转MIPI CSI 东芝转换芯片 ~
- 2020年Redis系列面试题详解
热门文章
- pta c语言编程答案,PTA 程序设计 单选题-期末复习
- Mac上的MySQL可视化工具总结
- 计算机网络方向 CCF推荐会议及期刊
- 优控触摸屏使用手册_中达优控plc触摸屏一体机说明书资料
- 第三篇:DAMA数据管理知识体系
- github 上适合java初学者跟的项目
- 计算机技术证明数学定理,数学要项定理公式证明辞典
- 繁星屠龙软件下载_繁星抢币有什么要求 - 天津政务网
- 服务器提供各种服务 包括文件服务器,服务器提供各种服务,包括文件服务器、邮件服务器、Web服务器等。...
- 如何发挥Intel傲腾持久内存最大能力?