词频分析及常用工具比较研究.pdf

图书馆学刊 2016 军第6 期

TUSHUGUANXUEKAN NO.6 , 2016 …llfal萄园揭!'

词频分析及常用工具比较研究*

左丽华

(浙江工业大学图书馆,浙江杭州I 310023)

[摘 要]首先梳理了词频分析的一般过程并对现有词频分析工具总结归类。在此基础上,从软件基本信息、支持

数据类型、数据预处理、数据分析与结果导出等方面对国内常用词频分析工具Bibexcel、 CiteSpace 和SATI进行了比较

分析。并以WOS数据库为数据源,对3 个软件实际分析结果进行比较,以期为科研人员使用词频分析方法提供有益

的帮助。

[关键词]词频分析 Bibexcel CiteSpace SATI

[分类号]G252.8

策略的制定对最后的结果分析有直接影响;检索并评估检索

1 词频分析及现状

结果,如果首次检索结果不理想需重新调整检索策略再次进

词频分析是文献计量学中传统的和具有代表性的一种

行检索:数据采集下载,通过人工判读删除无用数据,然后下

内容分析方法,基本原理是通过词出现频次多少的变化,来

载数据。数据清洗加工,词频分析最终结果的可靠性很大程

确定热点及其变化趋势[町,目前巳经在各学科领域得到广泛

度上依赖于原始数据的准确性,清洗对下载的数据进行筛

应用。笔者通过对国内文献调研发现,国内研究人员多运用

选、去重和勘误,常常需要人工识别。最后是数据分析,借助

一种分析工具对特定学科领域某个时间段的文献所使用的

分析工具对下载的题录数据进行抽取,从标题、摘要或关键

关键词进行分析,依据分析结果确定特定学科研究热点。已

词抽取的词汇,根据关键词的词频数,选定高频关键词,对高

有的研究成果侧重特定词频分析工具在具体领域的应用,对

频关键词详细分析,除了统计分析还可以进行深入的文本挖

词频分析过程及分析工具本身的探讨较少。由于词频分析

掘和可视化。这些过程结束之后对结果进行解释并得到一

工具众多且分析过程各有差异,利用不同的分析软件处理相

些结论。

同的数据所得结果也不尽相同。因此有必要对词频分析的

3 词频分析工具类型

过程进行梳理,并对词频分析工具进行对比研究。该研究有

助于研究人员在定性判断领域研究热点基础上,快速地选择

计量分析中常用的词频分析工具可分为3 类:①研究人

词频分析工具对领域研究热点进行→个量的判断。

员自主开发软件,编写程序实现相关题录信息的处理,如《基

2 词频分析过程 于词频分析的国内情报学研究热点沪一文,作者选用了Java

语言编程实现关键词抽取和统计。这种方法要求研究人员

词频分析一般的过程主要分为数据检索、清洗加工、词

具有→定的编程水平。②利用SPSS、 Excel、 NoteEx

spss可以关键词词频分析吗_词频分析及常用工具比较研究.pdf相关推荐

  1. 电路分析导论_生存分析导论

    电路分析导论 In our extremely competitive times, all businesses face the problem of customer churn/retenti ...

  2. ahp层次分析法_层次分析法在历史街区研究中的应用简析

    摘要 AHP (Analytic Hierarchy Process)层次分析法通常被运用于解决多目标.多标准.多要素.多层次的非结构化的复杂决策性问题,特别是战略决策性问题,在建筑.规划.风景园林等 ...

  3. rda冗余分析步骤_群落分析的典范对应分析(CCA)概述

    典范对应分析(CCA)与去趋势典范对应分析(DCCA)概述典范对应分析(canonical correspondence analysis,CCA)是单峰约束排序方法,是对应分析(CA)与多元回归的结 ...

  4. eds能谱图分析实例_成分分析的四大神器—XRF、ICP、EDX和WDX

    成分分析技术主要用于对未知物.未知成分等进行分析,通过成分分析技术可以快速确定目标样品中的各种组成成分是什么,帮助实验人员对样品进行定性定量分析,鉴别等.今天,小析姐就给大家介绍四种成分分析的常见设备 ...

  5. python 情感分析实例_情感分析实例

    以下的样本代码用Pyhton写成,主要使用了scrapy, sklearn两个库. 所以,什么是情感分析(Sentiment Analysis)? 情感分析又叫意见挖掘(Opinion Mining) ...

  6. seo排名工具_网站排名优化常用工具

    SEO常用的工具有哪些?这个问题应该是比较小白的,但是今天要讲的应该是网站快速提升网站排名的工具,懂SEO的各位站长对网站基础优化所用的工具都是比较了解的,这个放在文章后面给大家讲解,先说一下快速提升 ...

  7. python唐诗分析综合_全唐诗分析程序

    全唐诗分析程序 这个程序最初的诞生是为了写微信公众号的两篇文章,那两篇文章的也大致讲解了程序的原理和流程. 因此,在使用程序之前,强烈建议您先读这两篇文章: 相应的,程序也主要有两个方面的功能: 分析 ...

  8. 熊猫烧香分析报告_熊猫分析进行最佳探索性数据分析

    熊猫烧香分析报告 目录 (Table of Contents) Introduction介绍 Overview总览 Variables变数 Interactions互动互动 Correlations相 ...

  9. 智能情绪分析技术_简单分析人工智能的表现在计算机网络应用技术中的优势

    简单分析人工智能的表现在计算机网络应用技术中的优势 大数据时代背景下, 计算机网络技术迅猛发展, 而人工智能技术的发展也进一步推动了计算机网络技术的发展, 两者相互融合, 相互促进, 实现了双赢发展. ...

  10. python股票分析论文_股票分析与资产组合(python)

    本文利用python3.4进行分析,对财通福享,银华鑫盛和国金鑫新三支股票在2017的情况进行解读,并优化资产组合. 首先导入python相关的库,这里用tushare作为获取数据的入口. impor ...

最新文章

  1. Linux下DIR,dirent,stat等结构体详解(转)
  2. 机器学习经典分类算法 —— C4.5算法(附python实现代码)
  3. 一个简单的mysql存储过程
  4. 颠覆智能床垫技术,喜临门开启“深睡时代”
  5. Matlab R2018a版离线使用帮助文档方法
  6. python列表切片得到的是列表还是字符串_python中列表的切片问题 python arry怎么取列切片...
  7. conda - 虚拟环境,常用指令
  8. Python json使用实例:字符串与对象互转代码示例
  9. webpack --- 使用vue
  10. 怎样实现banner自动播放html,纯CSS3实现banner图片自动轮播效果方式总结
  11. python中元祖 字典 列表的区别_Python中元祖,列表,字典的区别
  12. 如何在《救赎之路》中使用CPU粒子效果
  13. 人工智能的Hello World!
  14. 机器学习大作业_机器学习编程作业6-支持向量机(Python版)
  15. 小米集团招股说明书披露小米专利概况
  16. python编程实例题目
  17. 基于UML的绩效考核管理系统
  18. 慧之声科技- 致AI 2B先驱者
  19. linux root邮箱地址,Linux中自动送给root的mail可以发给互联网上的emai? 爱问知识人...
  20. [论文评析]Density‑based weighting for imbalanced regression,Machine Learning,2021

热门文章

  1. resourcehacker
  2. FastStone Capture 7.7 截图工具下载地址及使用
  3. 游戏动作3d模型素材推荐 精品 小众
  4. 查看.pth文件里面保存了哪些权重及那些权重的shape
  5. 国内外著名PT网站大全
  6. 2016版excel_在抱怨加班之前,先看看你有没有熟练使用这13个Excel大神技巧?
  7. VS2008SP1安装不上
  8. 如何将视频生成二维码
  9. 阿里云手机号短信设置
  10. 小马激活工具对比暴风激活工具