因研究需要统计语料中的实词总数,如果时间允许,当然可以一个一个去数。不过这种方法在今天似乎是不可行的,时间不允许不说,出现的错误对研究造成影响也不划算。

原本想通过AntConc的Advanced

Search基于文件的检索功能来完成。该文件中放入实词的符码,这样就一次性完成一批检索了。文件中实词词性符码以及相应的检索表达式如下:

*/n

*/nt

*/nd

*/nl

*/ni

*/nhf

*/nhg

*/ns

*/ni

*/nz

*/v

*/vd

*/vl

*/vu

*/a

*/f

*/m

*/q

*/mq

*/d

不过实践了一下并没有动静。AntConc的反馈是“No seach term has been

entered ”。看来AntConc并不认识以上表达式。

取消其中的Wildcart变成

/n

/nt

/nd

/nl

/ni

/nhf

/nhg

/ns

/ni

/nz

/v

/vd

/vl

/vu

/a

/f

/m

/q

/mq

/d

这次同样没有结果。不知是什么原因。最后,只好使用正常的检索功能,不过还是不想一个一个去检索,因为正常检索中有一个OR的逻辑表达式,即用竖线“|”将不同的检索项分开,就可以将若干项通过OR的逻辑表达式来检索了。这次的表倒式为:*/n|*/nt|*/nd|*/nl|*/ni|*/nhf|*/nhg|*/ns|*/ni|*/nz|*/v|*/vd|*/vl|*/vu|*/a|*/f|*/m|*/q|*/mq|*/d|

幸运,这次AntConc启动了,并且有了结果:

虽然结果已经出来了,但是疑问还在,前面两种方法问题出在哪里呢?

统计词频 matlab,批量统计若干类词频总数方法相关推荐

  1. Hadoop实现词频统计(按照词频降序排列以及相同词频的单词按照字母序排列)

    Hadoop实现词频统计(按照词频降序排列以及相同词频的单词按照字母序排列) 一.环境 二.实现步骤 1.数据 2.主函数 3.第一个MapReduce Map Reduce 4.第二个MapRedu ...

  2. 教你用java统计目录下所有文档的词频

    本文是统计目录下所有文档的词频top10,非单个文档,包含中文和英文. 直接上代码: 1 package com.huawei.wordcount; 2 3 import java.io.Buffer ...

  3. 概率和统计的matlab指令

    1.描述性统计分析 描述性统计分析函数标准用法都是对列状数据进行操作. mean(X):当X为向量,返回向量的均值:当X为矩阵,返回矩阵的每列元素均值构成的行向量.  min,max,sort,mea ...

  4. Matlab概率统计编程指南

    Matlab概率统计编程指南 第4章 概率统计 本章介绍MATLAB在概率统计中的若干命令和使用格式,这些命令存放于MatlabR12\Toolbox\Stats中. 4.1 随机数的产生 4.1.1 ...

  5. matlab中unifrnd函数用法,概率和统计的MATLAB指令

    1.描述性统计分析 描述性统计分析函数标准用法都是对列状数据进行操作. meam(X):当X为向量,返回向量的均值:当X为矩阵,返回矩阵的每列元素均值构成的行向量.min,max,sort,mean, ...

  6. matlab 字数统计,matlab中数据及统计描述和分析.doc

    matlab中数据及统计描述和分析 第十章 数据的统计描述和分析 数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计是以概率论为基础的一门应用学科. 数据样本少则几个,多则成千上万 ...

  7. 基于canny边缘检测、形态学、区域统计实现MATLAB的纽扣计数

    纽扣计数的MATLAB实现 本文内容较多,读者可以针对性的阅读. 一.问题背景及描述 在服装厂的仓库里,一些管理人员工作时需要清点衣服配件的数量,如纽扣,拉链,线团等等,采用人工的方式进行清点的效率较 ...

  8. 多元统计分析matlab,MATLAB的统计工具箱中的多元统计分析中提供了聚类分析的两种方法...

    MATLAB的统计工具箱中的多元统计分析中提供了聚类分析的两种方法: 1.层次聚类hierarchical clustering 2.k-means聚类 这里用最简单的实例说明以下层次聚类原理和应用发 ...

  9. Arcgis教程:如何批量统计网格内的线段长度。

    在工作中,需要将上海市网格化,并统计各网格内的道路长度,进而可以得知网格内的道路密度. 先采用arcgis内置的标识(identity)工具,输入道路要素,以及网格面要素,对道路线要素进行标识. 需要 ...

最新文章

  1. R语言与数据分析(2)-R语言简介
  2. 域滤波:方框、高斯、中值、双边滤波
  3. snmp 获取 虚拟机硬盘_服务器出故障了怎么办?SNMP告警七步走
  4. C/C++笔试题目大全
  5. 如何找出SAP Fiori launchpad URL start_up请求发起的具体位置
  6. 工程图标注粗糙度_Inventor教程之工程图标注实例
  7. 【数据结构与算法】循环队列的Java实现
  8. Spring基础——AOP
  9. spark broadcast的TorrentBroadcast实现
  10. alin39048错误原因_支付宝支付ALIN10146错误
  11. free mobile sex java_Java 8中Stream API的这些奇技淫巧!你都Get到了吗?
  12. 基于Java+SpringBoot+vue+node.js的智能农场管理系统详细设计和实现
  13. 联想服务器TS540装系统蓝屏,联想装win7蓝屏0x000000a5超详细图文解决方案
  14. 攻防世界 ics-05
  15. [LeetCode] 969. 煎饼排序
  16. 工作记录 io流写入linux文件
  17. 室内定位技术及机场方案建议
  18. C#可以直接调用的Win32API
  19. 理解 LDA 主题模型
  20. hosts屏蔽网站以及代理越过屏蔽

热门文章

  1. Android Paint 抗锯齿画线模糊
  2. 比特同步和帧同步的区别
  3. 7.MPLS VP恩 后门链路shamlink
  4. css3新增动画属性(过度动画 变形动画 关键帧动画)
  5. 大数据项目实战——基于某招聘网站进行数据采集及数据分析(四)
  6. 免费杀软佼佼者——小红伞Avira及去广告技巧
  7. [单片机][cx32][填坑日记] 从AC5到AC6 flash写入功能异常
  8. lync2013之边缘服务器的部署
  9. 蓝牙核心技术概述(二):蓝牙使用场景
  10. InDesign 教程如何创建风格化的书籍封面?