统计词频 matlab,批量统计若干类词频总数方法
因研究需要统计语料中的实词总数,如果时间允许,当然可以一个一个去数。不过这种方法在今天似乎是不可行的,时间不允许不说,出现的错误对研究造成影响也不划算。
原本想通过AntConc的Advanced
Search基于文件的检索功能来完成。该文件中放入实词的符码,这样就一次性完成一批检索了。文件中实词词性符码以及相应的检索表达式如下:
*/n
*/nt
*/nd
*/nl
*/ni
*/nhf
*/nhg
*/ns
*/ni
*/nz
*/v
*/vd
*/vl
*/vu
*/a
*/f
*/m
*/q
*/mq
*/d
不过实践了一下并没有动静。AntConc的反馈是“No seach term has been
entered ”。看来AntConc并不认识以上表达式。
取消其中的Wildcart变成
/n
/nt
/nd
/nl
/ni
/nhf
/nhg
/ns
/ni
/nz
/v
/vd
/vl
/vu
/a
/f
/m
/q
/mq
/d
这次同样没有结果。不知是什么原因。最后,只好使用正常的检索功能,不过还是不想一个一个去检索,因为正常检索中有一个OR的逻辑表达式,即用竖线“|”将不同的检索项分开,就可以将若干项通过OR的逻辑表达式来检索了。这次的表倒式为:*/n|*/nt|*/nd|*/nl|*/ni|*/nhf|*/nhg|*/ns|*/ni|*/nz|*/v|*/vd|*/vl|*/vu|*/a|*/f|*/m|*/q|*/mq|*/d|
幸运,这次AntConc启动了,并且有了结果:
虽然结果已经出来了,但是疑问还在,前面两种方法问题出在哪里呢?
统计词频 matlab,批量统计若干类词频总数方法相关推荐
- Hadoop实现词频统计(按照词频降序排列以及相同词频的单词按照字母序排列)
Hadoop实现词频统计(按照词频降序排列以及相同词频的单词按照字母序排列) 一.环境 二.实现步骤 1.数据 2.主函数 3.第一个MapReduce Map Reduce 4.第二个MapRedu ...
- 教你用java统计目录下所有文档的词频
本文是统计目录下所有文档的词频top10,非单个文档,包含中文和英文. 直接上代码: 1 package com.huawei.wordcount; 2 3 import java.io.Buffer ...
- 概率和统计的matlab指令
1.描述性统计分析 描述性统计分析函数标准用法都是对列状数据进行操作. mean(X):当X为向量,返回向量的均值:当X为矩阵,返回矩阵的每列元素均值构成的行向量. min,max,sort,mea ...
- Matlab概率统计编程指南
Matlab概率统计编程指南 第4章 概率统计 本章介绍MATLAB在概率统计中的若干命令和使用格式,这些命令存放于MatlabR12\Toolbox\Stats中. 4.1 随机数的产生 4.1.1 ...
- matlab中unifrnd函数用法,概率和统计的MATLAB指令
1.描述性统计分析 描述性统计分析函数标准用法都是对列状数据进行操作. meam(X):当X为向量,返回向量的均值:当X为矩阵,返回矩阵的每列元素均值构成的行向量.min,max,sort,mean, ...
- matlab 字数统计,matlab中数据及统计描述和分析.doc
matlab中数据及统计描述和分析 第十章 数据的统计描述和分析 数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计是以概率论为基础的一门应用学科. 数据样本少则几个,多则成千上万 ...
- 基于canny边缘检测、形态学、区域统计实现MATLAB的纽扣计数
纽扣计数的MATLAB实现 本文内容较多,读者可以针对性的阅读. 一.问题背景及描述 在服装厂的仓库里,一些管理人员工作时需要清点衣服配件的数量,如纽扣,拉链,线团等等,采用人工的方式进行清点的效率较 ...
- 多元统计分析matlab,MATLAB的统计工具箱中的多元统计分析中提供了聚类分析的两种方法...
MATLAB的统计工具箱中的多元统计分析中提供了聚类分析的两种方法: 1.层次聚类hierarchical clustering 2.k-means聚类 这里用最简单的实例说明以下层次聚类原理和应用发 ...
- Arcgis教程:如何批量统计网格内的线段长度。
在工作中,需要将上海市网格化,并统计各网格内的道路长度,进而可以得知网格内的道路密度. 先采用arcgis内置的标识(identity)工具,输入道路要素,以及网格面要素,对道路线要素进行标识. 需要 ...
最新文章
- R语言与数据分析(2)-R语言简介
- 域滤波:方框、高斯、中值、双边滤波
- snmp 获取 虚拟机硬盘_服务器出故障了怎么办?SNMP告警七步走
- C/C++笔试题目大全
- 如何找出SAP Fiori launchpad URL start_up请求发起的具体位置
- 工程图标注粗糙度_Inventor教程之工程图标注实例
- 【数据结构与算法】循环队列的Java实现
- Spring基础——AOP
- spark broadcast的TorrentBroadcast实现
- alin39048错误原因_支付宝支付ALIN10146错误
- free mobile sex java_Java 8中Stream API的这些奇技淫巧!你都Get到了吗?
- 基于Java+SpringBoot+vue+node.js的智能农场管理系统详细设计和实现
- 联想服务器TS540装系统蓝屏,联想装win7蓝屏0x000000a5超详细图文解决方案
- 攻防世界 ics-05
- [LeetCode] 969. 煎饼排序
- 工作记录 io流写入linux文件
- 室内定位技术及机场方案建议
- C#可以直接调用的Win32API
- 理解 LDA 主题模型
- hosts屏蔽网站以及代理越过屏蔽