Word frequency program 词频分析程序
词频分析报告
1)计划时间:
单词类Word:30min
主函数Main:30min
单词计数类CountWord:3h
2)实际时间:
单词类Word:30min
主函数Main:30min
单词计数类CountWord:4h
3)性能优化所用时间:4h
4)共10组测试数据,其中5组正常模式,5组扩展模式
分别用了5个例子分别用正常模式和扩展模式运行运行一遍,分别是一篇常规英语文章,一个代码文件夹,一个空文件夹,一个大小写敏感测试文件,一个超大文件夹。
5)收获
熟悉了C#接口的用法;
起初准备用有限自动机写,后来发现有些麻烦,使用了正则表达式来匹配,熟悉了正则表达式的使用;
了解了C#中文件读写的方法与规范。
转载于:https://www.cnblogs.com/yao9208/archive/2012/09/24/2700756.html
Word frequency program 词频分析程序相关推荐
- Python:实现word frequency functions词频函数算法(附完整源码)
Python:实现word frequency functions词频函数算法 import string from math import log10 def term_frequency(term ...
- Individual Project - Word frequency program-11061171-MaoYu
BUAA Advanced Software Engineering Project: Individual Project - Word frequency program Ryan Mao (毛 ...
- 一个简单的词频分析统计程序
花了点时间做了一个词频分析统计程序,分析了<失控>英文版(out_of_control)--Kevin_Kelly 的词频.要想流利的阅读英语文章,词汇量应该达到2万左右. 从词频分析来看 ...
- python单词词频字典_用python实现词频分析+词云
2020.05.13更新:大家点个赞再收藏吧(点赞后观看,养成好习惯)TAT 如你所见.文章标题图是以 周杰伦的百度百科 词条为分析文档,以 周杰伦超话第一的那张图+PPT删除背景底色 为词频背景进行 ...
- python爬取微博评论并做词频分析_爬取李子柒微博评论并分析
爬取李子柒微博评论并分析 微博主要分为网页端.手机端和移动端.微博网页版反爬太厉害,因此选择爬取手机端. 1 需求 爬取李子柒微博中视频的评论信息,并做词频分析. 2 方法 2.1 运行环境 运行平台 ...
- 词频分析--字典树的应用
词频分析–字典树的应用 字典树又称单词查找树,Trie树,前缀树,是一种树形结构,是一种哈希树的变种. 典型应用是用于统计,排序和保存大量的字符串所以经常被搜索引擎系统用于文本词频统计. 它的优点是: ...
- 用javascript自制ctf词频分析工具
不废话,上代码: <!DOCTYPE html> <html> <head><title></title> </head> &l ...
- python 对excel文件进行分词并进行词频统计_python 词频分析
python词频分析 昨天看到几行关于用 python 进行词频分析的代码,深刻感受到了 python 的强大之处.(尤其是最近自己为了在学习 c 语言感觉被它的语法都快搞炸了,python 从来没有 ...
- jieba库词频统计_网购评论之词频分析
日常数据分析中,词频分析是一个很好的文本挖掘方法,这篇文章说说词频分析方法. 这里选用京东商场中购买手机的部分数据信息,利用jieba词库对购物评论进行分词,提取客户群体对手机的关注点. 数据集来源: ...
- python数据挖掘学习笔记】十三.WordCloud词云配置过程及词频分析
#2018-03-28 09:59:40 March Wednesday the 13 week, the 087 day SZ SSMR 11,12因为涉及到数据库被我暂时放弃了 python数据挖 ...
最新文章
- mysqld服务器系统变量和状态变量
- 多股Litz线制作无线耦合线圈测试
- 【PAT (Advanced Level) Practice】1054 The Dominant Color (20 分)
- 【深度学习】CNN在大规模图像数据集上的应用(基于keras和MNIST)
- UCenter实现同步登陆原理
- 机器学习 -- 信息论
- spring jpa 流式_从响应式Spring Data存储库流式传输实时更新
- android gb2312 utf-8,不同编码页面之间用form传值出现乱码问题解决方案 utf-8 到 gb2312...
- 标准正态均一性检验 matlab程序,多种均一性检验方法比较研究
- 基于JAVA+SpringMVC+Mybatis+MYSQL的早教管理系统
- 麒麟系统下安装win10_win10系统安装图文详细教程
- python读取dat文件代码-基于python批量处理dat文件及科学计算方法详解
- python manage.py makemigrations执行完无反应的解决办法
- video Station 支持字幕格式
- 微信小游戏马甲包过审(马甲包过包)
- VR/AR工作原理、目前存在的技术问题
- 虚拟机显示网络不可用
- linux黄颜色文件,了解 Linux 文件的颜色代码
- pmml(模型标准化)
- 一分钟实现内网穿透(ngrok服务器搭建)