《文本文件单词的检索与计数》由会员分享,可在线阅读,更多相关《文本文件单词的检索与计数(15页珍藏版)》请在人人文库网上搜索。

1、文本文件单词的检索与计数专业:软件工程 班级: 1227班 姓名: 王晓春 学号: 2012005774 同组人:王晓春 闫瑞娟 张泽磊 组长:王晓春 完成日期: 2014.6.25 一【问题描述】串是非数值处理中的主要对象,如在信息检索、文本编辑、符号处理等许多领域,得到越来越广泛的应用。在高级语言中也引入了串数据类型概念,并且串变量与其他变量(如整型、实型等)一样,可以进行各种运算。然而,在各种不同类型的应用中,所处理的串有不同的特点,要想有效地实现串的处理,就必须熟悉串的存储结构及其基本运算。本课程设计的目的就是熟悉串类型的实现方法和文本模式匹配方法,熟悉如何利用模式匹配算法实现一般的文。

2、本处理技术。本课程设计分两步:首先,设计出串定位算法(即模式匹配算法)及其实现;然后,再利用串定位算法设计文本文件的检索及单词的计数等操作。二【设计需求及分析】1.设计要求1.1串模式匹配算法的设计要求在串的基本操作中,在主串中查找模式串的模式匹配算法即求子串位置的函数Index(S,T),是文本处理中最常用、最重要的操作之一。所谓子串的定位就是求子串在主串中首次出现的位置,又称为模式匹配或串匹配。模式匹配的算法很多,在这里只要求用最简单的朴素模式匹配算法。该算法的基本思路是将给定子串与主串从第一个字符开始比较,找到首次与子串完全匹配的子串为止,并记住该位置。但为了实现统计子串出现的个数,不仅。

3、需要从主串的第一个字符位置开始比较,而且需要从主串的任一给定位置检索匹配字符串,所以,首先要给出两个算法:1标准的朴素模式匹配算法2给定位置的匹配算法1.2文本文件单词的检索与计数的设计要求要求编程建立一个文本文件,每个单词不包含空格且不跨行,单词由字符序列构成且区分大小写;统计给定单词在文本文件中出现的总次数;检索输出某个单词出现在文本中的行号、在该行中出现的次数以及位置。该设计要求可分为三个部分实现:其一,建立文本文件,文件名由用户用键盘输入;其二,给定单词的计数,输入一个不含空格的单词,统计输出该单词在文本中的出现次数;其三,检索给定单词,输入一个单词,检索并输出该单词所在的行号、该行中。

4、出现的次数以及在该行中的相应位置。1建立文本文件2给定单词的计数3检索单词出现在文本文件中的行号、次数及其位置4主控菜单程序的结构2.概要设计示例如下:2.6算法设计 朴素模式匹配算法该算法的基本思想是:设有三个指针i,j,k,用i指示主串S每次开始比较的位置;指针j,k分别指示主串S和模式串T中当前正在等待比较的字符位置;一开始从主串S的第一个字符(i=0;j=1)和模式T的第一个字符(k=0)比较,若相等,则继续逐个比较后续字符(j+,k+)。否则从主串的下一个字符(i+)起再重新和模式串(j=0)的字符开始比较。依此类推,直到模式T中的所有字符都比较完,而且一直相等,则称匹配成功,并返回。

5、位置i;否则返回-1,表示匹配失败。顺序串的模式匹配算法如下:int index(SString S, SString T) /求子串T在主串S中首次出现的位置int i,j,k,m,n;m=T.length; /模式串长度赋mn=S.length; /目标串长度赋nfor (i=0; i=s2.length)return i- s2.length; /表示s1中存在s2,返回其起始位置elsereturn -1; /表示s1中不存在s2, 返回-1 /函数结束说明:以上两个算法可统一为一个算法,即在子串定位算法Index(S,T)的参数中增加一个起始位置参数即可。2.7各模块及其伪码:1.建。

6、立文本文件建立文件的实现思路是:(1)定义一个串变量;(2)定义文本文件;(3)输入文件名,打开该文件;(4)循环读入文本行,写入文本文件,其过程如下:While (不是文件输入结束) 读入一文本行至串变量;串变量写入文件;输入是否结束输入标志;(5)关闭文件。2给定单词的计数该功能需要用到前一节中设计的模式匹配算法,逐行扫描文本文件。匹配一个,计数器加1,直到整个文件扫描结束;然后输出单词出现的次数。其实现过程如下:(1)输入要检索的文本文件名,打开相应的文件;(2)输入要检索统计的单词;(3)循环读文本文件,读入一行,将其送入定义好的串中,并求该串的实际长度,调用串匹配函数进行计数。具体描。

7、述如下:While (不是文件结束) 读入一行并到串中;求出串长度;模式匹配函数计数;(4)关闭文件,输出统计结果。3.检索单词出现在文本文件中的行号、次数及其位置这个设计要求与上一个类似,但要相对复杂一些。其实现过程描述如下:(1)输入要检索的文本文件名,打开相应的文件;(2)输入要检索统计的单词;(3)行计数器置初值0;(4)while (不是文件结束) 读入一行到指定串中;求出串长度;行单词计数器置0;调用模式匹配函数匹配单词定位、该行匹配单词计数;行号计数器加1;If (行单词计数器!=0)输出行号、该行有匹配单词的个数以及相应的位置;2.8函数调用关系主程序CreatTextFile。

8、()SubStrCount() SubStrInd()PartPosition()三【设计功能的实现】#include stdafx.h#include#include#define MaxStrSize 256 /根据用户需要自己定义大小typedef structchar chMaxStrSize; /ch是一个可容纳256个字符的字符数组int length;SString; /定义顺序串类型int PartPosition(SString s1, SString s2, int k)/检索单词出现在文本文件中的位置int i, j;i=k-1; /扫描s1的下标,因为c中数组下标是从0。

9、开始,串中序号相差1j=0; /扫描s2的开始下标while (i=s2.length)return i-s2.length;else return -1; /表示s1中不存在s2,返回-1/表示s1中不存在s2,返回其起始位置 /函数结束void CreatTextFile()SString S;char fname10, yn;FILE *fp;printf(输入要建立的文件名: );scanf(%s, fname);fp=fopen(fname,w);yn=n; /输入结束标志初值while(yn=n|yn=N)printf(请输入一行文本:);gets(S.ch);gets(S.ch)。

10、;S.length=strlen(S.ch);fwrite(&S, S.length, 1, fp);fprintf(fp,%c, 10); /是输入换行printf(结束输入吗?y or n: );yn=getchar();fclose(fp); /关闭文件printf(建立文件结束!);void SubStrCount()FILE *fp;SString S,T; /定义两个串变量char fname10;int i=1,j,k;printf(输入文本文件名: );scanf(%s, fname);fp=fopen(fname ,r);printf(输入要计数的单词或字符串:);scanf。

11、(%s, T.ch);T.length=strlen(T.ch);while(!feof(fp)/扫描整个文件文本/fread(&S.ch,1,sizeof(S),fp); /读入一行文本memset(S.ch,0, 256);fgets(S.ch,100,fp);S.length=strlen(S.ch);k=0; /初始化开始检索位置while(k0)printf(行号:%d , 次数:%d, 位置分别为:,l, i);for(m=1;mvoid CreateMGraph(MGraph *G,int n,int e)int i,j,k,w;for(i=1;ivexsi=(char)i;fo。

12、r(i=1;iarcsij=Maxint;printf(输入%d条边的i,j及w:n,e);for(k=1;karcsij=w;printf(有向图建立完毕n);三停车场管理专业:软件工程 班级: 1227班 姓名: 张泽磊 学号: 2012005779 同组人:张泽磊 王晓春 闫瑞娟 组长:张泽磊 完成日期: 2014.6.25 一【问题描述】设停车场是一个可停放n辆汽车的狭长通道,且只有一个大门可供汽车进出。汽车在停车场内按车辆到达时间的先后顺序,依次由北向南排列(大门在最南端,最先到达的第一辆车停放在停车场的最北端),若停车场内已停满n辆汽车,则后来的汽车只能在门外的便道上等候,一旦有车。

13、开走,则排在便道上的第一辆车即可开入;当停车场内某辆车要离开时,在它之后进入的车辆必须先退出车场为它让路,待该辆车开出大门外,其他车辆再按原次序进入车场,每辆停放在车场的车在它离开停车场时必须按它停留的时间长短交纳费用。试为停车场编制按上述要求进行管理的模拟程序。二【设计需求及分析】以栈模拟停车场,以队列模拟车场外的便道,按照从终端读入的输入数据序列进行模拟管理。每一组输入数据包括三个数据项:汽车“到达”或“离去”信息、汽车牌照号码以及到达或离去的时刻。对每一组输入数据进行操作后的输出信息为:若是车辆到达,则输出汽车在停车场内或便道上的停车位置;若是车辆离去,则输出汽车在停车场内停留的时间和应。

14、交纳的费用(在便道上停留的时间不收费)。栈以顺序结构实现,队列以链表结构实现。3.栈和队列的定义(部分代码)typedef struct carqueue / 链队LPTCARNODE lpHead; / 头结点LPTCARNODE lpRear; / 指向当前队尾的指针int nEffectiveSize; / 当前队中元素个数 TCARQUEUE, *LPTCARQUEUE;4.栈和队列的初始化(部分代码)void InitQueue( LPTCARQUEUE &lpCarQueue )lpCarQueue = ( LPTCARQUEUE ) malloc( sizeof( TCARQUE。

15、UE ) );lpCarQueue-lpHead = ( LPTCARNODE) malloc( sizeof( TCARNODE ) );lpCarQueue-lpHead-lpNext = NULL;lpCarQueue-lpRear = lpCarQueue-lpHead;lpCarQueue-nEffectiveSize = 0;void InitStack( LPTCARSTACK &lpCarStack, int nSize )lpCarStack = ( LPTCARSTACK ) malloc( sizeof ( TCARSTACK ) );lpCarStack-lpCarInformation = ( LPTCARINFORMATION ) malloc(nSize * sizeof ( TCARINFORMATION );lpCarStack-nTop = -1;lpCarStack-nStackSize = nSize;15 / 15。

文本文件单词的检索与计数c语言,文本文件单词的检索与计数相关推荐

  1. c语言中的单词的意思及作用,C语言实现单词助手功能

    本文实例为大家分享了C语言实现单词小助手的具体代码,供大家参考,具体内容如下 单词小助手 (声明:此程序非原创,是在已有程序上进行一些修改和添加) 一.题目分析 题目要求: 1.改写程序为良好程序风格 ...

  2. c语言字符统计2sdut,C语言实验——单词统计(字符串) SDUT

    C语言实验--单词统计 Problem Description 从键盘输入一行字符(长度小于100),统计其中单词的个数,各单词以空格分隔,且空格数可以是多个. Input 输入只有一行句子.仅有空格 ...

  3. python输入一个英文句子、统计单词个数_C语言编程求一个英文句子中的单词数和最长单词的位置、长度及输出这个单词。c++编程 从键盘输入一个英文...

    C语言编程求一个英文句子中的单词数和最长单词的位置.长度及输出这个单词. c++编程 从键盘输入一个英文 www.zhiqu.org     时间: 2020-11-23 我刚做了一关于英文句子里面每 ...

  4. c语言背单词系统.doc,背单词系统

    用c语言编写的背单词系统 1.题目描述 背单词 该系统是帮助学生背诵单词的软件,要求用户可以选择背诵的词库,并可以编辑自己的词库,系统可以给出中文,让学生输入其英文意思,也可输出英文让学生输入中文意思 ...

  5. R语言禁止数值表示为科学计数法实战(Turn Off Scientific Notation ):全局设置或者单变量设置

    R语言禁止数值表示为科学计数法实战(Turn Off Scientific Notation ):全局设置或者单变量设置 目录

  6. 实现统计一个字符串中的每个单词出现的次数--基于Go语言

    实现统计一个字符串中的每个单词出现的次数–基于Go语言 package mainimport ("fmt""strings" )func main() {//统 ...

  7. C语言怎么实现单词下落,如何用c语言实现单词统计

    如何用c语言实现单词统计 输入一串字符串,输出其中有多少个单词. 代码如下:#include #include #define SIZE 20 int main(){ char str[SIZE]={ ...

  8. Bleve:来自Couchbase、基于Go语言的全文索引与检索库

    Bleve是一个由Couchbase 团队基于Go语言开发的索引/检索库,它支持常用的检索和索引功能,如索引.检索.过滤.排序.聚合.高亮等.Bleve包括常见的文本分析组件,且能够使用现有的K/V存 ...

  9. c语言 程序统计注释比例,C语言统计单词数量程序 超详解

    /*************************************************************************************************** ...

  10. c语言常用单词表格,C语言常用单词

    C语言常用单词 贡献者:游客10727681 类别:英文 时间:2016-09-19 19:31:53 收藏数:131 评分:2.5 返回上页 举报此文章 请选择举报理由: 广告/谣言/欺诈 政治敏感 ...

最新文章

  1. 关于MSSQL存储过程中使用游标的一个小例子(学习)
  2. java 内存模型堆和本地方法
  3. LibreOj 6279数列分块入门 3 练习了一下set
  4. 双机调试和windbg的命令
  5. Rxjs merge 学习笔记
  6. java第一天上班需要安装那些_明天第一天上班,应该带什么包啊
  7. python匿名函数调用_python中引用局部变量的匿名函数
  8. 拟态个人主页UI源码开源
  9. Identity of indiscernibles(不可分与同一性)
  10. 【2013】【论文笔记】利用graphene产生THz——
  11. CSV文件转换成shp文件后通过IDW法插值处理生成栅格
  12. 《快速掌握PyQt5》第二十三章 主窗口QMainWindow
  13. 导体接地时的静电平衡问题
  14. 苹果手机连接电脑没反应
  15. 张飞硬件第三章(一)
  16. Python学习笔记 之 从入门到放弃
  17. php 友盟推送角标,android集成友盟推送实现离线在线推送及桌面图标角标设置
  18. 基于Matlab GUI的简易数字均衡器设计
  19. 基于 Alfred Workflow 的开发效率小工具
  20. gige vision协议栈

热门文章

  1. Flink_Flink ON YARN containerized.heap-cutoff-min 内存调整
  2. 【转载】Java并发编程:volatile关键字解析 by 海子
  3. 网络抓包工具Wireshark下载安装使用详细教程
  4. PHP上传视频到阿里云oss
  5. 服务器无线桥接怎么设置,路由器怎么设置桥接方法 2个路由器无线桥接设置图解...
  6. 锂电池放空后充不进电_锂电池放置太久无法充电 血的教训!
  7. 使用 JMeter的性能测试
  8. 【工具】PPT插入高清图片保存后图片变模糊的解决方法
  9. PIC16F877A与Proteus仿真-4位7段数码管驱动
  10. Q-Q图和P-P图傻傻整不明白?