CrtInvertedIdx
2024-04-03 07:20:44
1 // ./CrtInvertedIdx moon.fidx.sort > sun.iidx 2 #include <iostream> 3 #include <fstream> 4 5 using namespace std; 6 7 int main(int argc, char* argv[]) 8 { 9 ifstream ifsImgInfo(argv[1]);//打开输入流 10 if (!ifsImgInfo) { 11 cerr << "Cannot open " << argv[1] << " for input\n"; 12 return -1; 13 } 14 15 string strLine,strDocNum,tmp1=""; 16 int cnt = 0; 17 while (getline(ifsImgInfo, strLine)) { 18 string::size_type idx; 19 string tmp; 20 21 22 idx = strLine.find("\t"); 23 tmp = strLine.substr(0,idx); 24 //得到索引词 25 if (tmp.size()<2 || tmp.size() > 8) continue;//不可能构成中文或者大于最大匹配单元 26 27 if (tmp1.empty()) tmp1=tmp; 28 29 if (tmp == tmp1) {//如果是相同的索引词,则将文档编号追加到strDocNum中 30 strDocNum = strDocNum + " " + strLine.substr(idx+1);//索引词相同,则加起来 31 } 32 else {//索引词不同 33 if ( strDocNum.empty() ) 34 strDocNum = strDocNum + " " + strLine.substr(idx+1); 35 36 cout << tmp1 << "\t" << strDocNum << endl;//输出 37 tmp1 = tmp; 38 strDocNum.clear(); 39 strDocNum = strDocNum + " " + strLine.substr(idx+1); 40 } 41 42 cnt++; 43 //if (cnt==100) break; 44 } 45 cout << tmp1 << "\t" << strDocNum << endl; 46 47 return 0; 48 }
转载于:https://www.cnblogs.com/kakamilan/archive/2012/07/15/2592345.html
CrtInvertedIdx相关推荐
- 北大天网搜索引擎TSE分析及完全注释[6]倒排索引的建立的程序分析(4)
以下是根据正向索引建立倒排索引的注释 int main(int argc, char* argv[]) //./CrtInvertedIdx moon.fidx.sort > sun.ii ...
最新文章
- 计算机科学与技术专业综合二,计算机科学与技术专业综合一第二页
- Android开发之自定义dialog的实现(源代码分享)
- sqlserver compact sdf, sqlite 数据库 在net中相对路径设置方法 - 摘自网络
- python矩阵教程_numpy教程:矩阵matrix及其运算
- CentOS 5.2 安装Apache服务器后无法访问解决方法
- NLP论文 -《Distributed Representations of Sentences and Documents》-句子和文档的分布式表示学习
- UIControl UIImage
- es6添加删除class_es6-class的基本用法
- python queue get 方法_Python语言中的Queue(队列)
- vscode settings.json配置
- cad计算机功能键,【答疑】Auto CAD2014计算器快捷键是什么呢?? - 视频教程线上学...
- 计算机应用基础实操题怎么操,计算机基础实操试题
- SpringBoot内嵌tomcat日志配置
- CAD图纸打印出来后很多CAD文字消失了怎么办?
- Android-AhMyth Rat
- 【web安全】——floor报错注入
- 自动切换输入法--Mac高效切换输入法工具
- 2011推荐系统论坛游记:爱的反义词不是恨
- 不同浏览器的userAgent
- Markdown编辑器 vs.富文本编辑器:介绍/优缺点 (未完更新中)
热门文章
- Swift 总结使用问号(?)和感叹号(!)-备用
- Java中类的初始化顺序
- Windows上PHP扩展的实现,部署及应用
- 3409: [Usaco2009 Oct]Barn Echoes 牛棚回声
- 主流存储网络类型分析
- java.util.ConcurrentModificationException
- myeclispe快捷键一\(≧▽≦)/终于也收藏了
- Convolutional Neurons Network 训练参数与连接数计算过程
- shell 数学运算
- OAuth2简易实战(四)-Github社交联合登录