1 // ./CrtInvertedIdx moon.fidx.sort > sun.iidx
 2 #include <iostream>
 3 #include <fstream>
 4
 5 using namespace std;
 6
 7 int main(int argc, char* argv[])
 8 {
 9     ifstream ifsImgInfo(argv[1]);//打开输入流
10     if (!ifsImgInfo) {
11         cerr << "Cannot open " << argv[1] << " for input\n";
12         return -1;
13     }
14
15     string strLine,strDocNum,tmp1="";
16     int cnt = 0;
17     while (getline(ifsImgInfo, strLine)) {
18         string::size_type idx;
19         string tmp;
20
21
22         idx = strLine.find("\t");
23         tmp = strLine.substr(0,idx);
24         //得到索引词
25         if (tmp.size()<2 || tmp.size() > 8) continue;//不可能构成中文或者大于最大匹配单元
26
27         if (tmp1.empty()) tmp1=tmp;
28
29         if (tmp == tmp1) {//如果是相同的索引词,则将文档编号追加到strDocNum中
30             strDocNum = strDocNum + " " + strLine.substr(idx+1);//索引词相同,则加起来
31         }
32         else {//索引词不同
33             if ( strDocNum.empty() )
34                 strDocNum = strDocNum + " " + strLine.substr(idx+1);
35
36             cout << tmp1 << "\t" << strDocNum << endl;//输出
37             tmp1 = tmp;
38             strDocNum.clear();
39             strDocNum = strDocNum + " " + strLine.substr(idx+1);
40         }
41
42         cnt++;
43         //if (cnt==100) break;
44     }
45     cout << tmp1 << "\t" << strDocNum << endl;
46
47     return 0;
48 }

转载于:https://www.cnblogs.com/kakamilan/archive/2012/07/15/2592345.html

CrtInvertedIdx相关推荐

  1. 北大天网搜索引擎TSE分析及完全注释[6]倒排索引的建立的程序分析(4)

    以下是根据正向索引建立倒排索引的注释 int main(int argc, char* argv[])    //./CrtInvertedIdx moon.fidx.sort > sun.ii ...

最新文章

  1. 计算机科学与技术专业综合二,计算机科学与技术专业综合一第二页
  2. Android开发之自定义dialog的实现(源代码分享)
  3. sqlserver compact sdf, sqlite 数据库 在net中相对路径设置方法 - 摘自网络
  4. python矩阵教程_numpy教程:矩阵matrix及其运算
  5. CentOS 5.2 安装Apache服务器后无法访问解决方法
  6. NLP论文 -《Distributed Representations of Sentences and Documents》-句子和文档的分布式表示学习
  7. UIControl UIImage
  8. es6添加删除class_es6-class的基本用法
  9. python queue get 方法_Python语言中的Queue(队列)
  10. vscode settings.json配置
  11. cad计算机功能键,【答疑】Auto CAD2014计算器快捷键是什么呢?? - 视频教程线上学...
  12. 计算机应用基础实操题怎么操,计算机基础实操试题
  13. SpringBoot内嵌tomcat日志配置
  14. CAD图纸打印出来后很多CAD文字消失了怎么办?
  15. Android-AhMyth Rat
  16. 【web安全】——floor报错注入
  17. 自动切换输入法--Mac高效切换输入法工具
  18. 2011推荐系统论坛游记:爱的反义词不是恨
  19. 不同浏览器的userAgent
  20. Markdown编辑器 vs.富文本编辑器:介绍/优缺点 (未完更新中)

热门文章

  1. Swift 总结使用问号(?)和感叹号(!)-备用
  2. Java中类的初始化顺序
  3. Windows上PHP扩展的实现,部署及应用
  4. 3409: [Usaco2009 Oct]Barn Echoes 牛棚回声
  5. 主流存储网络类型分析
  6. java.util.ConcurrentModificationException
  7. myeclispe快捷键一\(≧▽≦)/终于也收藏了
  8. Convolutional Neurons Network 训练参数与连接数计算过程
  9. shell 数学运算
  10. OAuth2简易实战(四)-Github社交联合登录