LinkedIn已将IndexTank开源,这是一种运行在云中的文档索引引擎,它让用户可以自定义编制索引的过程,并对结果进行微调。

IndexTank是在一年之前发布的,在十月份被LinkedIn收购,并在最近开放了源代码。IndexTank是与Google自定义搜索类 似的云服务,它基于Amazon Web Services运行,给网站提供了为其中的内容编制索引的功能,而网站的访问者会在稍后搜索这些内容。IndexTank声称他们的用户拥有完全的控制 权,可以决定对什么编制索引,何时编制索引,以及如何对结果排序。这意味着网站可以在搜索结果的基础之上,对想要优先显示的文档做出改善,而不需要依赖于Google的搜索算法。

和很多站点不同,IndexTank不会爬取网页的内容,从而对其建立索引,而是会由站点向索引引擎发送要索引的数据。这样,文档在创建之后就可以索引到,这提供了实时的结果。另外,我们可以免费添加这项服务。

IndexTank包括三个主要组件:

  • 索引引擎——只对简单文本建立索引的引擎。而PDF、微软文档以及其他文档类型需要在建立索引之前转换为文本格式。
  • API——可以通过Java、Python、.NET、Ruby和PHP客户端访问的RESTful的接口。
  • Nebulizer——一种多租户框架,其中存放不限数量、运行在IaaS基础架构上的索引引擎。

IndexTank加入了Zoie,那是一种基于Apache Lucene构建的实时搜索引擎,并由LinkedIn于2008年开源。

IndexTank声称他们已经在一年间吸引了成千上万的用户,其中最值得关注的就是Reddit,但这家公司在被LinkedIn收购的时候还没有盈利。

IndexTank的源代码可以在GitHub:Index Engine和API plus Nebulizer处下载。

转载于:https://www.cnblogs.com/shihao/archive/2012/01/05/2313233.html

LinkedIn已将可自定义的索引引擎IndexTank开源相关推荐

  1. 海量结构化数据存储技术揭秘:Tablestore存储和索引引擎详解

    前言 表格存储Tablestore是阿里云自研的面向海量结构化数据存储的Serverless NoSQL多模型数据库.Tablestore在阿里云官网上有各种文档介绍,也发布了很多场景案例文章,这些文 ...

  2. 企业级自定义表单引擎解决方案(二)--架构及核心模块设计

    .net core研发的自定义表单引擎,采用强大的规则引擎将所有的业务串联起来的,和其他低代码平台是有本质的区别的,目标是完全解放繁琐的CRUD工作. 先总体介绍一下大概的架构和核心模块设计.先上一张 ...

  3. pandas自定义设置dataframe每个索引的标签、自定义设置索引的列名称(customize index name and index label)

    pandas自定义设置dataframe每个索引的标签.自定义设置索引的列名称(customize index name and index label) 目录

  4. PHP 自定义 Smarty 模板引擎类 高洛峰 细说PHP

    smarty模板引擎类简单工作原理 利用Smarty 模板引擎类对模板文件中的变量进行编译,编译过程其实就是利用正则表达式翻译成PHP文件.例如 模板文件中{$title} 利用正则表达式找到并替换成 ...

  5. php 高洛峰 正则,PHP 自定义 Smarty 模板引擎类 高洛峰 细说PHP

    smarty模板引擎类简单工作原理 利用Smarty 模板引擎类对模板文件中的变量进行编译,编译过程其实就是利用正则表达式翻译成PHP文件.例如 模板文件中{$title}利用正则表达式找到并替换成 ...

  6. 百度万亿流量的转发引擎BFE开源了!华为折叠屏曝光,采用传统翻盖式手机折叠方案;微软将关闭安卓iOS平台Cortana……...

    关注并标星星CSDN云计算 速递.最新.绝对有料.这里有企业新动.这里有业界要闻,打起十二分精神,紧跟fashion你可以的! 每周两次,打卡即read   更快.更全了解泛云圈精彩news   go ...

  7. 优酷全自研跨平台动态模板引擎重磅开源啦!

    动态模板引擎大大提升了优酷的线上用户体验,同时也大大减少了研发门槛.为了和大家交流以及让更多的人享受这一技术,优酷已经将其开源.通过和社区合作,动态模板引擎将会发展的越来越好,实现多赢. 前言 优酷客 ...

  8. 面试题: mysql 数据库已看 sql安全性 索引 引擎 sql优化

    总结的一些MySQL数据库面试题 2016年06月16日 11:41:18 阅读数:4950 一.sql语句应该考虑哪些安全性? (1)防止sql注入,对特殊字符进行转义,过滤或者使用预编译的sql语 ...

  9. flutter 自定义键盘_Flutter 引擎架构

    Flutter 结合了一个 Dart 框架和一个高性能的引擎. Flutter 引擎是一个用于运行高品质移动应用的可移植运行时.它实现了 Flutter 的核心库,动画和图形,文件和网络的 I/O,支 ...

最新文章

  1. mysql中行转列,MySQL 中行转列的方法
  2. 厌倦了“复制粘贴”,我辞去了年薪45万美元的开发工作
  3. ligertree内容过多导致崩溃_师傅崩溃了!自身是8年的老师傅,料也没问题,但每次都堵管...
  4. 浅谈O2O行业的猎人与农夫【更新完毕】
  5. c语言边界条件的设置,求解能不能用c或c++语言实现下面的约束条件
  6. extjs4 冻结列_extjs4 事件处理
  7. 下载量超1600万的热门开源 JavaScript 序列化包中被曝 RCE 漏洞
  8. 解析时分秒_部编版三年级上册语文生字表、识字表+生字解析(拼音+偏旁+结构+组词+造句)...
  9. 第七部分:小插曲,Deferred
  10. 如何在 iPhone 和 iPad 上关闭 Spotlight 建议?
  11. 基于Echarts+HTML5可视化数据大屏展示—智慧社区内网对比平台
  12. android 音频压缩 silk,有损音频压缩格式大比拼─MP3、Ogg、AAC、HE-AAC、HE-AACv2、Opus究竟谁才是王者?...
  13. 宝塔面板linux账号密码忘记,宝塔面板忘记账号或密码的解决办法
  14. #用PYTHON绘画五角星
  15. Ubuntu打造家用NAS三——网盘与影视中心
  16. Java POI导出Excel
  17. C#使用FFmpeg的总结
  18. Protues使用教程
  19. 网络渗透作业之 wireshark抓包校园网
  20. 【CVPR 2021】DatasetGAN: Efficient Labeled Data Factory with Minimal Human Effort

热门文章

  1. 2018实用前端面试问题集锦
  2. 编程应该用 Mac ,还是 PC ?
  3. mysql gtid ha_MySQl新特性 GTID
  4. linux sli 提高效率,从原理到性能提升 MCP78智能SLI全解析
  5. java遍历Set集合
  6. js中调用C标签实现百度地图
  7. Spring常用的的注解对应xml配置详解
  8. ui设计看的书_5本关于UI设计的书
  9. 一次缓存性能问题排查
  10. Ubuntu挂载新硬盘