LinkedIn已将可自定义的索引引擎IndexTank开源
LinkedIn已将IndexTank开源,这是一种运行在云中的文档索引引擎,它让用户可以自定义编制索引的过程,并对结果进行微调。
IndexTank是在一年之前发布的,在十月份被LinkedIn收购,并在最近开放了源代码。IndexTank是与Google自定义搜索类 似的云服务,它基于Amazon Web Services运行,给网站提供了为其中的内容编制索引的功能,而网站的访问者会在稍后搜索这些内容。IndexTank声称他们的用户拥有完全的控制 权,可以决定对什么编制索引,何时编制索引,以及如何对结果排序。这意味着网站可以在搜索结果的基础之上,对想要优先显示的文档做出改善,而不需要依赖于Google的搜索算法。
和很多站点不同,IndexTank不会爬取网页的内容,从而对其建立索引,而是会由站点向索引引擎发送要索引的数据。这样,文档在创建之后就可以索引到,这提供了实时的结果。另外,我们可以免费添加这项服务。
IndexTank包括三个主要组件:
- 索引引擎——只对简单文本建立索引的引擎。而PDF、微软文档以及其他文档类型需要在建立索引之前转换为文本格式。
- API——可以通过Java、Python、.NET、Ruby和PHP客户端访问的RESTful的接口。
- Nebulizer——一种多租户框架,其中存放不限数量、运行在IaaS基础架构上的索引引擎。
IndexTank加入了Zoie,那是一种基于Apache Lucene构建的实时搜索引擎,并由LinkedIn于2008年开源。
IndexTank声称他们已经在一年间吸引了成千上万的用户,其中最值得关注的就是Reddit,但这家公司在被LinkedIn收购的时候还没有盈利。
IndexTank的源代码可以在GitHub:Index Engine和API plus Nebulizer处下载。
转载于:https://www.cnblogs.com/shihao/archive/2012/01/05/2313233.html
LinkedIn已将可自定义的索引引擎IndexTank开源相关推荐
- 海量结构化数据存储技术揭秘:Tablestore存储和索引引擎详解
前言 表格存储Tablestore是阿里云自研的面向海量结构化数据存储的Serverless NoSQL多模型数据库.Tablestore在阿里云官网上有各种文档介绍,也发布了很多场景案例文章,这些文 ...
- 企业级自定义表单引擎解决方案(二)--架构及核心模块设计
.net core研发的自定义表单引擎,采用强大的规则引擎将所有的业务串联起来的,和其他低代码平台是有本质的区别的,目标是完全解放繁琐的CRUD工作. 先总体介绍一下大概的架构和核心模块设计.先上一张 ...
- pandas自定义设置dataframe每个索引的标签、自定义设置索引的列名称(customize index name and index label)
pandas自定义设置dataframe每个索引的标签.自定义设置索引的列名称(customize index name and index label) 目录
- PHP 自定义 Smarty 模板引擎类 高洛峰 细说PHP
smarty模板引擎类简单工作原理 利用Smarty 模板引擎类对模板文件中的变量进行编译,编译过程其实就是利用正则表达式翻译成PHP文件.例如 模板文件中{$title} 利用正则表达式找到并替换成 ...
- php 高洛峰 正则,PHP 自定义 Smarty 模板引擎类 高洛峰 细说PHP
smarty模板引擎类简单工作原理 利用Smarty 模板引擎类对模板文件中的变量进行编译,编译过程其实就是利用正则表达式翻译成PHP文件.例如 模板文件中{$title}利用正则表达式找到并替换成 ...
- 百度万亿流量的转发引擎BFE开源了!华为折叠屏曝光,采用传统翻盖式手机折叠方案;微软将关闭安卓iOS平台Cortana……...
关注并标星星CSDN云计算 速递.最新.绝对有料.这里有企业新动.这里有业界要闻,打起十二分精神,紧跟fashion你可以的! 每周两次,打卡即read 更快.更全了解泛云圈精彩news go ...
- 优酷全自研跨平台动态模板引擎重磅开源啦!
动态模板引擎大大提升了优酷的线上用户体验,同时也大大减少了研发门槛.为了和大家交流以及让更多的人享受这一技术,优酷已经将其开源.通过和社区合作,动态模板引擎将会发展的越来越好,实现多赢. 前言 优酷客 ...
- 面试题: mysql 数据库已看 sql安全性 索引 引擎 sql优化
总结的一些MySQL数据库面试题 2016年06月16日 11:41:18 阅读数:4950 一.sql语句应该考虑哪些安全性? (1)防止sql注入,对特殊字符进行转义,过滤或者使用预编译的sql语 ...
- flutter 自定义键盘_Flutter 引擎架构
Flutter 结合了一个 Dart 框架和一个高性能的引擎. Flutter 引擎是一个用于运行高品质移动应用的可移植运行时.它实现了 Flutter 的核心库,动画和图形,文件和网络的 I/O,支 ...
最新文章
- mysql中行转列,MySQL 中行转列的方法
- 厌倦了“复制粘贴”,我辞去了年薪45万美元的开发工作
- ligertree内容过多导致崩溃_师傅崩溃了!自身是8年的老师傅,料也没问题,但每次都堵管...
- 浅谈O2O行业的猎人与农夫【更新完毕】
- c语言边界条件的设置,求解能不能用c或c++语言实现下面的约束条件
- extjs4 冻结列_extjs4 事件处理
- 下载量超1600万的热门开源 JavaScript 序列化包中被曝 RCE 漏洞
- 解析时分秒_部编版三年级上册语文生字表、识字表+生字解析(拼音+偏旁+结构+组词+造句)...
- 第七部分:小插曲,Deferred
- 如何在 iPhone 和 iPad 上关闭 Spotlight 建议?
- 基于Echarts+HTML5可视化数据大屏展示—智慧社区内网对比平台
- android 音频压缩 silk,有损音频压缩格式大比拼─MP3、Ogg、AAC、HE-AAC、HE-AACv2、Opus究竟谁才是王者?...
- 宝塔面板linux账号密码忘记,宝塔面板忘记账号或密码的解决办法
- #用PYTHON绘画五角星
- Ubuntu打造家用NAS三——网盘与影视中心
- Java POI导出Excel
- C#使用FFmpeg的总结
- Protues使用教程
- 网络渗透作业之 wireshark抓包校园网
- 【CVPR 2021】DatasetGAN: Efficient Labeled Data Factory with Minimal Human Effort