lucene使用3.0.3

几年前,我首先构建并发布了Jirasearch ,它是用于薄型包装Lucene服务器的有趣的狗粮测试用例,以针对我们的Jira问题公开强大的搜索UI。

这很好地展示了Lucene的许多重要功能:

  • 使用块联接查询来建模父文档(原始的Jira问题)和子文档(每个注释)。 这种基本的关系结构在电子商务应用程序中也很常见,在电子商务应用程序中 ,您拥有一件产品(例如一件特定的衬衫),然后在该衬衫下拥有单独的SKU(尺寸/颜色组合)
  • PostingsHighlighter突出显示
  • 具有平面,层次结构和动态数值范围字段的构面。 请记住,您可以通过Shift +单击来选择多个构面值(多选) !
  • DrillSideways方面计数,因此您不会因为其他标签中的一个而损失其他标签的方面计数
  • AnalyzingInfixSuggester用于自动建议 ,包括近实时更新 。 建议是针对特定项目的:如果您已深入到特定项目,则这些建议将仅来自那些项目,这要归功于AnalyzingInfixSuggester 现在支持上下文
  • 近实时索引和搜索
  • WordDelimiterFilter以便拆分驼峰式标记(尝试搜索infix )
  • 同义字
  • 使用表达式动态计算匹配的排序顺序得分的新近度和相关性

奇怪的是,仍然缺少拼写校正甚至模糊的中缀建议(欢迎拉动请求!)。

自从Jirasearch最初发布以来,它已经引起了用户和开发人员的广泛使用和兴趣。 对于我来说,构建并保持它一直运行是一项很棒而令人沮丧的练习,因为我开始体验作为软件“生产”用户的生活。 同时,我们每个人都有一个不错的搜索UI来查找问题。

从Lucene 4.6.x升级到6.x

在过去一周左右的时间里,我还有另一个类似的令人沮丧的经历,这次是将Jirasearch从非常老的Lucene 4.6.x版本升级到最新的6.x版本。 很小的事情(但至关重要!)发生了变化,例如, 新要求要求将特殊的索引搜索器与ToParentBlockJoinQuery一起ToParentBlockJoinQuery ,这与必须使用DrillSideways发生冲突。 我在中缀提示器中遇到了这个错误 。 纯粹的否定布尔查询发生了一些变化,但是我仍然不确定(我现在已经解决了)什么!

我之前已经将Lucene服务器升级到了尺寸标注点,所以我可以“免费”获得Jirasearch中现有的数字字段。

Jirasearch的新功能

除了“仅”从Lucene 4.6.x升级到6.x,并将所有数字字段切换到新的尺寸点外,我还添加了一些引人注目的用户可见的改进(感谢Alexandre Rafalovitch提出了一些建议,因此,开始我意想不到的具有挑战性的升级和改进工作):

  • 最终,“ cuting@apache.org”以道格·切特的名字出现! 另外,如果您键入“ Doug”,则自动建议现在可以使用。
  • 新的“ 更新前的构面”维度使您可以深入查看一段时间未更新的问题。
  • 新的“ 最后评论用户”构面维度是最后对问题发表评论的用户。
  • 新的按面提交的维度使您可以深入了解给定开发人员已针对其进行更改的问题。
  • 自从从Subversion切换到Git以来,“ 提交的路径”层次结构方面维度已中断,该问题使您可以根据源树中针对该问题所更改的路径来查找问题。
  • 基础设施项目问题现在也包括在内。
  • 对每条注释的文本处理进行了一些小的改进,例如将引用的用户名扩展为其显示名,将commitbot注释链接直接映射到更改集并包括分支名称,以及一些新的同义​​词(尝试pnp !)。

新的方面字段特别有趣:您现在可以通过向下钻取“ 更新前”>“ 1个月前”和“ 最后评论用户=您” (这是亚历山大建议的用例)来查找您可能已杀死的问题。

另一个有趣的地方是看到给定开发人员对源代码树的不寻常部分( 提交路径 )做出了承诺( 提交 ),例如, 我针对Lucene Jira问题对Solr进行了更改的问题 。

开源Jirasearch

通过此更新,我还将在luceneserver github项目的examples/jirasearch 子目录下使所有基于Apache 2许可 的jirasearch开源 。

尽管Luceneserver本身完全是Java ,但Jirasearch应用程序的源代码可以从Apache Jira实例中提取所有问题的详细信息,并将这些文档转换为Lucene服务器文档,进行完整和近乎实时的索引编制,从而建立建议,和搜索界面完全是Python。

请注意,Python源代码不是特别漂亮。 但是,它们功能正常,并且一如既往:欢迎使用补丁程序!

我很可能在升级过程中遇到了麻烦。 如果是这样,请告诉我(在此处添加评论或向我发送电子邮件)。

翻译自: https://www.javacodegeeks.com/2016/10/jirasearch-2-0-dog-food-using-lucene-find-jira-issues.html

lucene使用3.0.3

lucene使用3.0.3_Jirasearch 2.0狗粮:使用Lucene查找我们的Jira问题相关推荐

  1. [发布]Lucene索引分析工具Luke.Net 0.5升级版 (兼容Lucene.Net 2.9.4.1)

    但是作者后续没有更新,无奈只好自己升级,跟java版本的luke差距不是一点点大,如果不是为了用盘古分词用java版本挺好的,所以这里我建议除非有必要还是用luke in java吧. 这个版本是升级 ...

  2. 基于【CentOS-7+ Ambari 2.7.0 + HDP 3.0】搭建HAWQ数据仓库01 —— 准备环境,搭建本地仓库,安装ambari...

    一.集群软硬件环境准备: 操作系统:  centos 7 x86_64.1804 Ambari版本:2.7.0 HDP版本:3.0.0 HAWQ版本:2.3.0 5台PC作为工作站: ep-bd01 ...

  3. 积少成多 Flash(ActionScript 3.0 Flex 3.0) 系列文章索引

    [源码下载] 积少成多 Flash(ActionScript 3.0 & Flex 3.0) 系列文章索引 作者:webabcd Flash 之 ActionScript 3.0  1.积少成 ...

  4. 一文看懂模糊搜索1.0到3.0的算法迭代历程

    参加 2019 Python开发者日,请扫码咨询 ↑↑↑ 作者 | 宋广泽 责编 | 郭芮 来源 | CSDN(ID:CSDNnews) 前一段时间在Linux上用C语言做了一个信息管理系统,初始版本 ...

  5. 为什么 HashMap 加载因子一定是0.75?而不是0.8,0.6?

    点击上方"方志朋",选择"设为星标" 回复"666"获取新整理的面试文章 有很多东西之前在学的时候没怎么注意,笔者也是在重温HashMap的 ...

  6. 127.0.0.1和0.0.0.0地址的区别

    点击上方"方志朋",选择"设为星标" 回复"666"获取新整理的面试文章 1. 问题引入 之前在使用tomcat的时候,启动tomcat默认 ...

  7. 一个有趣的实验:用0.1f 替换 0,性能提升 7 倍!

    点击关注上方"视学算法",设为"置顶或星标",第一时间送达技术干货. 本文来源:http://cenalulu.github.io/linux/about-de ...

  8. scala报错20/08/31 23:48:40 WARN TaskSetManager: Lost task 1.0 in stage 0.0 (TID 1, 192.168.28.94, exec

    <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://mave ...

  9. 架构的能力是不断打磨1.0,2.0成就3.0,4.0

    架构能力的提升不在于这一年我做了多少新的功能,上线了多少服务.系统,更重要的在于是否可以就现有的这套系统规模.规则.体量扩大几倍的情况下,仍然可以快速支持业务吞吐.提升扩展及三高的能力. 更近一步来说 ...

最新文章

  1. 读书:历史 -- 百年战争简史
  2. Xcode升级到8之后的一些需要我们手动配置的地方
  3. 地图样式自定义_干货在线 | ArcGIS中定义图框样式
  4. git仓库相关知识01-安装和基本命令
  5. DNS and Bind (一)
  6. pr导入html文件,视频怎么导入Premiere啊?
  7. ipv4和ipv6的区别,如何保护ip地址安全?
  8. Linux网络安装(PXE + DHCP+TFTP+ Kickstart+ FTP)
  9. Java 中的某些方法为什么要求传入一个 Class 对象
  10. 编程 小数位数_使用动态编程的n位数的非递减总数
  11. 解决复制项目后名称不改变的问题:org.eclipse.wst.common.component
  12. 顶级区块链开发人员工具:涉及框架、IDE、安全工具、测试网络、区块链预言机和节点服务
  13. VMware+Ubuntu 20.04 画面卡住 verifying the installation configuration
  14. 项目组自己编写的js分页标签(百度分页)
  15. IT小白重装系统大全
  16. 有限公司如何设立董事会
  17. Android复杂页面代码拆分方法
  18. 企业微信hook接口,协议开发,群操作功能教程
  19. PostgreSQL对不足位数的查询结果进行前后补0
  20. 万豪国际集团于上海开设第五家福朋喜来登酒店

热门文章

  1. 模板:莫比乌斯反演(数论)
  2. P3605 [USACO17JAN]Promotion Counting P(树状数组)
  3. 邮局-[IOI2000](四边形不等式)
  4. YbtOJ#883-最大的割【带修线性基】
  5. P1040,jzoj1167-加分二叉树【树形dp】
  6. 【2018.3.24】模拟赛之五-ssl1864 得分【dp,贪心】
  7. [NOI2014] 起床困难综合症(二进制,贪心)
  8. Codeforces Round #491 (Div. 2)
  9. MongoDB投影字段
  10. Photoshop的基本操作