基于Java的开源 Carrot2 搜索结果聚合聚类引擎 2.0发布了
基于Java的开源 Carrot2 搜索结果聚合聚类引擎 2.0发布了
专注是不断前进的指南针 --- 题记
基于Java的开源 Carrot2 搜索结果聚合聚类引擎 2.0发布了. Carrot2 可以自动的把自然的搜索结果归类(聚合聚类)到相应的语义类别中,这个功能是通过Carrot2一个现成的组件完成的,除此之外Carrot2 还包括了很多其他的搜索结果聚合聚类算法 search results clustering algorithms 非常值得一看 . 今天10b lobster 和我聊起了新闻标题的平移算法, 如果这个算法被Carrot支持的话,应该是一个流行算法了。这个算法在卢亮的blog上曾经提到过。新闻阅读器也准备用这个算法进行新闻分类,提高新闻阅读速度。
Carrot2 2.0 的一个亮点是速度和易用性的提高。在易用性方面Carrot2提供了一个叫Aduna ClusterMap 的可视化组,这个组件被放到了可以单独运行的GUI程序中了,详见:standalone GUI application 。除此之外核心api也得到了简化,这里有 更多信息.
Carrot2 的流行还衍生了一家叫 Carrot Search 的公司,类似jboss ,mysql 相关的运营公司, 他们发布了发布了 Lingo3G ,可以想想出来了,Lingo3G ( 这个名字真酷 lingo and 3g 呵呵 )-- 提供高性能的文档聚合引擎 ,这个引擎功能十分强进,他提供基于层级的,同义的 , 标签过滤的等功能。相比较 autonomy 还是有些差:
Autonomy的技术内核,是一个被称为IDOL的智能信息处理层。IDOL由动态推理引擎 (DRE)、分类服务器、用户服务器等模块组成,DRE 可实现概念识别、自动摘要、有效识别、自动超链接、自然语言检索等核心操作,分类服务器可实现自动聚类、自动分类、自动目录生成等功能操作,用户服务器则可以实现个人化信息创建、个性化信息提示、个性化信息训练、专家定位等个性化操作。
你是不是和我一样急不可耐了?想看Demo ?Let's Go
相关阅读:
原文地址 译文地址
新闻阅读器 Carrot2 live demo 这是他们的 项目地址 .
基于Java的开源 Carrot2 搜索结果聚合聚类引擎 2.0发布了相关推荐
- 基于Java的开源 Carrot2 搜索结果聚合聚类引擎
来自这里:http://blog.csdn.net/accesine960/archive/2006/09/25/1282935.aspx 基于Java的开源 Carrot2 搜索结果聚合聚类引擎 2 ...
- 带有基于Smalltalk的Ruby VM的NoSQL OODB:MagLev 1.0发布了
带有基于Smalltalk的Ruby VM的NoSQL OODB:MagLev 1.0发布了 http://www.infoq.com/cn/news/2011/11/ruby-maglev-10 M ...
- java 开源 cms系统_基于Java的开源CMS系统选择(转)
CMS概述 对于网站CMS系统而言,基于PHP的是主流,如Drupal/Joomla在各个主流虚拟机提供商上都是标准配置,也被广泛使用. 但如果你拥有Java团队,或者项目目标是想建立一个企业网使用的 ...
- java cms 开源系统_基于Java的开源CMS系统选择
CMS概述 对于网站CMS系统而言,基于PHP的是主流,如Drupal/Joomla在各个主流虚拟机提供商上都是标准配置,也被广泛使用. 但如果你拥有Java团队,或者项目目标是想建立一个企业网使用的 ...
- 基于Java的开源CMS系统选择
CMS概述 对于网站CMS系统而言,基于PHP的是主流,如Drupal/Joomla在各个主流虚拟机提供商上都是标准配置,也被广泛使用. 但如果你拥有Java团队,或者项目目标是想建立一个企业网使用的 ...
- java的cms系统_基于Java的开源CMS系统选择
CMS概述 对于网站CMS系统而言,基于PHP的是主流,如Drupal/Joomla在各个主流虚拟机提供商上都是标准配置,也被广泛使用. 但如果你拥有Java团队,或者项目目标是想建立一个企业网使用的 ...
- 基于Java的开源CMS有哪些推荐,各自特点是什么
选了10个最强大.最易用的CMS,向大家做一个简要介绍. Alfresco是一个开源的企业网站内容管理系统,它提供了文档管理.多人协作.记录管理.知识管理网页内容和图像管理等功能.它使用Spring. ...
- 基于Java的开源3D游戏引擎jMonkeyEngine
jMonkeyEngine简介 jMonkeyEngine是一款纯Java语言编写的游戏引擎,继承了Java应用跨平台的特性,而且是开放源代码的,遵循BSD开源协议,BSD开源协议用一句简单的话概括就 ...
- 3D游戏 java_基于Java的开源3D游戏引擎jMonkeyEngine
jMonkeyEngine简介 jMonkeyEngine是一款纯Java语言编写的游戏引擎,继承了Java应用跨平台的特性,而且是开放源代码的,遵循BSD开源协议,BSD开源协议用一句简单的话概括就 ...
最新文章
- nginx基于域名的日志切割脚本
- 【Linux 应用编程】进程管理 - 进程间通信IPC之共享内存 mmap
- vs2008打开aspx设计界面无响应问题解决方法
- python编程能干什么-Python编程一般可以用来做什么
- IoT半导体购并案效果难现 服务器合作案后来居上
- 深度学习基础(三)loss函数
- Windows中获取和设置系统日期时间的C程序
- android 中自定义键盘,【图片】自定义属于自己的专属键盘的思路!!!(需要有android编程基础)【exagear吧】_百度贴吧...
- BZOJ 1016: [JSOI2008]最小生成树计数( kruskal + dfs )
- 解决IE8上传文件时javascript取文件的本地路径的问题C:\fakepath\..
- 淘宝技术架构演进之路
- Vue 无限滚动加载指令
- 卡诺模型案例分析_卡诺模型:用数据捕捉用户真正需求,帮助产品更好地迭代升级...
- Python自动发抖音脚本教程(1:介绍和源码)
- Matlab中对坐标轴的对数转化,loglog,semilogx与semilogy
- 5个相见恨晚的设计资源网站,记得收藏。
- HP elitebook 735 g5 笔记本电脑升级BIOS驱动后Type-C无法扩展显示屏的解决方案
- 【考研英语语法】代词练习题
- 记录一下润乾报表填报的制作
- 第二章 C语言基础程序设计