不和企鹅聊天(547317812) 2013/7/1 11:21:40
请教个问题,有谁用过solr的自动聚类吗?
何达(25073021)  11:47:33
自动聚类carrot2这种效果很一般,还不如facet,想效果好得自己做
不和企鹅聊天(547317812)  11:48:12
自己做?复杂吗?
何达(25073021)  11:48:36
复杂,标签聚合是难点
不和企鹅聊天(547317812)  11:49:35
自己做,对于我们团队现在来说,有点困难
不和企鹅聊天(547317812)  11:50:02
由第三方已经做好的,效果比较好的吗?
何达(25073021)  11:50:03
不自己做,效果没法看
何达(25073021)  11:50:37
第三方做好的都自己用,没见到开源的
不和企鹅聊天(547317812)  11:51:03
这就麻烦了  
何达(25073021)  11:51:19
看你的应用场景了,要是需求简单也好搞
何达(25073021)  11:51:43
在建索引之前先聚类,然后用facet搞定
不和企鹅聊天(547317812)  11:52:02
就是根据文本内容,分类
何达(25073021)  11:52:25
建完索引再通过solr来搞定是死路
何达(25073021)  11:53:01
那你先分吧,你用什么方式分啊,手工的,自动的,还是有什么规律能用程序搞定?
不和企鹅聊天(547317812)  11:53:12
有没有像autonomy的  IDOL,这种的解决方案
何达(25073021)  11:55:21
开源的不知道有没有,没见过
不和企鹅聊天(547317812)  11:56:54
就是想做一个,基于语义理解的,自动聚类处理
何达(25073021)  11:57:40
那就复杂了,估计你们团队短时间搞不定,可以考虑花钱买技术
极品健健(76920835)  11:58:34
做个简单的,有现成算法
不和企鹅聊天(547317812)  11:58:54
这个。。。。  领导说了算啊
何达(25073021)  11:59:10
@极品健健 他是基于语义理解的,这就大发了
极品健健(76920835)  11:59:12
不能拔苗助长呐
极品健健(76920835)  11:59:42
居于分词的,类似文档相似度的就好了,简单搞点算了
何达(25073021)  11:59:51
都没基础的,只能找规律简单搞搞
不和企鹅聊天(547317812)  12:00:06
基于语义理解的,自动聚类,索引,同时支持全文检索等等  
何达(25073021)  12:00:31
让你们领导自己做吧,这百万年薪的才能搞定啊
极品健健(76920835)  12:00:35
语义理解。。。。。。。。
[☆]雪罗漫天<phpcms@msn.com>  12:00:58

[☆]雪罗漫天<phpcms@msn.com>  12:01:19

[☆]雪罗漫天<phpcms@msn.com>  12:01:44
这个算语义理解么
极品健健(76920835)  12:02:35
必须不是
[☆]雪罗漫天<phpcms@msn.com>  12:02:52
.....
[☆]雪罗漫天<phpcms@msn.com>  12:03:13
应该是了吧,它都能理解我说的电扇了...
简单(9730722)  12:03:20

极品健健(76920835)  12:03:26

[☆]雪罗漫天<phpcms@msn.com>  12:03:31
哈哈 你还真搜啊
简单(9730722)  12:04:11
我想看看现在科技的进步程度
简单(9730722)  12:04:15

不和企鹅聊天(547317812)  12:04:29
唉。。。。  愁啊。。
不和企鹅聊天(547317812)  12:09:26
我们想做的是,比如:赵红霞,系统能够理解,“反腐倡廉”,“贪欲受贿”,等等这些,系统能自动理解语意,理解文章上下文环境,自动把同一类的文本聚成一个专题
极品健健(76920835)  12:10:36
系统为什么能理解?我们人为什么能知道赵红霞和反腐倡廉有关系
极品健健(76920835)  12:10:46
因为我们人事先接触到新闻
极品健健(76920835)  12:10:58
你脑子里已经有这个联系了
不和企鹅聊天(547317812)  12:12:12
这个写信息,能不能随着系统接触的信息越来越多,系统就能理解这些?
极品健健(76920835)  12:12:47
你系统的关键就是这个
极品健健(76920835)  12:12:51
我不懂这个
刹那永恒(393681695)  12:14:04
不会是给广电做的吧?

不和企鹅聊天(547317812)  12:15:17
我是想,能不能有一种方法,最后让系统既能搜出东西,又能理解搜出来的东西,并且根据语义,上下文环境,自动把信息分类
Lee(125801105)  12:15:36
这涉及到一个学科... 机器学习.
♨HelloWorld<huangduanfeng6.29@qq.com>  12:15:46
这个是属于人工智能范畴了
♨HelloWorld<huangduanfeng6.29@qq.com>  12:15:50
我们之前做过
♨HelloWorld<huangduanfeng6.29@qq.com>  12:16:01
不过我们做的比较低级就是了
不和企鹅聊天(547317812)  12:16:11
最终实现,和人工阅读文本,人工根据内容分类,一样的效果
杭州-湖畔<redsdh@gmail.com>  12:16:17
。。。难
杭州-湖畔<redsdh@gmail.com>  12:16:40
简单点的, 运营手动加标签,
不和企鹅聊天(547317812)  12:17:18
 运营手动加标签?
不和企鹅聊天(547317812)  12:17:27
能解释一下吗?
杭州-湖畔<redsdh@gmail.com>  12:18:39
我该怎么解释。。
杭州-湖畔<redsdh@gmail.com>  12:19:09
比如大众点评,也做分类的
杭州-湖畔<redsdh@gmail.com>  12:19:21
运营实现知道分类的
杭州-湖畔<redsdh@gmail.com>  12:19:29
调查过业务,有精确的分类存在
☜依米艳☞(316849113)  13:45:59
我每次和seri说话,他都说,我不知道你在说什么~
啊剑(494913703)  13:47:33

☜依米艳☞(316849113)  14:03:33
弱弱的问一句@[☆]雪罗漫天 为什么我的百度搜索来的和你的不一样~
壮志雄虎(342315465)  14:24:59
楼上的好天真。。。。。
liuxun(33611720)  14:25:16
我不是做java开发的,现在需要把solr 代码重新打包,怎么办?
☜依米艳☞(316849113)  14:25:52
@liuxun 变异好的?
☜依米艳☞(316849113)  14:25:55
编译
liuxun(33611720)  14:27:38
公司不能上网,好像ant打包要安装一堆东西。
.................(284242157)  15:34:12
请问solr中怎么更新IK词典呢
.................(284242157)  15:34:29
扩展词典
一休摸鱼(429200247)  15:34:49
有说明吧
.................(284242157)  15:35:23
ik倒是有个文档,但是用了下dic.addWords(words);//批量加载新词条不起作用
[砖]梁山伯(19335353)  15:35:49
@................. 没用我给的源码?
.................(284242157)  15:36:21
在哪儿?
[砖]梁山伯(19335353)  15:36:38
https://github.com/lgnlgn/ik4solr4.3
.................(284242157)  15:37:08
哈,谢谢先看看去

【杂谈】Solr的自动聚类carrot2和facet关系和比较相关推荐

  1. python 文案自动生成_Python应用 | 利用COM技术自动生成IBM i2舞弊关系分析图表

    点蓝字关注  ↑↑↑ 数据化审计:问题导向.应用至上.解决痛点 内容摘要 什么是COM技术 IBM I2 Analyst's Notebook软件介绍 如何使用Python调用I2的COM接口,批量自 ...

  2. Solr的自动完成实现方式(第三部分:Suggester方式续)

    在之前的两个部分(part1.part2)中,我们学会了如何配置和查询solr来获取自动完成的功能.今天,我们来看一下如果为suggester添加字段,以这种方式来提供自动完成的功能.  组件配置  ...

  3. solr mysql 自动同步_MongoDB和Solr的整合以及实现数据同步功能

    使用mongo-connector实现mongodb与solr数据同步: 1.solr搭建.这个我有记录,可以去找,这里不说了.(此次采用solr版本为4.7) 2.mongo搭建,要搭建集群,就是副 ...

  4. Solr的自动完成/自动补充实现介绍(3)

    原文URL: http://java.dzone.com/news/solr-and-autocomplete-part-3?mz=33057-solr_lucene 在之前的两个部分( part1 ...

  5. Solr的自动完成/自动补充实现介绍(第三部分)

    原文URL: http://java.dzone.com/news/solr-and-autocomplete-part-3?mz=33057-solr_lucene 在之前的两个部分( part1. ...

  6. R语言层次聚类:通过内平方和WSS选择最优的聚类K值、可视化不同K下的BSS和WSS、通过Calinski-Harabasz指数(准则)与聚类簇个数的关系获取最优聚类簇的个数

    R语言层次聚类:通过内平方和(Within Sum of Squares,WSS)选择最佳的聚类K值.以内平方和(WSS)和K的关系并通过弯头法ÿ

  7. 一个通用的makefile写法,自动推导文件的依赖关系

    温习之用. 假设有两个头文件目录 header1,header2;两个cpp文件目录,src1,src2,一个lib目录 写一个完整的makefile步骤如下: 1 定义可执行文件的名称 TARGET ...

  8. solr 关于 carrot2聚类参数配置测试

    Carrot2是一个开源的类聚工具,具体说明google一下,很多的解释:在solr中可以很方便的集成这个功能模块:具体实现方式参考:http://wiki.apache.org/solr/Clust ...

  9. 基于Java的开源 Carrot2 搜索结果聚合聚类引擎 2.0发布了

    基于Java的开源 Carrot2 搜索结果聚合聚类引擎 2.0发布了 专注是不断前进的指南针   --- 题记 基于Java的开源 Carrot2 搜索结果聚合聚类引擎 2.0发布了. Carrot ...

  10. 基于Java的开源 Carrot2 搜索结果聚合聚类引擎

    来自这里:http://blog.csdn.net/accesine960/archive/2006/09/25/1282935.aspx 基于Java的开源 Carrot2 搜索结果聚合聚类引擎 2 ...

最新文章

  1. php怎么读取图片并输出,php读取图片内容并输出到浏览器的实现代码_PHP教程
  2. 【收藏】C# 2.03.0新特性总结
  3. 感量越大抑制频率约低_东芝推出高纹波抑制比、低噪声LDO稳压器
  4. C++:cin、cin.getline()、getline()的用法
  5. Intel Realsense 使用D435时需安装的几款官方软件
  6. SpringBoot整合HBase将数据写入Docker中的HBase
  7. 我来更新了,说说工作中的Java处理异常
  8. opencv vs2010 配置
  9. 【python】获取列表中最长连续数字
  10. 魅族16s Pro最新预热海报公布:将配备双扬声器
  11. MyBatis学习总结(15)——定制Mybatis自动代码生成的maven插件
  12. ansys workbench 帮助文档在哪_中英对照读ANSYS帮助文档,是怎么玩的?
  13. Active Directory之强制占有操作主机
  14. 如何使用虚拟串口软件进行串口调试
  15. 16位图xxxxxxxxxxxx
  16. Linux内核之进程管理
  17. XSS笔记-来源于个人思路构造以及网络分享
  18. 想自己动手制作游戏动漫角色模型,教你几招,一定要看看!
  19. HDU - 5976 Detachment(贪心思维)
  20. CometOJ #10 沉鱼落雁 | 思维

热门文章

  1. 百旺智能编码_“智能编码”助手助您规范使用税收分类编码
  2. vscode使用svn插件
  3. html5中webSql的应用
  4. MOE 分子动力学模拟操作
  5. 什么是CMMI认证?
  6. Privoxy教程使用详解
  7. 使用Seay进行代码安全审计
  8. 001 - CMake 安装
  9. Kettle 使用JS加密解密
  10. JS des加密解密