继百度企业搜索部门裁员30人之后,另一家搜索引擎厂商中国搜索也传出裁员的消息。有消息称,中搜此番裁员将主要集中在非IG(个人门户)部门,整体裁员比例可能高达40%。一年前,为了给个人门户业务让路,中搜已停掉了企业搜索业务。<?XML:NAMESPACE PREFIX = O NS = "urn:schemas-microsoft-com:office:office" />

在接受媒体采访时,中搜总裁陈沛确认了将有人员调整的消息,但对具体裁员数字则顾左右而言他。

戏剧性的是,在中搜裁员传闻尚未尘埃落定之际,百度被裁员工的去向却有了着落。消息人士透露,百度ES部门的多名离职员工日前已投奔企业搜索巨头Autonomy中国公司,其中既有市场销售人员,也有技术人员。

据了解,尽管百度在此次裁员行动前曾与ES部门员工签署竞业限制协议(也称同业禁止协议),规定员工离职1年内不得进入竞争对手的公司工作,但在7月10日的裁员行动中,百度并未按照劳动法相关规定向离职员工支付竞业限制补偿金,而只是按N+1标准补发了相应工资,对部分有期权的员工也只补发了一个月的期权。这意味着百度当初与员工签订的竞业限制协议已自动失效。同时,由于百度已经关闭了企业搜索软件和相关服务部门,因此百度与Autonomy之间已不存在同业竞争关系。

围城效应

形成对照的是,在中搜、百度纷纷从企业搜索领域战略撤退的同时,Google、微软、IBM等却摩拳擦掌,相继在该领域投入重兵,而企业搜索的老牌劲旅Autonomy、Fast等则拥兵自重,一路稳扎稳打,张弛有致地扩充着势力范围。

Google方面,其企业软件目前虽然仅占总收入的极小比例,但已将企业搜索引擎视为“解决利益问题的战略据点”( Google首席执行官埃里克.舒米特语)。从2002年迄今,Google先后推出了企业搜索设备GSA、OneBox、Google Mini等多款产品,并通过在其中捆绑Gmail、企业级桌面搜索工具等产品模块,以整合的产品模块、颇具诱惑力的低格、极为简便的许可模式,在企业搜索领域连连攻城拔寨。2005年,Google从企业搜索业务中获取的收入达到了7500万美元。虽然相比于Autonomy同期2.7亿美元的销售收入仍有距离,而且其桌面搜索工具的推出要晚于Autonomy整整10年,但凭借其强大的品牌优势,Google此番来势之凶猛,依然令人瞠目。

将企业搜索市场视为禁脔之地的不只是Google,微软COO凯文·特纳(Kevin Turner)就曾放话说:“企业搜索是我们的地盘,Google不应该插手。”

Autonomy也没闲着。继去年斥资5亿美元购并Verity之后,Autonomy一面在国内秘密部署视频搜索门户,一面则极力拼抢企业级市场。据悉,近期该公司将同时发布三大系列专门针对中国市场的应用产品,分别是面向企业的“企业竞争情报智能分析系统”、面向政府部门的“互联网舆情监控分析系统”和面向中小企业的一款名为“ultraseek”的低端搜索产品。

算法优劣论

以Google的PageRank算法和百度的超链分析为代表的关键词搜索引擎技术在大型的、结构化的网络搜索中取得了空前成功,但是在结构更为紧密的企业管理系统中,该算法在索引、安全以及关联操作上,仍存在若干局限。

如所周知,PageRank算法基于如下假设:指向一个网页的链接越多,这个被指向的网页的相关性及权重就越高,从而也就会排在更靠前的位置。百度的超链分析与此稍有不同。除了文件本身对关键词的引用外,超链分析还考虑了反向链接中的关键词。当一个关键词被搜索时,含有以关键词为链接文字的反向链接数目最多的那个文件或网页,将被作为最相关的结果排在前面。

上述算法在网页搜索方面很有效,特别是凭借布尔表达式查询的时候,但在搜索结果的呈现方式如自动关联、自动分类、自动聚类、个性化建档等方面,则可说建树不多。

不妨来看看Autonomy的做法。Autonomy的算法基于一种专有的模式匹配技术,可根据单词或词语的出现频率来识别不同文本在上下文环境中的语义,并以此判断一篇文档与某个主题的相关度。通过这种方法,Autonomy可抽取文档中的文本要素,自动识别文本的概念。也因此,该算法 本身兼具了某种程度的语义搜索功能,同时也克服了PageRank算法中关键词之间没有重要性差别、也不支持语义搜索和自然语言搜索的缺陷。

也是因为基于模式匹配和概念搜索的算法,Autonomy可抽取文档中包含的重要概念自动进行聚类,将相似的文档聚类到一起并自动生成类别的标题。该算法还可以自动对信息进行分类,自动标引,并基于用户兴趣自动匹配出个性化、多侧面的直接档案和隐含档案(通过点击和提交)。固然,传统关键词搜索也支持自动分类,但由于使用的是传统SVM和KNN算法进行分类,在分类效率和准确率上仅可做到差强人意。

模式识别算法还可以对文档中最主要的概念进行动态摘要,依据用户的兴趣所在和相关性权重值的不同,每次摘要的内容可以是不同的,而关键词搜索只能生成固定的摘要信息,且摘要信息往往不连贯,甚至无法卒读。

此外,模式识别算法也可以分析信息间的主要关系,从而实现内容间的交叉索引对照和自动关联,并实时生成超链接。当文档被查阅时,这些链接可以自动一次性插入到文档中,因此可以将以前写的文档作为当前文档的参考,档案资料也可以链接到最新的新闻或相关资料。而关键词算法则是基于矩阵模型的相关文件分析,处理效率取决于文章大小和文章数量。基本上,文章数一超过10万量级,搜索响应速度就会受到影响。

不过有迹象表明,Google、百度、微软等关键词搜索厂商正在着力修补自身的搜索模型,为之增加更多的变量,并在探索更个性化、更具有相关性的呈现方式。一个例子是百度指数和Google趋势中文版的先后上线。作为一种显示关键词搜索量随时间走势变化的应用,二者可视为百度和Google在个性化搜索领域的初步尝试。有意思的是,此前数年Autonomy推出的二维岛图、三维信息图等图形化搜索结果聚类呈现方式,与此颇多神似之处。

更多的信息显示,Google、IBM已在研发自然语言搜索、语义搜索等第三代搜索技术,微软MSN部门已在研发智能问答式搜索、个性化搜索、个性化用户界面等技术领域,而雅虎和百度则在社会化搜索、社区搜索领域走在了前面。

转载于:https://www.cnblogs.com/xinbin/archive/2006/08/04/467411.html

企业搜索凸现围城效应相关推荐

  1. SharePoint 2013中规划企业搜索体系结构

    SharePoint 2013中规划企业搜索体系结构 摘要:了解如何规划小型.中型或大型企业搜索体系结构. 设置企业搜索体系结构之前,需要仔细规划很多事项.我们将逐步帮助您规划小型.中型或大型企业搜索 ...

  2. 如何实施好基于MOSS的企业搜索项目(上)

    文章目的:希望通过此文,能让读者了解搜索的本质和基于MOSS的企业搜索方案,在此基础上站在项目管理角度掌 握如何实施好这类方案的项目的关键点,确保企业搜索项目成功交付.由于文章长度限制,本文分上下两部 ...

  3. 基于Python 实现企业搜索系统(信息检索)【100010418】

    信息检索实验三:企业搜索系统的设计与实现 1 实验目的 本次实验目的是对企业检索系统的设计与实现过程有一个全面的了解.本次实验设计的内容包括:对数据建立索引,实现文档的搜索,并对检索结果排序:实现企业 ...

  4. 「智能企业搜索」:为什么知识图和NLP可以提供所有正确答案

    在获取信息和洞察力方面,我们正处于一个彻底转变的边缘,我们需要更聪明.更有效地工作.在这篇博客中,我将展示人工智能技术如何增强互联网搜索,现在如何应用于组织内部,从而彻底改变企业搜索所能实现的目标. ...

  5. AI知识中台|沃丰科技GaussMind企业搜索赋能企业场景化搜索新体验

    企业最大的浪费,是经验的浪费.GaussMind "AI知识中台"解决方案,涵盖KCS知识库.知识图谱.企业搜索等模块,通过对企业各个系统散落的信息做加工.汇聚.组织.利用,帮助企 ...

  6. SharePoint 企业搜索-PowerShell

    1. 显示企业搜索服务信息 Get-SPEnterpriseSear1chService 2. 显示企业搜索服务实例 Get-SPEnterpriseSearchServiceInstance 3. ...

  7. 泛企业搜索PK互联网搜索

    也许,这几年过多的目光关注于互联网搜索,Google,Baidu市值的高涨,让人们对它们倍加关注.其实,搜索,不光是面向公众的互联网搜索.还有专注于企业内的非结构化数据搜索,它同样会面临着海量数据处理 ...

  8. Java企业搜索平台:起点R3(Rivulet ES) V5.0 使用简介

    最近接到的任务是搜索平台模块需求研究,网上搜到佛山一家专做企业搜索的公司开源的一个工程R3.关于起点R3企业搜索的相关介绍如下: 起点R3企业级搜索引擎是起点软件提供的企业搜索解决方案,支持企业环境下 ...

  9. SharePoint 2013 企业搜索架构示例

     博客地址:http://blog.csdn.net/FoxDave 本文参考自微软官方的Chart,我们来看一下企业中对于不同规模SharePoint搜索的场的架构是什么样的. 对于搜索场的规模 ...

最新文章

  1. 腾讯员工上半年人均月薪 7.8 万,网友:别人拿月薪我拿年薪。。。
  2. wxWidgets:使用 wxWidgets 的示例控制台(与 GUI 相对)程序
  3. OpenI部署二——转载
  4. jdbc如何写csv文件_Java:将JDBC结果集作为CSV流化
  5. 让 Chrome 57 支持迅雷精简版
  6. fft算法的c语言实现dsp,基于DSP的FFT算法实现.doc
  7. Pytorch显存分配机制与显存占用分析方法
  8. 选拨管理者的一个必要条件
  9. 【计算几何】德劳内三角剖分算法 | 利用 scatter 绘制散点图 | 实现外接圆生成 | scipy库的 Dealunay 函数 | 实战: A-B间欧氏距离计算
  10. js find(),findIndex()方法的使用
  11. 《数字营销实战》思维导图
  12. Python中range()函数用法
  13. echarts rich设置动态图片/动态数据;echarts 人均收入柱状图 window系统显示不出国旗;echarts动态rich
  14. English - therefore,so,hence,then,accordingly,thus用法解析
  15. Windows XP中自动登录设置
  16. 美联储:加息50基点,6月开始缩表
  17. 固态硬盘的计算机需要进行磁盘碎片整理吗,固态硬盘需要整理磁盘碎片吗?
  18. 【北交所周报】中字头概念股爆发,中纺标大涨21%;舜宇精工、佳合科技等4家企业IPO闯关成功;...
  19. 麦克风FCC-ID认证
  20. 嵌入式linux dlna,基于嵌入式Linux的家用蓝光播放机上DLNA功能的实现

热门文章

  1. 4月全球“.网址”域名总量排行榜:ZDNS份额仍超99%
  2. JDK 内置图形界面工具:海阔凭鱼跃,天高任鸟飞
  3. 国际知名投资者法律顾问ROSEN鼓励Tarena International, Inc.投资者在TEDU证券集体诉讼的重要截止日期8月23日之前聘请律师
  4. 关于360浏览器兼容模式下文档模式默认以ie7标准渲染
  5. 这些手写代码会了吗?少年
  6. PyTorch Tensor 的形状
  7. C4D基础学习(二)-移动与捕捉工具
  8. 华为云 ModelArts——简单的机器学习 初体验
  9. 8除以2表示什么意思_8除以2等于4表示什么
  10. dockers安装Jenkins