全文索引用于处理大文本集合,利用它人们可以在海量文本中快速获取需要的信息。全文检索系统是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。一般来说,全文检索需要具备建立索引和提供查询的基本功能,此外现代的全文检索系统还需要具有方便的用户接口、面向WWW的开发接口、二次应用开发接口等等。功能上,全文检索系统核心具有建立索引、处理查询返回结果集、增加索引、优化索引结构等等功能,外围则由各种不同应用具有的功能组成。结构上,全文检索系统核心具有索引引擎、查询引擎、文本分析引擎、对外接口等等,加上各种外围应用系统等等共同构成了全文检索系统。

  全文检索的核心技术是将源文档中所有的基本元素的出现信息记录到索引库中。中文全文检索技术在原理上同西文全文检索是一致的,但汉字本身的特点使中文系统的实现比西文系统更为复杂。在西文中,文档的基本元素是单词,可以以单词建立索引库,而且单词与单词之间有天然的间隔符空格,所以索引文件的建立相对简单。在中文系统中,基本元素可以是单个汉字字符,也可以是词。

  灵玖Nlpir Parser智能语义平台全文搜索系统内核经过精心设计,具有高扩展性和高通用性。可支持文本、数字、日期、字符串等各种数据类型的高效索引,支持丰富的查询语言和查询类型,支持少数民族语言的搜索。

  同时,全文搜索中间件可以无缝地与现有数据库系统融合,实现全文搜索与相关的数据库管理应用系统。

  其主要特色在于:

  1、可以按照任意指定字段的排序,支持指定字段的搜索,也可以搜索多个字段,以及复杂表达式的综合搜索;

  2、支持精确匹配以及模糊匹配,默认为精确匹配,忽略字母大小写进行模糊匹配;

  3、实现的是多线程搜索服务;

   4、 每秒可索引3000条记录(主要瓶颈为数据库或文件记录的读取效率);搜索速度在毫秒级别。

   5、兼容当前所有厂商的数据库系统,其中SQL Server, Oracle, MySQL,DB2等。

  Nlpir Parser智能语义平台全文搜索系统可以适用于众多应用场景,它的广泛适用性体现在能处理结构化和非结构化的各类文本数据,能够采集各种来源文本,这些来源可能是跨越广泛地理分布的,也可以是不同介质、不同格式产生的文本。全文检索具有对检索出的文本进行处理的能力,并且以用户乐于接受的形式提供检索并加工处理文本,使检索系统功能得到了延伸。

转载于:https://www.cnblogs.com/ljrj/p/6743644.html

Nlpir Parser智能语义平台全文搜索相关推荐

  1. 几大智能语义平台调研

    几个平台 此次主要是调研了以下五家智能语义平台: 阿里云小蜜(beebot)  www.aliyun.com/product/beebot 百度度秘(DuerOS)dueros.baidu.com 腾 ...

  2. 【​观察】全国首个智能语义平台上线 神州泰岳开放语义技术的“图谋”之大...

    申耀的科技观察 读懂科技,赢取未来! 如果说过去十年是互联网颠覆商业模式的十年,那么未来十年人工智能则有极大的可能接棒互联网,成为新的风口并产生新的商业机会. 而在这个过程中,被公认为人工智能&quo ...

  3. NLPIR语义平台全新上线九眼专业合同智能审核系统

    合同作为一种实现双方当事人利益的手段或工具,本应当具有相对的稳定性.由于人员素质.合同双方主体.合作周期等等因素使合同在实施的过程中存在着很强的动态性与不确定性.因此合同审核就非常重要了. 九眼专业合 ...

  4. 灵玖Nlpir Parser语义智能系统精准汉语分词

    词是最小的能够独立活动的有意义的语言成分.在汉语中,由于词与词之间不存在分隔符,词本身也缺乏明显的形态标记,因此汉语浅层分析的特有问题就是如何将汉语的字串分割为合理的词语序列. 实际上,汉语分词的主要 ...

  5. NLPIR智能语义:大数据挖掘助力人工智能快速发展

    人工智能(ArtificialIntelligence) ,英文缩写为AI,也称机器智能."人工智能"一词最初是在1956年Dartmouth学会上提出的.它是计算机科学.控制论. ...

  6. NLPIR智能语义:大数据精准挖掘是信息化发展趋势

    随着信息技术的高速发展.数据库管理系统的广泛应用,人们积累的数据量急剧增长,大量的信息给人们带来方便的同时,也带来了诸如:信息过量难以消化,信息真假难以辨识,信息安全难以保证,信息形式不一致难以统一处 ...

  7. NLPIR智能语义技术从采集到分析一步到位

    随着计算机技术的发展,信息数据越来越多,如何从海量数据中提取对人们有价值的信息已经成为一个非常迫切的问题.由此产生了数据挖掘技术,它是一门新兴的交叉学科,汇集了来自机器学习.模式识别.数据库.统计学. ...

  8. 灵玖软件:NLPIR大数据语义智能为企业“画像”

    随着计算机技术.网络技术.通讯技术.Internet技术的迅速发展和电子商务.办公自动化.管理信息系统.Internet 的普及等,企业业务操作流程日益自动化,企业经营过程中产生了大量的数据,这些数据 ...

  9. ML:阿里云计算平台之搜索推荐演讲分享《多场景智能推荐助力业务增长》、《阿里云智能推荐应用实践:PAI-EasyRec Framework》、《新一代数仓架构漫谈》

    ML:阿里云计算平台之搜索推荐演讲分享<多场景智能推荐助力业务增长>.<阿里云智能推荐应用实践:PAI-EasyRec Framework>.<新一代数仓架构漫谈> ...

最新文章

  1. 在MAC上搭建eclipse+android开发环境以及eclipse的svn插件的安装
  2. 用一维数组统计五个人的成绩中的最大值最小值平均值_昨天为了整理这份教程,我放弃了参加一个几亿人的大项目。...
  3. 44、生鲜电商平台-Java后端生成Token架构与设计详解
  4. Mui --- app与服务器之间的交互原理、mui ajax使用
  5. 11dayC语言指针-指针变量
  6. 华为linux版本wifi驱动,华为随身wifi驱动
  7. 百度地图 java 纠偏_模板:纠偏服务首页 | 百度地图API SDK
  8. DarkComet Analysis – Understanding the Trojan used in Syrian Uprising
  9. java 帕斯卡_Java编程实现帕斯卡三角形代码示例
  10. 南航率先启用“手机登机”
  11. windows关闭休眠
  12. 在麒麟桌面操作系统编译安装postgresql的经历
  13. 美团已开始研发大模型 ;华为MetaERP全球上线;金山软件一季度净利润同比增长96%丨每日大事件...
  14. 抖音和tiktok是什么关系?TikTok和抖音差别大吗?
  15. 从购买ECS到SpringCloud项目的自动化部署及发布
  16. IT咨询业发展三道坎
  17. 去除idea中xml黄色背景
  18. java用代码实现星期菜谱_基于JAVA的菜谱大全接口调用代码实例
  19. matlab的estimate函数,matlab的estimate函数输出值什么意思 [fit3 varcov logL info]=estimate(mdl,a)...
  20. Spark任务执行流程

热门文章

  1. Oracle数据库一致性读的原理
  2. 云计算的SPI服务模型
  3. Spring Security OAuth2.0_实现分布式认证授权_集成测试_Spring Security OAuth2.0认证授权---springcloud工作笔记155
  4. Ui学习笔记---EasyUI的使用方法,EasyLoader组件使用
  5. 给公司的电脑配置theano
  6. 学习GNU Make (1)(转)
  7. ucc编译器(入门)
  8. C语言和设计模式(之模板模式)
  9. 分形图案c语言源程序,Mandlbrot集图形的一个C语言实现
  10. 搭建centos在线yum源镜像服务器,搭建CentOS在线yum源镜像服务器(上)