MongoDB 中文的全文索引
MongoDB 从3.2 版本以后添加了对中文索引的支持:
官网链接:https://docs.mongodb.com/manual/reference/text-search-languages/
下面就举例来看一下MongoDB 的中文索引是怎么样的?
创建一个集合textIndexTest:
插入下面四条数据:
db.textIndexTest.insert({author:"杜甫",title:"绝句",article:"两个黄鹂鸣翠柳, 一行白鹭上青天。窗含西岭千秋雪,门泊东吴万里船。"})
1
db.textIndexTest.insert({author:"李白",title:"静夜思",article:"床前明月光,疑是地上霜。 举头望明月,低头思故乡。"})
1
db.textIndexTest.insert({author:"张 王",title:"你好",article:"测试数据"})
1
db.textIndexTest.insert({author:"李贺",title:"李凭箜篌引",article:"吴丝蜀桐张高秋,空山凝云颓不流。 江娥啼竹素女愁,李凭中国弹箜篌。 昆山玉碎凤凰叫,芙蓉泣露香兰笑。 十二门前融冷光,二十三丝动紫皇。 女娲炼石补天处,石破天惊逗秋雨。 梦入神山教神妪,老鱼跳波瘦蛟舞。 吴质不眠倚桂树,露脚斜飞湿寒兔。"})```
1
对textIndexTest 的作者创建索引:
db.textIndexTest.createIndex( { author: "text", description: "text" } )
1
注释:
db.collection.ensureIndex(keys, options) 这个语句在3.0被废弃掉, db.collection.ensureIndex() 现在是db.collection.createIndex()的一个别名
都是创建一个索引 如果索引不存在。
查看一下索引
db.textIndexTest.getIndexes()
1
接下来用索引搜索:
搜索李白的db.textIndexTest.find({text:{text:{search:”李白”}}) 果:
{ “_id” : ObjectId(“5ae13997ae983fb3f92c9f5b”), “author” : “李白”, “title” : “静夜思”, “article” : “床前明月光,疑是地上霜。 举头望明月,低头思故乡。” }
单搜李白的“李”字
db.textIndexTest.find({$text:{$search:"李"}})
1
运行无结果。
单搜一个“王”字
db.textIndexTest.find({$text:{$search:"王"}})
1
出来了:
{ “_id” : ObjectId(“5ae14037ae983fb3f92c9f5d”), “author” : “张 王”, “title” : “你好”, “article” : “测试数据” }
不难看出:
MongoDB中文全文索引建立方式与英文的简历几乎相同 是根据词(英文单词)的方式建立的。
如果一个值里面有多个值 则需要按空格方式隔开,”张 王” 系统则认为是两个词。
感觉MongodB的中文全文索引沒有想象中的强大。想要实现中文模糊搜素
可以用elasticsearch或者Sphinx,或者lucene
---------------------
作者:中国流浪猫
来源:CSDN
原文:https://blog.csdn.net/a41888313/article/details/80091935
版权声明:本文为博主原创文章,转载请附上博文链接!
MongoDB 中文的全文索引相关推荐
- MongoDB 索引之全文索引
mongodb full text search(fts:全文搜素)是在版本2.4新加的特性.在以前的版本,是通过精确匹配和正则表达式来查询,这效率是很低的.全文索引,能够从大量的文本中搜索出所需的内 ...
- 【议程公布】2021年MongoDB中文社区南京技术沙龙
2021年MongoDB南京线下技术交流会将于11月20日(周六)在南京雨花台区进行.本次会议由MongoDB中文社区.MongoDB官方和Tapdata联合举办.会上我们将一如既往地把MongoD ...
- 议程公布!2021年MongoDB中文社区杭州大会
2021年MongoDB中文社区杭州技术大会由MongoDB中文社区联合MongoDB官方,Tapdata 和阿里云一同举办,将于7月3日(周六)在杭州余杭区举办,大会分享MongoDB典型用例及最新 ...
- 2019年MongoDB中文社区 上海大会
2019年MongoDB中文社区上海大会 MongoDB发展迅猛,今年8月份已正式上线4.2版本,独立研究机构评论其为数据库即服务领导者,也是近几年Stack Overflow等开发者社区最受欢迎的数 ...
- 2020年MongoDB中文社区年终线上大会全纪录【附PPT及视频回放】
2021年1月8日,MongoDB中文社区联合MongoDB官方.锦木信息.Tapdata和华为开展2020年MongoDB中文社区年终大会. 点击下方链接 即可观看线上会议回放 http://www ...
- MongoDB 中文显示乱码的 真正原因和解决方案,真的是cmd问题吗?
1. 服务端设置, MongoDB 中文乱码的 真正原因和解决方案 1, 服务端返回值设置,一定要是UTF-8response.setCharacterEncoding("utf-8&quo ...
- MongoDB中文社区年终盛典
2017年, Mongoing中文社区携手海量数据学院走进了8座城市, 从花香四溢的暖春走到了寒意凛然的初冬. 2018年的1月, 我们将在帝都举办Mongoing中文社区的年终盛会. 届时 众多技术 ...
- MongoDB + PostgreSQL中文社区 南京技术大会
MongoDB+PostgreSQL中文社区南京技术大会 时间:2019年5月24日 9:00-17:30 地点:江苏省南京市玄武区珠江路498号INNO未来城2号门进入2楼 报名链接:http:/ ...
- Database Clinic: MongoDB 数据库诊所:MongoDB Lynda课程中文字幕
Database Clinic: MongoDB 中文字幕 数据库诊所:MongoDB 中文字幕Database Clinic: MongoDB Database Clinic系列针对一系列相同的挑战 ...
最新文章
- [转]实战 SQL Server 2008 数据库误删除数据的恢复
- Apache服务器二级域名的完美实现
- delphi 中CreateOleObject函数产生的对象的释放问题
- win8看不到win7局域网计算机名,实现Win7旗舰版与win8.1系统局域网里文件共享的设置方法【图】...
- 现代人的压力和焦虑_设计师如何建立减少焦虑和压力的体验
- 返回CompletableFuture:Java 8功能亮点
- 取当前进程对应之静态映像文件的绝对路径/proc/self/exe
- JDK源码(19)-Void
- 程序员 30 岁前,该如何规划自己的职业发展?
- C# 中 ? 和 ??
- 机器视觉系统设计难点有哪些?
- 【ArcGIS操作】1 基础编辑篇
- 更改自定义按钮显示值并对单元格赋值
- vs2013的mfc开发上位机
- LPWAN——Sigfox实战经验介绍
- X230 安装 EI Capitan 10.11.5 驱动篇
- python科赫雪花正方形_python—科赫曲线(科赫雪花小包裹)
- 详解wait/waitpid的参数:status
- Centos(Linux)系统备份与还原
- 三星S7 Edge怎么打开usb调试呢
热门文章
- 函数式编程:Python 调用迅雷下载
- HackTheBox-Chase
- PDF Squeezer for Mac(强大的PDF文件压缩工具)
- Learning Pyramid-Context Encoder Network for High-Quality Image Inpainting论文理解
- 10个java调试技巧
- oracle 00002,EXP-00002错误,求助
- 首次跌至发行价的Snap,要如何抵抗社交巨头Facebook的抄袭?
- Python+Tensorflow实现检测X光图像中的新冠!
- 编程从键盘输入一个字符串,统计该字符串中从‘a‘到‘z‘共26个小写字母各自出现的次数, 将结果存入数组中,并输出
- shell 经典, shell 十三问