MongoDB 从3.2 版本以后添加了对中文索引的支持: 
官网链接:https://docs.mongodb.com/manual/reference/text-search-languages/ 
下面就举例来看一下MongoDB 的中文索引是怎么样的? 
创建一个集合textIndexTest: 
插入下面四条数据:

db.textIndexTest.insert({author:"杜甫",title:"绝句",article:"两个黄鹂鸣翠柳,   一行白鹭上青天。窗含西岭千秋雪,门泊东吴万里船。"})
1
db.textIndexTest.insert({author:"李白",title:"静夜思",article:"床前明月光,疑是地上霜。 举头望明月,低头思故乡。"})
1
db.textIndexTest.insert({author:"张 王",title:"你好",article:"测试数据"})
1
db.textIndexTest.insert({author:"李贺",title:"李凭箜篌引",article:"吴丝蜀桐张高秋,空山凝云颓不流。 江娥啼竹素女愁,李凭中国弹箜篌。 昆山玉碎凤凰叫,芙蓉泣露香兰笑。 十二门前融冷光,二十三丝动紫皇。 女娲炼石补天处,石破天惊逗秋雨。 梦入神山教神妪,老鱼跳波瘦蛟舞。 吴质不眠倚桂树,露脚斜飞湿寒兔。"})```
1
对textIndexTest 的作者创建索引:

db.textIndexTest.createIndex( { author: "text", description: "text" } )
1
注释:

db.collection.ensureIndex(keys, options) 这个语句在3.0被废弃掉, db.collection.ensureIndex() 现在是db.collection.createIndex()的一个别名 
都是创建一个索引 如果索引不存在。

查看一下索引

db.textIndexTest.getIndexes()
1
接下来用索引搜索: 
搜索李白的db.textIndexTest.find({text:{text:{search:”李白”}}) 果: 
{ “_id” : ObjectId(“5ae13997ae983fb3f92c9f5b”), “author” : “李白”, “title” : “静夜思”, “article” : “床前明月光,疑是地上霜。 举头望明月,低头思故乡。” } 
单搜李白的“李”字

db.textIndexTest.find({$text:{$search:"李"}}) 
1
运行无结果。 
单搜一个“王”字

db.textIndexTest.find({$text:{$search:"王"}}) 
1
出来了: 
{ “_id” : ObjectId(“5ae14037ae983fb3f92c9f5d”), “author” : “张 王”, “title” : “你好”, “article” : “测试数据” } 
不难看出: 
MongoDB中文全文索引建立方式与英文的简历几乎相同 是根据词(英文单词)的方式建立的。 
如果一个值里面有多个值 则需要按空格方式隔开,”张 王” 系统则认为是两个词。 
感觉MongodB的中文全文索引沒有想象中的强大。想要实现中文模糊搜素 
可以用elasticsearch或者Sphinx,或者lucene
--------------------- 
作者:中国流浪猫 
来源:CSDN 
原文:https://blog.csdn.net/a41888313/article/details/80091935 
版权声明:本文为博主原创文章,转载请附上博文链接!

MongoDB 中文的全文索引相关推荐

  1. MongoDB 索引之全文索引

    mongodb full text search(fts:全文搜素)是在版本2.4新加的特性.在以前的版本,是通过精确匹配和正则表达式来查询,这效率是很低的.全文索引,能够从大量的文本中搜索出所需的内 ...

  2. 【议程公布】2021年MongoDB中文社区南京技术沙龙

    ​2021年MongoDB南京线下技术交流会将于11月20日(周六)在南京雨花台区进行.本次会议由MongoDB中文社区.MongoDB官方和Tapdata联合举办.会上我们将一如既往地把MongoD ...

  3. 议程公布!2021年MongoDB中文社区杭州大会

    2021年MongoDB中文社区杭州技术大会由MongoDB中文社区联合MongoDB官方,Tapdata 和阿里云一同举办,将于7月3日(周六)在杭州余杭区举办,大会分享MongoDB典型用例及最新 ...

  4. 2019年MongoDB中文社区 上海大会

    2019年MongoDB中文社区上海大会 MongoDB发展迅猛,今年8月份已正式上线4.2版本,独立研究机构评论其为数据库即服务领导者,也是近几年Stack Overflow等开发者社区最受欢迎的数 ...

  5. 2020年MongoDB中文社区年终线上大会全纪录【附PPT及视频回放】

    2021年1月8日,MongoDB中文社区联合MongoDB官方.锦木信息.Tapdata和华为开展2020年MongoDB中文社区年终大会. 点击下方链接 即可观看线上会议回放 http://www ...

  6. MongoDB 中文显示乱码的 真正原因和解决方案,真的是cmd问题吗?

    1. 服务端设置, MongoDB 中文乱码的 真正原因和解决方案 1, 服务端返回值设置,一定要是UTF-8response.setCharacterEncoding("utf-8&quo ...

  7. MongoDB中文社区年终盛典

    2017年, Mongoing中文社区携手海量数据学院走进了8座城市, 从花香四溢的暖春走到了寒意凛然的初冬. 2018年的1月, 我们将在帝都举办Mongoing中文社区的年终盛会. 届时 众多技术 ...

  8. MongoDB + PostgreSQL中文社区 南京技术大会

    MongoDB+PostgreSQL中文社区南京技术大会 时间:2019年5月24日  9:00-17:30 地点:江苏省南京市玄武区珠江路498号INNO未来城2号门进入2楼 报名链接:http:/ ...

  9. Database Clinic: MongoDB 数据库诊所:MongoDB Lynda课程中文字幕

    Database Clinic: MongoDB 中文字幕 数据库诊所:MongoDB 中文字幕Database Clinic: MongoDB Database Clinic系列针对一系列相同的挑战 ...

最新文章

  1. [转]实战 SQL Server 2008 数据库误删除数据的恢复
  2. Apache服务器二级域名的完美实现
  3. delphi 中CreateOleObject函数产生的对象的释放问题
  4. win8看不到win7局域网计算机名,实现Win7旗舰版与win8.1系统局域网里文件共享的设置方法【图】...
  5. 现代人的压力和焦虑_设计师如何建立减少焦虑和压力的体验
  6. 返回CompletableFuture:Java 8功能亮点
  7. 取当前进程对应之静态映像文件的绝对路径/proc/self/exe
  8. JDK源码(19)-Void
  9. 程序员 30 岁前,该如何规划自己的职业发展?
  10. C# 中 ? 和 ??
  11. 机器视觉系统设计难点有哪些?
  12. 【ArcGIS操作】1 基础编辑篇
  13. 更改自定义按钮显示值并对单元格赋值
  14. vs2013的mfc开发上位机
  15. LPWAN——Sigfox实战经验介绍
  16. X230 安装 EI Capitan 10.11.5 驱动篇
  17. python科赫雪花正方形_python—科赫曲线(科赫雪花小包裹)
  18. 详解wait/waitpid的参数:status
  19. Centos(Linux)系统备份与还原
  20. 三星S7 Edge怎么打开usb调试呢

热门文章

  1. 函数式编程:Python 调用迅雷下载
  2. HackTheBox-Chase
  3. PDF Squeezer for Mac(强大的PDF文件压缩工具)
  4. Learning Pyramid-Context Encoder Network for High-Quality Image Inpainting论文理解
  5. 10个java调试技巧
  6. oracle 00002,EXP-00002错误,求助
  7. 首次跌至发行价的Snap,要如何抵抗社交巨头Facebook的抄袭?
  8. Python+Tensorflow实现检测X光图像中的新冠!
  9. 编程从键盘输入一个字符串,统计该字符串中从‘a‘到‘z‘共26个小写字母各自出现的次数, 将结果存入数组中,并输出
  10. shell 经典, shell 十三问