白话Elasticsearch15-深度探秘搜索技术之使用copy_to定制组合field解决cross-fields搜索弊端
文章目录
- 概述
- 官网
- 例子
- 总结
概述
继续跟中华石杉老师学习ES,第15篇
课程地址: https://www.roncoo.com/view/55
官网
https://www.elastic.co/guide/en/elasticsearch/reference/current/copy-to.html
---------
例子
新增字段,用作测试
PUT /forum/_mapping/article
{"properties": {"new_author_first_name": {"type": "text","copy_to": "new_author_full_name"},"new_author_last_name": {"type": "text","copy_to": "new_author_full_name"},"new_author_full_name": {"type": "text"}}
}
更新数据
POST /forum/article/_bulk
{ "update": { "_id": "1"} }
{ "doc" : {"new_author_first_name" : "Peter", "new_author_last_name" : "Smith"} }
{ "update": { "_id": "2"} }
{ "doc" : {"new_author_first_name" : "Smith", "new_author_last_name" : "Williams"} }
{ "update": { "_id": "3"} }
{ "doc" : {"new_author_first_name" : "Jack", "new_author_last_name" : "Ma"} }
{ "update": { "_id": "4"} }
{ "doc" : {"new_author_first_name" : "Robbin", "new_author_last_name" : "Li"} }
{ "update": { "_id": "5"} }
{ "doc" : {"new_author_first_name" : "Tonny", "new_author_last_name" : "Peter Smith"} }
查询
GET /forum/article/_search
{"query": {"match": {"new_author_full_name": "Peter Smith"}}
}
返回结果
{"took": 3,"timed_out": false,"_shards": {"total": 1,"successful": 1,"skipped": 0,"failed": 0},"hits": {"total": 2,"max_score": 2.3258216,"hits": [{"_index": "forum","_type": "article","_id": "1","_score": 2.3258216,"_source": {"articleID": "XHDK-A-1293-#fJ3","userID": 1,"hidden": false,"postDate": "2017-01-01","tag": ["java","hadoop"],"tag_cnt": 2,"view_cnt": 30,"title": "this is java and elasticsearch blog","content": "i like to write best elasticsearch article","sub_title": "learning more courses","author_first_name": "Peter","author_last_name": "Smith","new_author_last_name": "Smith","new_author_first_name": "Peter"}},{"_index": "forum","_type": "article","_id": "5","_score": 1.7770995,"_source": {"articleID": "DHJK-B-1395-#Ky5","userID": 3,"hidden": false,"postDate": "2019-05-01","tag": ["elasticsearch"],"tag_cnt": 1,"view_cnt": 10,"title": "this is spark blog","content": "spark is best big data solution based on scala ,an programming language similar to java","sub_title": "haha, hello world","author_first_name": "Tonny","author_last_name": "Peter Smith","new_author_last_name": "Peter Smith","new_author_first_name": "Tonny"}}]}
}
总结
cross field的问题,是否解决了呢?
问题1:只是找到尽可能多的field匹配的doc,而不是某个field完全匹配的doc
答: 解决,最匹配的document被最先返回
问题2:most_fields,没办法用minimum_should_match去掉长尾数据,就是匹配的特别少的结果
答: 解决,可以使用minimum_should_match去掉长尾数据
问题3:TF/IDF算法,比如Peter Smith和Smith Williams,搜索Peter
Smith的时候,由于first_name中很少有Smith的,所以query在所有document中的频率很低,得到的分数很高,可能Smith Williams反而会排在Peter Smith前面答: 解决,Smith和Peter在一个field了,所以在所有document中出现的次数是均匀的,不会有极端的偏差
白话Elasticsearch15-深度探秘搜索技术之使用copy_to定制组合field解决cross-fields搜索弊端相关推荐
- YOLOv8改进MobileNetV3主干:基于互补搜索技术和新颖架构设计组合MobileNetV3结构作为Backbone主干网络,打造不同的检测器
- 白话Elasticsearch16-深度探秘搜索技术之使用原生cross-fiedls技术解决搜索弊端
文章目录 概述 例子 概述 继续跟中华石杉老师学习ES,第15篇 课程地址: https://www.roncoo.com/view/55 白话Elasticsearch14-基于multi_matc ...
- ElasticSearch系列六:ElasticSearch搜索技术深入讲解(一)
1.match 手工控制搜索结果精准度 GET /product_db/_search {"query": {"match": {"subTitle& ...
- 03 ElasticSearch笔记-搜索技术深入与集群架构原理
回顾: 1.通过term 和 match查询数据时细节点以及数据类型keyword与text区别 1.1 term查询 1.1.1 term查询keyword字段. term不会分词.而keyword ...
- 专访头条搜索:从推荐到搜索,如何构建搜索技术的另一种可能?
今日头条又将搜索业务往前推进了一步.4 月 30 日,今日头条宣布上线"头条百科"测试版.界面简洁,除了搜索框外,只有一个 Slogan:" 来这里,认识世界!" ...
- 论搜索技术对人类的四大社会性意义
论搜索技术对人类的四大社会性意义 搜索引擎技术和资本门槛本身并不高,但随着人性因素的彰显而进入深度竞争阶段的互联网时代来临之后,搜索之争趋于深度竞争,深刻理解搜索对于人类的社会性意义成为竞争战略和策略 ...
- 非结构化视频搜索技术
非结构化视频搜索技术 2006-10-10 22:46 ■ 李蓬涛 编者按:视频搜索技术针对音视频这类非结构化数据,使用了语音识别.自动抽帧和内容自动关联等技术,真正做到了从内容上对视频进行搜索.20 ...
- 白话Elasticsearch27-深度探秘搜索技术之误拼写时的fuzzy模糊搜索技术
文章目录 概述 官方指导 例子 推荐写法 概述 继续跟中华石杉老师学习ES,第27篇 课程地址: https://www.roncoo.com/view/55 官方指导 https://www.ela ...
- 白话Elasticsearch18-深度探秘搜索技术之基于slop参数实现近似匹配以及原理剖析
文章目录 概述 官网 slop 含义 例子 示例一 示例二 示例三 概述 继续跟中华石杉老师学习ES,第18篇 课程地址: https://www.roncoo.com/view/55 接上篇博客 白 ...
最新文章
- AI一分钟 | 别了老司机!深圳无人驾驶公交车霸气上路;乌镇上演最强饭局,丁磊王兴刘强东大宴宾客
- 网络字节与主机字节转换 htons(), ntohl(), ntohs(),htons() 函数
- Teradata天睿公司推出适用各种部署环境的全球最强分析数据库
- java21天打卡day17-类2
- scala的模式匹配
- fm足球经理Football Manager 2022 for mac(真实模拟游戏)中文版
- HTML(超文本语言)
- Eclipse 最佳字体 推荐
- 越狱开发笔记(三)——非越狱App砸壳
- 苹果笔记本突然开机黑屏
- 一元二次方程的c语言代码,一元二次方程求解程序完整代码
- html中qq号码怎么写,qq号码免费申请6位号的方法
- JAXWS CXF HelloWorld + MyEclipse + Maven + Jetty Byron自學視頻01
- 怎样裁剪GIF动态图片?教你一键在线完成GIF裁剪
- 关于重装系统无法连接网络问题的解决方法
- 小玩具:知识卡(RFID)
- 特殊符号(制表符、空格、段落标记等)的显示与隐藏
- 主板噪音测试软件,华硕B85-Pro Gamer主板测试:SupremeFX音效听感
- 什么是订货软件?有哪些功能?订货软件和订货系统有什么区别?
- Linux+Apache+MySQL+PHP+FrontPage完全安装手册(转)
热门文章
- kib,mib和mb,kb的区别
- 汇编语言程序设计c,c与汇编语言程序设计
- Leetcode 136.只出现一次的数字 (每日一题 20210714)
- spark读取hbase数据
- web浏览器录音:web audio api
- MATLAB在人工智能中的应用案例:以MATLAB的方式玩转自动驾驶(附部分代码)
- MATLAB从入门到精通-matlab中符号推导应用及相关技巧
- 基于Matlab的标记分水岭分割算法(imreconstruct)
- python零碎知识(8):UserDict 类
- python 函数装饰器学习