whose UTF8 encoding is longer than the max length 32766
问题描述:java.lang.IllegalArgumentException: Document contains at least one immense term in field=“cf_jg.keyword” (whose UTF8 encoding is longer than the max length 32766)
原因:设置为keyword类型的字段,插入很长的大段内容后,报字符超出异常,无法插入。
详细说明:ES5.X版本以后,keyword支持的最大长度为32766个UTF-8字节数,text对字符长度没有限制。
设置ignore_above后,超过给定长度后的数据将不被索引,无法通过term精确匹配检索返回结果。
text类型:支持分词、全文检索,不支持聚合、排序操作。
适合大字段存储,如:文章详情、content字段等;
keyword类型:支持精确匹配,支持聚合、排序操作。
适合精准字段匹配,如:url、name、title等字段。
一般情况,text和keyword共存,设置如下:
“cf_xzjg”: {
“type”: “text”,
“fields”: {
“keyword”: {
“type”: “keyword”
}
},
“analyzer”: “hanlp_index”
},
参考:
https://blog.csdn.net/laoyang360/article/details/78207980
https://www.elastic.co/guide/en/elasticsearch/reference/5.5/ignore-above.html
whose UTF8 encoding is longer than the max length 32766相关推荐
- Document contains at least one immense term in field=“****“ (whose UTF8 encoding is longer than t
使用的es版本是6.2.3,在入数据的时候,有些数据没有入进去,报了这个错误: java.lang.IllegalArgumentException: Document contains at lea ...
- illegal utf8 encoding at (190)
illegal utf8 encoding at (190) 首先,使用locale命令查看当前服务器设置地域,我出来的结果是: LANG=zh_CN.UTF-8 LC_CTYPE="zh_ ...
- 错误:Could not decode “.cpp“with “UTF-8“-encoding.Editing not possible.
错误:Could not decode ".cpp"with "UTF-8"-encoding.Editing not possible. 原因:windows ...
- VS code上报错invalid UTF-8 encoding:
VS code上报错invalid UTF-8 encoding: 笔者之前是用别的语言的,在入门Go输出中文的时候发现了这个问题. 因为之前别的语言对于GB18030的编码都通用,所以第一次遇到这个 ...
- qt乱码Could not decode“xxx.cpp“ with “UTF-8“-encoding.Editing not possible问题处理
问题描述:如题: 解决方法: 1.点击Select Encoding按钮 2.选择按照系统编码 3.选中System后点击按编码重新载入 4.问题解决
- 3、Finished with error: FormatException: Bad UTF-8 encoding 0xc3 (at offset 169)
这是由于 app 的版本为 release 找不到 keystore 文件, 我们只需要在 app 下的 build.gradle 文件中修改为 signingConfigs.debug 即可: bu ...
- java toregex_Java Regex to check Min/Max Length of Input Text
在此Java regex教程中,我们将学习测试输入文本的长度是否在最小和最大限制之间. 所有编程语言都提供了一种有效的方法来检查文本的长度. 但是,在某些情况下,使用正则表达式检查文本长度会很有用,特 ...
- python字典最大长度_支持key过期失效和限制字典大小的开源项目 [python expire max length]...
起因: 最近在写业务数据监控,既然是监控,那肯定是有不同时间区间的监控动作,放在linux下的crontab有些不合适了,因为有不同的函数要触犯,我不能为这堆函数定制一堆main()吧.用一些开源的计 ...
- ES单字段支持的最大字符数
在使用ES时,需要用到进行检索的字段都需设置为 keyword,不需要检索的可以设置 text. 设置keyword,默认不分词,它的最大长度和utf-8编码有关,最大长度为32766字节,如果字段长 ...
- Solr 中遇到的问题
1.问题1 :whose UTF8 encoding is longer than the max length 32766 Error from server at http://localhost ...
最新文章
- 吴恩达Deeplearning.ai课程学习全体验:深度学习必备课程 By 路雪2017年8月14日 11:44 8 月 8 日,吴恩达正式发布了 Deepleanring.ai——基于 Cours
- sklearn之XGBModel:XGBModel之feature_importances_、plot_importance的简介、使用方法之详细攻略
- internship research notes
- 打印Show Attend and Tell的损失函数
- 利用 Python 实现多任务进程
- gb2312编码在线转换_python基础学习—04字符串与编码
- G1垃圾收集器全视角解析
- 心心念特斯拉Cybertruck?现在可以下单了,订金1000块
- Linux内核入门(二)——用户态向内核态切换
- 华为 linux网络工程师待遇,华为网络工程师待遇如何?
- 计算机技能名称英语,电脑技能英文表示法
- 如何利用新闻传播进行产品网络推广?
- [机器学习]基于OpenCV实现最简单的数字识别
- word如何批量更改公式字体
- CorelDRAW破解版是如何一步一步坑人的
- 小爱触屏音响用php接口,小米小爱触屏音箱:这个“闹钟”不简单
- 机器学习水果识别——python+opencv实现物体特征提取
- 课程设计书五子棋AI算法及其实现
- 任务分配问题排序和重排实现
- 快递鸟代收货款接口API使用技术文档