问题描述:java.lang.IllegalArgumentException: Document contains at least one immense term in field=“cf_jg.keyword” (whose UTF8 encoding is longer than the max length 32766)

原因:设置为keyword类型的字段,插入很长的大段内容后,报字符超出异常,无法插入。

详细说明:ES5.X版本以后,keyword支持的最大长度为32766个UTF-8字节数,text对字符长度没有限制。
设置ignore_above后,超过给定长度后的数据将不被索引,无法通过term精确匹配检索返回结果。

text类型:支持分词、全文检索,不支持聚合、排序操作。
适合大字段存储,如:文章详情、content字段等;

keyword类型:支持精确匹配,支持聚合、排序操作。
适合精准字段匹配,如:url、name、title等字段。
一般情况,text和keyword共存,设置如下:
“cf_xzjg”: {
“type”: “text”,
“fields”: {
“keyword”: {
“type”: “keyword”
}
},
“analyzer”: “hanlp_index”
},

参考:
https://blog.csdn.net/laoyang360/article/details/78207980
https://www.elastic.co/guide/en/elasticsearch/reference/5.5/ignore-above.html

whose UTF8 encoding is longer than the max length 32766相关推荐

  1. Document contains at least one immense term in field=“****“ (whose UTF8 encoding is longer than t

    使用的es版本是6.2.3,在入数据的时候,有些数据没有入进去,报了这个错误: java.lang.IllegalArgumentException: Document contains at lea ...

  2. illegal utf8 encoding at (190)

    illegal utf8 encoding at (190) 首先,使用locale命令查看当前服务器设置地域,我出来的结果是: LANG=zh_CN.UTF-8 LC_CTYPE="zh_ ...

  3. 错误:Could not decode “.cpp“with “UTF-8“-encoding.Editing not possible.

    错误:Could not decode ".cpp"with "UTF-8"-encoding.Editing not possible. 原因:windows ...

  4. VS code上报错invalid UTF-8 encoding:

    VS code上报错invalid UTF-8 encoding: 笔者之前是用别的语言的,在入门Go输出中文的时候发现了这个问题. 因为之前别的语言对于GB18030的编码都通用,所以第一次遇到这个 ...

  5. qt乱码Could not decode“xxx.cpp“ with “UTF-8“-encoding.Editing not possible问题处理

    问题描述:如题: 解决方法: 1.点击Select Encoding按钮 2.选择按照系统编码 3.选中System后点击按编码重新载入 4.问题解决

  6. 3、Finished with error: FormatException: Bad UTF-8 encoding 0xc3 (at offset 169)

    这是由于 app 的版本为 release 找不到 keystore 文件, 我们只需要在 app 下的 build.gradle 文件中修改为 signingConfigs.debug 即可: bu ...

  7. java toregex_Java Regex to check Min/Max Length of Input Text

    在此Java regex教程中,我们将学习测试输入文本的长度是否在最小和最大限制之间. 所有编程语言都提供了一种有效的方法来检查文本的长度. 但是,在某些情况下,使用正则表达式检查文本长度会很有用,特 ...

  8. python字典最大长度_支持key过期失效和限制字典大小的开源项目 [python expire max length]...

    起因: 最近在写业务数据监控,既然是监控,那肯定是有不同时间区间的监控动作,放在linux下的crontab有些不合适了,因为有不同的函数要触犯,我不能为这堆函数定制一堆main()吧.用一些开源的计 ...

  9. ES单字段支持的最大字符数

    在使用ES时,需要用到进行检索的字段都需设置为 keyword,不需要检索的可以设置 text. 设置keyword,默认不分词,它的最大长度和utf-8编码有关,最大长度为32766字节,如果字段长 ...

  10. Solr 中遇到的问题

    1.问题1 :whose UTF8 encoding is longer than the max length 32766 Error from server at http://localhost ...

最新文章

  1. 吴恩达Deeplearning.ai课程学习全体验:深度学习必备课程 By 路雪2017年8月14日 11:44 8 月 8 日,吴恩达正式发布了 Deepleanring.ai——基于 Cours
  2. sklearn之XGBModel:XGBModel之feature_importances_、plot_importance的简介、使用方法之详细攻略
  3. internship research notes
  4. 打印Show Attend and Tell的损失函数
  5. 利用 Python 实现多任务进程
  6. gb2312编码在线转换_python基础学习—04字符串与编码
  7. G1垃圾收集器全视角解析
  8. 心心念特斯拉Cybertruck?现在可以下单了,订金1000块
  9. Linux内核入门(二)——用户态向内核态切换
  10. 华为 linux网络工程师待遇,华为网络工程师待遇如何?
  11. 计算机技能名称英语,电脑技能英文表示法
  12. 如何利用新闻传播进行产品网络推广?
  13. [机器学习]基于OpenCV实现最简单的数字识别
  14. word如何批量更改公式字体
  15. CorelDRAW破解版是如何一步一步坑人的
  16. 小爱触屏音响用php接口,小米小爱触屏音箱:这个“闹钟”不简单
  17. 机器学习水果识别——python+opencv实现物体特征提取
  18. 课程设计书五子棋AI算法及其实现
  19. 任务分配问题排序和重排实现
  20. 快递鸟代收货款接口API使用技术文档

热门文章

  1. 概率论在实际生活的例子_日常生活中的概率统计
  2. Entity Framework基础
  3. 【暑期每日一题】洛谷 P1192 台阶问题
  4. 一文读懂什么是数字证书
  5. Partitioning by Palindromes UVA - 11584(DP)
  6. Java8新特性(二)流式处理
  7. 共享经济思考:标准化与个性化如何融合
  8. nginx resolver失败
  9. win7家庭版计算机管理没有本地用户和组,Win7找不到本地用户和组选项的解决方法...
  10. C++小系统——餐馆员工管理系统及餐馆点菜系统(一)