之前看过ck中文社区,看到了很多莫名其妙的Exception 但并没有解答。自己测试集群小量数据抽取也没有遇到这些问题。

果不其然,生产集群部署都跳了一遍

新增相关配置:网上找的,与我原本的配置的一些不同点

<receive_timeout>800</receive_timeout>  
 <send_timeout>800</send_timeout>
 <keep_alive_timeout>300</keep_alive_timeout>
 <default_session_timeout>300</default_session_timeout>

我也没有添加的配置:
   <merge_tree>
   <parts_to_delay_insert>300</parts_to_delay_insert>
   <parts_to_throw_insert>600</parts_to_throw_insert>
   <max_delay_to_insert>2</max_delay_to_insert>
   </merge_tree>

报错大致信息:

1.Too many parts (606). Merges are processing significantly slower than inserts

2. ERROR server.TransportRequestHandler: Error while invoking RpcHandler#receive() for one-way message.

3.read time out

4.ERROR cluster.YarnScheduler: Lost executor 174 on hadoop1: Container marked as failed: container_xx on host: hadoop1. 
Exit status: 143. Diagnostics: Container killed on request.

5.DB::Exception: Possible deadlock avoided. Client should retry. (version 19.15.3.6 (official build)) (from [::1]:38736) (in query: SELECT * FROM dwd_ms_complex_detail_di_cluster LIMIT 1), Stack trace:

问题描述:

1.merge速度跟不上插入速度,也就是insert,可能原因: 数据是否可能跨多个分区, 如果这样的话每次写入有多个partition, merge压力很大

2.同1一起处理,可适当减少并发,同时修改numpartition

3.超时问题,可适当增加 超时时间 并添加 socketTimeout=600000  具体数 自己测

4.yarn资源问题  单个excutor 内存不足 处理不过来,适当减少批次量  (此处是waterdrop 设置的 默认 20000  因为ck大批量小批次特性 并结合yarn资源 我设置了500000)

5.可能是truncate table导致数据删除不完全,解决方法:去存储位置,删数据吧

clickhouse 生产集群部署之坑坑洼洼相关推荐

  1. clickhouse 生产集群部署之坑坑洼洼(二)

    clickhouse时间时区问题, 配置文件:clickhouse.config.xml 配置标签:<timezone>Asia/Shanghai</timezone> 机器系 ...

  2. clickhouse 生产集群部署之坑坑洼洼(三)

    Join 语句问题 SELECT <expr_list> FROM <left_subquery> [GLOBAL] [ANY|ALL] INNER|LEFT|RIGHT|FU ...

  3. ClickHouse分布式集群部署

    前提: 首先每个集群上搭建zookeeper集群. ZooKeeper入门(五)配置集群和选举机制_怪只怪满眼尽是人间烟火的博客-CSDN博客一. 配置集群1. 准备多台ZooKeeper服务器 2. ...

  4. 进阶-第92_es生产集群部署之必须根据自己的集群设置的一些重要参数

    1.es的默认参数 es的默认参数是非常好的,适合绝大多数的情况,尤其是一些性能相关的配置.因此刚开始部署一个生产环境下的es集群时,几乎所有的配置参数都可以用默认的设置.有很多的生产环境场景下,都是 ...

  5. ES生产集群部署之必须根据自己的集群设置的一些重要参数

    1.es的默认参数 es的默认参数是非常好的,适合绝大多数的情况,尤其是一些性能相关的配置.因此刚开始部署一个生产环境下的es集群时,几乎所有的配置参数都可以用默认的设置.有很多的生产环境场景下,都是 ...

  6. 白话Elasticsearch70-ES生产集群部署之production mode下启动时的bootstrap check

    文章目录 概述 官方文档 什么是bootstrap check(启动时检查)? development mode vs. production mode heap size check file de ...

  7. 白话Elasticsearch69-ES生产集群部署重要的 Elasticsearch参数设置

    文章目录 ES的重要参数设置 官方文档 Path settings Cluster name Node name Network host Discovery settings Heap size H ...

  8. ClickHouse 详细集群部署方案

    基本介绍: ClickHouse 来自俄罗斯最大的搜索公司Yandex,配置文件中可以看到Yandex的样子,于2016年开源. ClickHouse是面向OLAP的分布式列式DBMS,OLAP(在线 ...

  9. 白话Elasticsearch71-ES生产集群部署之各个节点以daemon模式运行以及优雅关闭

    文章目录 概述 官方指导 启动 ES 优雅的关闭 ES 概述 继续跟中华石杉老师学习ES,第71篇 课程地址: https://www.roncoo.com/view/55 官方指导 启动ES htt ...

最新文章

  1. JavaScript在离开页面是提示用户
  2. R统计绘图 - 热图简化
  3. 帝国cms模板仿后台登录界面
  4. Web Hacking 101 中文版 十四、XML 外部实体注入(二)
  5. Scala:未受重视却潜力巨大的Android编程语言
  6. css字体及css文本控制
  7. PROC文件及文件夹创建
  8. excel密码破解软件Excel Password Unlocker下载和使用技巧(亲测有效!)
  9. 从小白创建自己的CSND
  10. chrome 浏览器中印象笔记·剪藏插件无法登陆问题
  11. java获取当前学期
  12. C语言apr_socket,APR分析-高级IO篇
  13. bug还没找到,程序员同志,快醒醒
  14. Matlab常用绘图颜色搭配
  15. 面试官问我:什么是消息队列?什么场景需要他?用了会出现什么问题?
  16. servlet常见错误
  17. 计算机科学类专升本复习之“C语言结构体”详解(初稿)
  18. Dango笔记---manage.py 脚本的使用
  19. 一个前端程序员的日常
  20. 2021年4月品牌精选海报合集

热门文章

  1. 敏涵控股董事长刘敏——不一样的巾帼慈善企业家
  2. PHPWIND得到管理员密码的方法
  3. 迪米特法则 (Law of Demeter, LoD)
  4. 高一计算机专业班主任工作总结,高一年级第一学期班主任工作总结
  5. JD商城经典爬楼梯布局,看到就是赚到
  6. 为了整明白苹果电脑到底会不会中毒,我真的把病毒拷了进去
  7. Far planner 部署真实小车 树莓派部署lego_loam
  8. 南邮 OJ 2070 马尔扎哈的疑惑
  9. 1077 Kuchiguse
  10. centos7 安装MySQL