1、背景:

进入spark集群,cd/spark,执bin/spark-sql,报错

image.png

2、解决方法

2.1、是hive元数据的问题,进入spark/conf/hive-site.xml,找到mysql的配置信息

2.2、进入mysql,切换到hive所使用的DB

2.3、 select * from VERSION;

image.png

2.4、保留第一条记录,其他记录全部删除

delete from VERSION where VER_ID != 1;

3、问题原因

异常是因为在启动hive命令时会检查hive源数据中有一张VERSION表,如果元数据版本信息获取不到(原因可能是元数据库异常||网络异常||短期内作业量较多操作都会造成查询不到版本信息),这种情况下会判断hive.metastore.schema.verification属性是true还是false,为true时直接抛出MetaException,为false时打出warn警告然后插入一条version数据(这种情况下会造成多条version记录后面的作业会受影响)

4、彻底解决

4.1、hive安装好后将hive-site.xml中hive.metastore.schema.verification设置为true,version获取不到时报出异常,不去插入version信息,这样本作业执行失败不会影响下游作业;

4.2开启metastore服务,hive统一连接metastore,由守护进程启动metastore,避免大量hive脚本初始化元数据信息时获取不到版本信息;

4.3、优化hive元数据库;

select报错 spark_使用spark-sql报错 “Metastore contains multiple versions”相关推荐

  1. hive metastore日志中报错message:Metastore contains multiple versions

    hive metastore日志中报错: Exception in thread "main" java.lang.RuntimeException: java.lang.Runt ...

  2. Spark-submit 提交 报错 org.apache.spark.sql.execution.datasources.orc.OrcFileFormat could not be instant

    错误场景 如下代码: spark.sql("select e.empno,e.ename,e.job,e.mgr,e.comm from emp e join dept d on e.dep ...

  3. 字节跳动在 Spark SQL 上的核心优化实践

    作者 | 郭俊 封图 | BanburyTang 字节跳动数据仓库架构团队负责数据仓库领域架构设计,支持字节跳动几乎所有产品线(包含但不限于抖音.今日头条.西瓜视频.火山视频)数据仓库方向的需求,如 ...

  4. 「Spark从入门到精通系列」4.Spark SQL和DataFrames:内置数据源简介

    来源 |  Learning Spark Lightning-Fast Data Analytics,Second Edition 作者 | Damji,et al. 翻译 | 吴邪 大数据4年从业经 ...

  5. Spark SQL 在字节跳动的核心优化实践

    10月26日,字节跳动技术沙龙 | 大数据架构专场 在上海字节跳动总部圆满结束.我们邀请到字节跳动数据仓库架构负责人郭俊,Kyligence 大数据研发工程师陶加涛,字节跳动存储工程师徐明敏,阿里云高 ...

  6. 字节跳动在Spark SQL上的核心优化实践

    字节跳动在Spark SQL上的核心优化实践 大数据架构 今天 以下文章来源于字节跳动技术团队 ,作者郭俊 字节跳动技术团队 字节跳动的技术实践分享 10月26日,字节跳动技术沙龙 | 大数据架构专场 ...

  7. 上海沙龙回顾 | ​字节跳动在Spark SQL上的核心优化实践

    10月26日,字节跳动技术沙龙 | 大数据架构专场 在上海字节跳动总部圆满结束.我们邀请到字节跳动数据仓库架构负责人郭俊,Kyligence 大数据研发工程师陶加涛,字节跳动存储工程师徐明敏,阿里云高 ...

  8. spark(day06-spark算法、Spark Sql)

    案例 处理u.data文件用户id 电影id 用户打分要求基于u.data文件,建立推荐系统模型,为789号用户推荐10部电影建模时,k的取值10~50之间,迭代次数:5~20次之间 λ:0.01~0 ...

  9. Spark SQL Guide——Data Sources

    文章目录 Parquet Files Partition Discovery(解析分区信息) Schema Merging(模式归并) Hive metastore Parquet table con ...

最新文章

  1. 莆田考计算机二级的学校,二级计算机考试——我的经历,我的感受!
  2. STL中list用法详解
  3. Unicode和UTF-8之间的转换详解
  4. 一个年轻人为什么毫无欲望?
  5. 【深度优先搜索】计蒜客:Betsy的旅行
  6. linux脚本下载,linux_脚本编写基础
  7. c语言计算圆周率的方法,c语言学习之不同方式计算圆周率
  8. 从实际项目出发,告诉你vue3到底香不香
  9. 【2020年高被引学者】 汤继良 密歇根州立大学
  10. C++ 会议安排(贪心算法)
  11. OMA DRM代理安全性思考
  12. 彼得德鲁克管理理念摘写
  13. 笑话段子手微信小程序源码自带内容采集随时有新内容
  14. 《从0到1上线微信小游戏》第七节 微信排行榜和好友分享功能
  15. 计算机网络:路由协议分类——IGP和EGP
  16. 这次的室温超导爆炸性发现,会是人类的进步?
  17. 3.空间域图像处理入门
  18. 克里斯·保罗:永不停滞的冠军梦
  19. Golang map源码详解
  20. 重庆公需科目快速看视频方法自动学习 python

热门文章

  1. i3处理器_十代酷睿i3-10100F配GTX1650S组装机配置清单
  2. Kali Linux 64位架构安装Veil-Evasion
  3. C# json解析字符串总是多出双引号_在JavaScript应用中将CSV转换为JSON
  4. java1.5以后的一些新特性
  5. 在虚幻UE4中不同VR头盔的FOV和分屏处理
  6. mysql100万数据一键下载csv_使用PHP来导入包含100万条数据的csv文件,请问你最快多久能全部导入mysql 数据库?...
  7. 腾讯新公开这张「图」,我看了眼,上面写满「智驾」二字
  8. 全球最快无人卡车规模化商用,这家中国初创公司究竟凭什么
  9. 苹果接盘倒下的无人车公司:吴恩达旗下,曾估值2亿美元,CEO及大部分员工被裁...
  10. mormot解析天气预报JSON数据