select报错 spark_使用spark-sql报错 “Metastore contains multiple versions”
1、背景:
进入spark集群,cd/spark,执bin/spark-sql,报错
image.png
2、解决方法
2.1、是hive元数据的问题,进入spark/conf/hive-site.xml,找到mysql的配置信息
2.2、进入mysql,切换到hive所使用的DB
2.3、 select * from VERSION;
image.png
2.4、保留第一条记录,其他记录全部删除
delete from VERSION where VER_ID != 1;
3、问题原因
异常是因为在启动hive命令时会检查hive源数据中有一张VERSION表,如果元数据版本信息获取不到(原因可能是元数据库异常||网络异常||短期内作业量较多操作都会造成查询不到版本信息),这种情况下会判断hive.metastore.schema.verification属性是true还是false,为true时直接抛出MetaException,为false时打出warn警告然后插入一条version数据(这种情况下会造成多条version记录后面的作业会受影响)
4、彻底解决
4.1、hive安装好后将hive-site.xml中hive.metastore.schema.verification设置为true,version获取不到时报出异常,不去插入version信息,这样本作业执行失败不会影响下游作业;
4.2开启metastore服务,hive统一连接metastore,由守护进程启动metastore,避免大量hive脚本初始化元数据信息时获取不到版本信息;
4.3、优化hive元数据库;
select报错 spark_使用spark-sql报错 “Metastore contains multiple versions”相关推荐
- hive metastore日志中报错message:Metastore contains multiple versions
hive metastore日志中报错: Exception in thread "main" java.lang.RuntimeException: java.lang.Runt ...
- Spark-submit 提交 报错 org.apache.spark.sql.execution.datasources.orc.OrcFileFormat could not be instant
错误场景 如下代码: spark.sql("select e.empno,e.ename,e.job,e.mgr,e.comm from emp e join dept d on e.dep ...
- 字节跳动在 Spark SQL 上的核心优化实践
作者 | 郭俊 封图 | BanburyTang 字节跳动数据仓库架构团队负责数据仓库领域架构设计,支持字节跳动几乎所有产品线(包含但不限于抖音.今日头条.西瓜视频.火山视频)数据仓库方向的需求,如 ...
- 「Spark从入门到精通系列」4.Spark SQL和DataFrames:内置数据源简介
来源 | Learning Spark Lightning-Fast Data Analytics,Second Edition 作者 | Damji,et al. 翻译 | 吴邪 大数据4年从业经 ...
- Spark SQL 在字节跳动的核心优化实践
10月26日,字节跳动技术沙龙 | 大数据架构专场 在上海字节跳动总部圆满结束.我们邀请到字节跳动数据仓库架构负责人郭俊,Kyligence 大数据研发工程师陶加涛,字节跳动存储工程师徐明敏,阿里云高 ...
- 字节跳动在Spark SQL上的核心优化实践
字节跳动在Spark SQL上的核心优化实践 大数据架构 今天 以下文章来源于字节跳动技术团队 ,作者郭俊 字节跳动技术团队 字节跳动的技术实践分享 10月26日,字节跳动技术沙龙 | 大数据架构专场 ...
- 上海沙龙回顾 | 字节跳动在Spark SQL上的核心优化实践
10月26日,字节跳动技术沙龙 | 大数据架构专场 在上海字节跳动总部圆满结束.我们邀请到字节跳动数据仓库架构负责人郭俊,Kyligence 大数据研发工程师陶加涛,字节跳动存储工程师徐明敏,阿里云高 ...
- spark(day06-spark算法、Spark Sql)
案例 处理u.data文件用户id 电影id 用户打分要求基于u.data文件,建立推荐系统模型,为789号用户推荐10部电影建模时,k的取值10~50之间,迭代次数:5~20次之间 λ:0.01~0 ...
- Spark SQL Guide——Data Sources
文章目录 Parquet Files Partition Discovery(解析分区信息) Schema Merging(模式归并) Hive metastore Parquet table con ...
最新文章
- 莆田考计算机二级的学校,二级计算机考试——我的经历,我的感受!
- STL中list用法详解
- Unicode和UTF-8之间的转换详解
- 一个年轻人为什么毫无欲望?
- 【深度优先搜索】计蒜客:Betsy的旅行
- linux脚本下载,linux_脚本编写基础
- c语言计算圆周率的方法,c语言学习之不同方式计算圆周率
- 从实际项目出发,告诉你vue3到底香不香
- 【2020年高被引学者】 汤继良 密歇根州立大学
- C++ 会议安排(贪心算法)
- OMA DRM代理安全性思考
- 彼得德鲁克管理理念摘写
- 笑话段子手微信小程序源码自带内容采集随时有新内容
- 《从0到1上线微信小游戏》第七节 微信排行榜和好友分享功能
- 计算机网络:路由协议分类——IGP和EGP
- 这次的室温超导爆炸性发现,会是人类的进步?
- 3.空间域图像处理入门
- 克里斯·保罗:永不停滞的冠军梦
- Golang map源码详解
- 重庆公需科目快速看视频方法自动学习 python
热门文章
- i3处理器_十代酷睿i3-10100F配GTX1650S组装机配置清单
- Kali Linux 64位架构安装Veil-Evasion
- C# json解析字符串总是多出双引号_在JavaScript应用中将CSV转换为JSON
- java1.5以后的一些新特性
- 在虚幻UE4中不同VR头盔的FOV和分屏处理
- mysql100万数据一键下载csv_使用PHP来导入包含100万条数据的csv文件,请问你最快多久能全部导入mysql 数据库?...
- 腾讯新公开这张「图」,我看了眼,上面写满「智驾」二字
- 全球最快无人卡车规模化商用,这家中国初创公司究竟凭什么
- 苹果接盘倒下的无人车公司:吴恩达旗下,曾估值2亿美元,CEO及大部分员工被裁...
- mormot解析天气预报JSON数据