hive 分区_代码 | Spark读取mongoDB数据写入Hive普通表和分区表
版本:
一、原始数据及Hive表
MongoDB数据格式
Hive普通表
Hive分区表
二、 IDEA+Maven+Java
依赖
代码
工具类
三、 错误解决办法
1、 IDEA会获取不到Hive的数据库和表,将hive-site.xml放入resources文件中。并且将resources设置成配置文件(设置成功文件夹是蓝色否则是灰色)
file–>Project Structure–>Modules–>Source
2、 上面错误处理完后如果报JDO类型的错误,那么检查HIVE_HOME/lib下时候否mysql驱动,如果确定有,那么就是IDEA获取不到。解决方法如下:
将mysql驱动拷贝到jdk1.8.0_171.jdk/Contents/Home/jre/lib/ext路径下(jdk/jre/lib/ext)
在IDEA项目External Libraries下的<1.8>里面添加mysql驱动
四、 注意点
由于将MongoDB数据表注册成了临时表和Hive表进行了关联,所以要将MongoDB中的id字段设置成索引字段,否则性能会很慢。
MongoDB设置索引方法:
查看索引:
hive 分区_代码 | Spark读取mongoDB数据写入Hive普通表和分区表相关推荐
- spark读取oracle写入kafka,spark读取kafka文件写入hive
1.将hdfs-site,core-site.hive-site文件拷贝到resources目录下 image.png 2.添加maven依赖 org.apache.spark spark-strea ...
- Flink1.11 读取kafka数据写入hive,未完待续
昨天晚上Flink1.11出了,这次改动很多,我只关心hive这一部分. 目前尝试了几个小时用代码读取hive,安装官网的文档,没成功,先蹭个热点,记录下. 先贴一下依赖吧: 注意:反正各种报错,看社 ...
- excel文件导入hive乱码_将excel中的数据导入hive
步骤一:将excel另存为txt文档(文本文件(制表符分割))假设名字为CompanyCode.txt 步骤二,将该txt文件导入Linux指定目录中 步骤三,转换编码格式,在指定目录下执行如下命令: ...
- Hive大数据-认识Hive知识结构_以及概念介绍---大数据之Hive工作笔记0001
技术交流QQ群[JAVA,C++,Python,.NET,BigData,AI]:170933152 上面是关于Hive需要学习的东西 然后我们来了解一下hive,hive可以理解成一个,可以把sql ...
- spark写表指定外部表_spark 将dataframe数据写入Hive分区表
从spark1.2 到spark1.3,spark SQL中的SchemaRDD变为了DataFrame,DataFrame相对于SchemaRDD有了较大改变,同时提供了更多好用且方便的API. D ...
- kafka学习_《从0到1学习Flink》—— Flink 读取 Kafka 数据写入到 RabbitMQ
前言 之前有文章 <从0到1学习Flink>-- Flink 写入数据到 Kafka 写过 Flink 将处理后的数据后发到 Kafka 消息队列中去,当然我们常用的消息队列可不止这一种, ...
- golang读取mongodb数据出错:invalid character ‘Ì‘ looking for beginning of value
今天操作golang读取mongodb数据出错:invalid character 'Ì' looking for beginning of value,一头雾水,于是把条件放入mongo的控制平台执 ...
- flink源码分析_Flink源码分析之深度解读流式数据写入hive
前言 前段时间我们讲解了flink1.11中如何将流式数据写入文件系统和hive [flink 1.11 使用sql将流式数据写入hive],今天我们来从源码的角度深入分析一下.以便朋友们对flink ...
- 利用SparkSQL(java版)将离线数据或实时流数据写入hive的用法及坑点
1. 通常利用SparkSQL将离线或实时流数据的SparkRDD数据写入Hive,一般有两种方法.第一种是利用org.apache.spark.sql.types.StructType和org.ap ...
最新文章
- linux 进程 内存 换入换出,linux - 在从bash进程替换完成输入后,如何继续发送到stdin? - 堆栈内存溢出...
- 转载 :28 个 Unix/Linux 的命令行神器
- c#的chart标题_C#中CHART画图
- python中的Lock与RLock
- 使用 TensorFlow 的公司
- VTK:图像平移范围用法实战
- 怎么才能学好Java?月薪35K阿里P9程序员给出了这样的建议!
- 【实践案例】Databricks 数据洞察在美的暖通与楼宇的应用实践
- 解决sql脚本文件太大无法打开的问题
- R语言 相关分析和典型相关分析
- XmlHelpers
- 云智慧获 D 轮数 2500 万美元投资:全力推动智能运维落地
- q萌扫地机器人_为什么买了扫地机器人的到最后都后悔了?
- 352.将数据流变成多个不相交间隔
- 基于链队列的银行叫号系统
- 基于java(ssm)校园办公室报修管理系统(java毕业设计)
- 2021-06-19
- 惠普win7笔记本耳机没声音
- Hadoop中怎么解决Starting secondary namenodes [0.0.0.0]
- python crypto安装_python3.7安装Crypto
热门文章
- python 图表 web_Web | Django 与 Chart.js 联用做出精美的图表
- android各层之间,Android运行程序在各层架构之间的相互关系
- java snmp walk_snmpwalk用法
- Java黑皮书课后题第8章:**8.6(代数:两个矩阵相乘)编写两个矩阵相乘的方法。编写一个测试程序,提示用户输入两个3*3的矩阵,然后显示它们的乘积
- 用计算机打出圣诞树,手机计算器圣诞树的祝福输入方式,手机计算器圣诞树获得方法...
- 牛客练习赛19 E和F(签到就走系列)托米的饮料+托米搭积木
- myEclipse开发内存溢出解决办法myEclipse调整jvm内存大小java.lang.OutOfMemoryError: PermGen space及其解决方法...
- 【UI】android如何绘制一个饼图
- Druid:一个用于大数据实时处理的开源分布式系统
- .net面试题(高级)