版本:

一、原始数据及Hive表

MongoDB数据格式

Hive普通表

Hive分区表

二、 IDEA+Maven+Java

依赖

代码

工具类

三、 错误解决办法

1、 IDEA会获取不到Hive的数据库和表,将hive-site.xml放入resources文件中。并且将resources设置成配置文件(设置成功文件夹是蓝色否则是灰色)

file–>Project Structure–>Modules–>Source

2、 上面错误处理完后如果报JDO类型的错误,那么检查HIVE_HOME/lib下时候否mysql驱动,如果确定有,那么就是IDEA获取不到。解决方法如下:

将mysql驱动拷贝到jdk1.8.0_171.jdk/Contents/Home/jre/lib/ext路径下(jdk/jre/lib/ext)

在IDEA项目External Libraries下的<1.8>里面添加mysql驱动

四、 注意点

由于将MongoDB数据表注册成了临时表和Hive表进行了关联,所以要将MongoDB中的id字段设置成索引字段,否则性能会很慢。

MongoDB设置索引方法:

查看索引:

hive 分区_代码 | Spark读取mongoDB数据写入Hive普通表和分区表相关推荐

  1. spark读取oracle写入kafka,spark读取kafka文件写入hive

    1.将hdfs-site,core-site.hive-site文件拷贝到resources目录下 image.png 2.添加maven依赖 org.apache.spark spark-strea ...

  2. Flink1.11 读取kafka数据写入hive,未完待续

    昨天晚上Flink1.11出了,这次改动很多,我只关心hive这一部分. 目前尝试了几个小时用代码读取hive,安装官网的文档,没成功,先蹭个热点,记录下. 先贴一下依赖吧: 注意:反正各种报错,看社 ...

  3. excel文件导入hive乱码_将excel中的数据导入hive

    步骤一:将excel另存为txt文档(文本文件(制表符分割))假设名字为CompanyCode.txt 步骤二,将该txt文件导入Linux指定目录中 步骤三,转换编码格式,在指定目录下执行如下命令: ...

  4. Hive大数据-认识Hive知识结构_以及概念介绍---大数据之Hive工作笔记0001

    技术交流QQ群[JAVA,C++,Python,.NET,BigData,AI]:170933152 上面是关于Hive需要学习的东西 然后我们来了解一下hive,hive可以理解成一个,可以把sql ...

  5. spark写表指定外部表_spark 将dataframe数据写入Hive分区表

    从spark1.2 到spark1.3,spark SQL中的SchemaRDD变为了DataFrame,DataFrame相对于SchemaRDD有了较大改变,同时提供了更多好用且方便的API. D ...

  6. kafka学习_《从0到1学习Flink》—— Flink 读取 Kafka 数据写入到 RabbitMQ

    前言 之前有文章 <从0到1学习Flink>-- Flink 写入数据到 Kafka 写过 Flink 将处理后的数据后发到 Kafka 消息队列中去,当然我们常用的消息队列可不止这一种, ...

  7. golang读取mongodb数据出错:invalid character ‘Ì‘ looking for beginning of value

    今天操作golang读取mongodb数据出错:invalid character 'Ì' looking for beginning of value,一头雾水,于是把条件放入mongo的控制平台执 ...

  8. flink源码分析_Flink源码分析之深度解读流式数据写入hive

    前言 前段时间我们讲解了flink1.11中如何将流式数据写入文件系统和hive [flink 1.11 使用sql将流式数据写入hive],今天我们来从源码的角度深入分析一下.以便朋友们对flink ...

  9. 利用SparkSQL(java版)将离线数据或实时流数据写入hive的用法及坑点

    1. 通常利用SparkSQL将离线或实时流数据的SparkRDD数据写入Hive,一般有两种方法.第一种是利用org.apache.spark.sql.types.StructType和org.ap ...

最新文章

  1. linux 进程 内存 换入换出,linux - 在从bash进程替换完成输入后,如何继续发送到stdin? - 堆栈内存溢出...
  2. 转载 :28 个 Unix/Linux 的命令行神器
  3. c#的chart标题_C#中CHART画图
  4. python中的Lock与RLock
  5. 使用 TensorFlow 的公司
  6. VTK:图像平移范围用法实战
  7. 怎么才能学好Java?月薪35K阿里P9程序员给出了这样的建议!
  8. 【实践案例】Databricks 数据洞察在美的暖通与楼宇的应用实践
  9. 解决sql脚本文件太大无法打开的问题
  10. R语言 相关分析和典型相关分析
  11. XmlHelpers
  12. 云智慧获 D 轮数 2500 万美元投资:全力推动智能运维落地
  13. q萌扫地机器人_为什么买了扫地机器人的到最后都后悔了?
  14. 352.将数据流变成多个不相交间隔
  15. 基于链队列的银行叫号系统
  16. 基于java(ssm)校园办公室报修管理系统(java毕业设计)
  17. 2021-06-19
  18. 惠普win7笔记本耳机没声音
  19. Hadoop中怎么解决Starting secondary namenodes [0.0.0.0]
  20. python crypto安装_python3.7安装Crypto

热门文章

  1. python 图表 web_Web | Django 与 Chart.js 联用做出精美的图表
  2. android各层之间,Android运行程序在各层架构之间的相互关系
  3. java snmp walk_snmpwalk用法
  4. Java黑皮书课后题第8章:**8.6(代数:两个矩阵相乘)编写两个矩阵相乘的方法。编写一个测试程序,提示用户输入两个3*3的矩阵,然后显示它们的乘积
  5. 用计算机打出圣诞树,手机计算器圣诞树的祝福输入方式,手机计算器圣诞树获得方法...
  6. 牛客练习赛19 E和F(签到就走系列)托米的饮料+托米搭积木
  7. myEclipse开发内存溢出解决办法myEclipse调整jvm内存大小java.lang.OutOfMemoryError: PermGen space及其解决方法...
  8. 【UI】android如何绘制一个饼图
  9. Druid:一个用于大数据实时处理的开源分布式系统
  10. .net面试题(高级)