[Spark][Hive][Python][SQL]Spark 读取Hive表的小例子
[Spark][Hive][Python][SQL]Spark 读取Hive表的小例子
$ cat customers.txt
1 Ali us
2 Bsb ca
3 Carls mx
$ hive
hive>
> CREATE TABLE IF NOT EXISTS customers(
> cust_id string,
> name string,
> country string
> )
> ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';
hive> load data local inpath '/home/training/customers.txt' into table customers;
hive>exit
$pyspark
sqlContext =HiveContext(sc)
filterDF=sqlContext.sql(""" SELECT * FROM customers WHERE name LIKE "A%" """)
filterDF.limit(3).show()
+-------+----+-------+
|cust_id|name|country|
+-------+----+-------+
| 001| Ani| us|
+-------+----+-------+
转载于:https://www.cnblogs.com/gaojian/p/7634234.html
[Spark][Hive][Python][SQL]Spark 读取Hive表的小例子相关推荐
- python取出hive_python 读取hive数据
话不多说,直接上代码 from pyhive import hivedef pyhive(hql): conn = hive.Connection(host='HiveServer2 host', p ...
- flink sql client读取hive时卡住
问题复现如下: 查看$FLINK_HOME/log/flink-appleyuchi-sql-client-Desktop.log 2020-12-23 11:48:56,811 INFO org. ...
- 地铁译:Spark for python developers ---Spark的数据戏法
聚焦在 Twitter 上关于Apache Spark的数据, 这些是准备用于机器学习和流式处理应用的数据. 重点是如何通过分布式网络交换代码和数据,获得 串行化, 持久化 , 调度和缓存的实战经验 ...
- hive报错 spark_sparksql读取hive数据报错:java.lang.RuntimeException: serious problem
问题: Caused by: java.util.concurrent.ExecutionException: java.lang.IndexOutOfBoundsException: Index: ...
- 地铁译:Spark for python developers ---Spark处理后的数据可视化
spark for python developer 一书,说实在的,质量一般,但勉强可以作为python 工程师的入门资料,至此,这一时段的地铁译结束了,开始新的阅读旅程-- 对于 Python 的 ...
- python open函数_精选2个小例子,带你快速入门Python文件处理
阅读本文大概需要7分钟讲完了函数和模块,我们来讲一讲文件的使用,python对数据的处理分两种一种是本地文件的处理,另外一种是通过网络数据处理(也就是爬虫相关的).而本地的数据处理,主要是通过文件的读 ...
- spark数据查询语句select_sparksql读取hive表中数据
文章目录 spark sql与hive本地调试 new HiveContext空指针异常 权限: 异常 执行select查询的时候找不到host spark sql与hive本地调试 将hive-si ...
- Spark Streaming 2.0 读取Kafka 0.10 小例子
环境版本: Scala 2.11.8; Kafka 0.10.0.1; Spark 2.0.0 如需Scala 2.10.5; Spark 1.6.0; Kafka 0.10.0.1版本请看这篇:Fl ...
- 使用 OPEN SQL 语句读取数据库表数据的一个补充练习
首先按照本系列前一篇文章如何创建最简单的 ABAP 数据库表,以及编码从数据库表中读取数据介绍的步骤,创建两个数据库表: 上图 ZPERSON 表里,包含了5条记录,分别代表5个人的 ID 和 名称. ...
最新文章
- ansible调用callbacks插件实现结果nosql输出回调
- MM模块几个移动类型之间的区别
- RobHess的SIFT代码解析之RANSAC
- Unity 3D学习笔记之一 界面介绍
- 小红书推荐大数据在阿里云上的实践
- 500 内部服务器错误php,如何解决php 500 - 内部服务器错误
- 人工智能写小说python_1月下旬值得一读的10本技术新书(人工智能、C++、Python数据科学等)!文末有福利!...
- ironpython 开发_[IronPython]IronPython开发环境的安装与设定
- 机器学习 之 Hog特征
- cisco路由器配置DHCP实例
- 加密狗Android软件,加密狗app
- iec611313标准下载_iec611313编程标准.ppt
- java多个点求连线_实现简单的粒子连线
- Order by 语句 的使用
- 网站推广优化教程100条(完整版)-
- html常用标签和属性
- 腾讯云CentOS7运行基于SSM的个人博客----第三节:使用Dokcer安装JDK、Tomcat环境
- 思路:controller层:后台如何取值 前端如何给name赋值 例如是id赋值还是自己随意定义...
- java linux 读取文件内容_java访问Linux服务器读取文件
- 爬虫练习(2)-- 使用正则匹配爬取果壳问答