pyflink shell on yarn在per-job cluster模式下的实验记录
实验记录:
①启动hadoop
②$FLINK_HOME/bin/pyflink-shell.sh yarn
使用了Table API的PyFlink完整代码如下:
import tempfile
import os
import shutil
sink_path = tempfile.gettempdir() + '/streaming.csv'
if os.path.exists(sink_path):if os.path.isfile(sink_path):os.remove(sink_path)else:shutil.rmtree(sink_path)s_env.set_parallelism(1)
t = st_env.from_elements([(1, 'hi3', 'hello3'), (2, 'hi3', 'hello3')], ['a', 'b', 'c'])
st_env.connect(FileSystem().path(sink_path)).with_format(OldCsv().field_delimiter(',').field("a", DataTypes.BIGINT()).field("b", DataTypes.STRING()).field("c", DataTypes.STRING())).with_schema(Schema().field("a", DataTypes.BIGINT()).field("b", DataTypes.STRING()).field("c", DataTypes.STRING())).register_table_sink("stream_sink")t.select("a + 1, b, c").insert_into("stream_sink")st_env.execute("stream_job")
实验结果:
在集群中的某个节点(我的是Laptop节点)中的/tmp目录下
(Python3.6) appleyuchi@Laptop:tmp$ cat streaming.csv
2,hi3,hello3
3,hi3,hello3
怎么看是不是per-job模式呢?如下图右侧的yarn界面
pyflink shell on yarn在per-job cluster模式下的实验记录相关推荐
- pyflink shell的remote模式下的实验记录
实验步骤: ①$FLINK_HOME/bin/start-cluster.sh ②pyflink-shell.sh remote Desktop 8082 使用了Table API的完整python ...
- yarn的clinet和cluster模式区别
1.你要切换到yarn-cluster或者yarn-client模式,很简单,将我们之前用于提交spark应用程序的spark-submit脚本,加上--master参数,设置为yarn-cluste ...
- Flink的scala+python的shell模式实验记录汇总
根据[1],FLINK的shell有以下一些运行模式 ################################下面是scala-shell########################### ...
- 从源码角度看Spark on yarn client cluster模式的本质区别
首先区分下AppMaster和Driver,任何一个yarn上运行的任务都必须有一个AppMaster,而任何一个Spark任务都会有一个Driver,Driver就是运行SparkContext(它 ...
- 关于spark yarn模式下的常用属性
前言 整理了spark官网提供的一些常用的spark属性. Spark属性 属性名 默认值 描述 spark.yarn.am.memory 512m 在Client模式下用于YARN Applicat ...
- RocketMQ 5.0 本地源码启动Cluster模式指南
这里是weihubeats,觉得文章不错可以关注公众号小奏技术,文章首发.拒绝营销号,拒绝标题党 源码版本 这里选用最新的稳定版本5.0 启动方式 目前5.0的架构发生了重大调整,添加了一层rocke ...
- spark的client模式和cluster模式用法上的区别
运行模式 启动命令 备注 client模式 spark-shell --master yarn 支持shell,client模式可以在 命令行中省去deploy-mode命令项 cluster模式 s ...
- spark中local模式与cluster模式使用场景_Spark-Submit 和 K8S Operation For Spark
1 Overview 本文翻译自 Lightbend 的一篇文章,文章日期还比较新,2019/02/26.文章分为两部分,翻译也将分为两个部分.附上文章链接如下: https://www.lightb ...
- yarn 怎么查看有多个job在跑_flink on yarn 模式下提示yarn资源不足问题分析
背景 在实时计算平台上通过YarnClient向yarn上提交flink任务时一直卡在那里,并在client端一直输出如下日志: (YarnClusterDescriptor.java:1036)- ...
最新文章
- 在Ubuntu 16.04.4 LTS上调研开源QUIC项目ngtcp2
- 【node】express的www.js文件里面的process.env.PORT
- Huber loss--转
- pythons_pythons是什么
- hdu 3863 No Gambling (不会证明,但是是对的,,)
- 《Two Dozen Short Lessons in Haskell》学习(十)- Private Definitions — the where-clause
- Monitor 监测CPU与内存
- PowerDesigner(九)-模型文档编辑器(生成项目文档)
- 【Computer Organization笔记02】指令系统、MIPS指令系统简介、THCO MIPS指令系统、THINPAD指令模拟器
- 系列:关于TXT的文件格式
- html表格打印自动换行,html 表格自动换行问题
- boj 1348 网络流,从来没有一个网络流能让我如此泪流满面,这样的建图方式,仰慕dalong
- 在Windows 2012 R2上安装Intel I217-V/I218-V网卡驱动
- MyGUI_Orge官网教程_5.窗口部件控制
- GitHub开源组件集锦
- 以用户需求为核心能玩出什么新花样?魅族 19 主理人计划构建理想机型
- 海思开发板上挂载额外的存储空间
- 荣誉系统排名是整个服务器,魔兽世界60年代的PVP荣誉系统、军阶对照表和各职业的徽记效果...
- 车辆动力学知识总结(三) 二自由度动力学模型
- 华为机试(python):字符串1