文章目录

  • flink命令
    • 查看flink任务
    • flink run参数
    • flink run -m yarn-cluster参数
    • flink cancel
    • flink stop:仅仅针对Streaming job
    • flink modify 修改任务并行度
    • flink savepoint
    • 例子
    • 获取最近savepoints
    • flink任务重启步骤样例
  • yarn命令
    • 查看yarn中的作业
    • 杀掉yarn session
    • 查看yarn的环境变量设置
  • master节点启动一个 Socket 服务

flink命令

查看flink任务

flink list:列出flink提交任务的job列表。
flink list -r/--runing:列出正在运行的job
flink list -s/--scheduled:列出已调度完成的job# 查看最近取消的是哪个命令
./bin/flink list -a

flink run参数

flink run命令执行模板:flink run [option]

参数 参数全称 描述
-c –class 需要指定的main方法的类
-C –classpath 向每个用户代码添加url,他是通过UrlClassLoader加载。url需要指定文件的schema如(file://)
-d –detached 在后台运行
-p –parallelism job需要指定env的并行度,这个一般都需要设置。
-q –sysoutLogging 禁止logging输出作为标准输出。
-s –fromSavepoint 基于savepoint保存下来的路径,进行恢复。
-sae –shutdownOnAttachedExit 如果是前台的方式提交,当客户端中断,集群执行的job任务也会shutdown。

flink run -m yarn-cluster参数

参数 参数全称 描述
-m –jobmanager yarn-cluster集群
-yd –yarndetached 后台
-yjm –yarnjobManager jobmanager的内存
-ytm –yarntaskManager taskmanager的内存
-yn –yarncontainer TaskManager的个数
-yid –yarnapplicationId job依附的applicationId
-ynm –yarnname application的名称
-ys –yarnslots 分配的slots个数

例:flink run -m yarn-cluster -yd -yjm 1024m -ytm 1024m -ynm -ys 1

flink cancel

flink cancel [options] <job_id> : 取消正在运行的job id
flink cancel -s/--withSavepoint <job_id> : 取消正在运行的job,并保存到相应的保存点

也可以通过 UI 界面 cancel

flink stop:仅仅针对Streaming job

flink stop [options] <job_id>:停止对应的job

通过 -m 来指定要停止的 JobManager 的主机地址和端口

例: bin/flink stop -m 127.0.0.1:8081 d67420e52bd051fae2fddbaa79e046bb

取消和停止(流作业)的区别如下:

cancel() 调用,立即调用作业算子的 cancel() 方法,以尽快取消它们。如果算子在接到 cancel() 调用后没有停止,Flink 将开始定期中断算子线程的执行,直到所有算子停止为止。

stop() 调用,是更优雅的停止正在运行流作业的方式。stop() 仅适用于 Source 实现了 StoppableFunction 接口的作业。当用户请求停止作业时,作业的所有 Source 都将接收 stop() 方法调用。直到所有 Source 正常关闭时,作业才会正常结束。这种方式,使作业正常处理完所有作业。

flink modify 修改任务并行度

flink modify <job_id> [options]

flink modify <job_id> -p /–parallelism p : 修改job的并行度

例: flink modify -p 并行数 <job_pid>

flink savepoint

flink savepoint [options] <job_id>

eg: # 触发保存点

flink savepoint <job_id> hdfs://xxxx/xx/x : 将flink的快照保存到hdfs目录

  • 使用yarn触发保存点
    flink savepoint <job_id> <target_directory> -yid <application_id>

  • 使用savepoint取消作业
    flink cancel -s <tar_directory> <job_id>

  • 从保存点恢复
    flink run -s <target_directoey> [:runArgs]

  • 如果复原的程序,对逻辑做了修改,比如删除了算子可以指定allowNonRestoredState参数复原。
    flink run -s <target_directory> -n/–allowNonRestoredState [:runArgs]

savepoint 与 checkpoint 的区别

checkpoint是增量做的,每次的时间短,数据量小,只要在程序里面启用后会自动触发,用户无需感知;savepoint是全量做的,时间长,数据量大,需要用户主动触发。

checkpoint 是作业failover 的时候自动使用,不需要用户指定,savepoint 一般用于程序版本更新、bug修复、A/B Test 等场景,需要用户指定。

例子

实时风控:对应的数据源mq有八个队列,所以并行度设置为8

flink run -m yarn-cluster -p 8 -ytm 1024m -yjm 2048m -ys 1 -c com.enmonster.OrderDataProcessing sdb-ms-1.0-SNAPSHOT.jar /opt/cloudera/parcels/FLINK-1.9.0-csa1.0.0.0-cdh6.3.0/lib/flink/plugins/config.txt
编号 参数 描述
1 flink run -m yarn-cluster flink任务在Flink job on YARN模式下的固定参数
2 -p 指定的程序并行度
3 -ytm 每个TaskManger分配的内存大小
4 -yjm JobManger分配的内存大小,一个程序一般只有一个JobManger
5 -ys 一个TaskManger中启动的slot个数
6 -s 程序checkpoint检查点手动恢复指定路径,只在程序重新启动的时候使用
7 -c 程序主类类名
8 sdb-ms-1.0-SNAPSHOT.jar 程序jar包所在位置
9 /opt/cloudera/parcels/FLINK-1.9.0-csa1.0.0.0-cdh6.3.0/lib/flink/plugins/ 程序配置文件的存放路径
10 config.txt 程序的配置文件

获取最近savepoints

hdfs dfs -ls hdfs:///user/flink/savepoints

flink任务重启步骤样例

#取消任务,得到savepoints地址
flink cancel a2c986adbc9ed9ec646fa0d926439775 -s hdfs:/user/flink/savepoints -yid application_1596180472513_1706#savepoints地址:
hdfs://cdh138.enmonster.org:8020/user/flink/savepoints/savepoint-a2c986-50aaa089b02f#kill任务
yarn application -kill application_1596180472513_1706#重启任务
flink run -m yarn-cluster -p 8 -ytm 1024m -yjm 2048m -ys 1 -ynm SDB_JOB -yD log4j2.formatMsgNoLookups=true -s hdfs://cdh138.enmonster.org:8020/user/flink/savepoints/savepoint-a2c986-50aaa089b02f -c com.enmonster.OrderDataProcessing sdb-ms-1.0-SNAPSHOT.jar /opt/cloudera/parcels/FLINK-1.9.0-csa1.0.0.0-cdh6.3.0/lib/flink/plugins/config.txt

log4j2修复bug参数

-yD log4j2.formatMsgNoLookups=true

yarn命令

查看yarn中的作业

yarn application --listyarn application -list -appStates ALL  #查看所有的作业#看某个作业的详细信息:
yarn application -status application_1565872581822_5969#查看相应状态的作业:
yarn application --list -appStates FINISHED >1.txtcat 1.txt |grep 2019-08-11状态有:
state can be one of the following:
ALL,NEW,NEW_SAVING,SUBMITTED,ACCEPTED,RUNNING,FINISHED,FAILED,KILLED

杀掉yarn session

yarn appclication -kill application_1625727533919_9502#kill掉default队列中的任务
for i in  `yarn application  -list | grep -w  default | awk '{print $1}' | grep application_`; do yarn  application -kill $i; done

查看yarn的环境变量设置

#查看yarn的环境变量设置:
yarn envvars
WARNING: YARN_OPTS has been replaced by HADOOP_OPTS. Using value of YARN_OPTS.
JAVA_HOME='/usr/java/jdk1.8.0_181-cloudera'
HADOOP_YARN_HOME='/opt/cloudera/parcels/CDH-6.2.0-1.cdh6.2.0.p0.967373/lib/hadoop/libexec/../../hadoop-yarn'
YARN_DIR='./'
YARN_LIB_JARS_DIR='lib'
HADOOP_CONF_DIR='/etc/hadoop/conf'
HADOOP_TOOLS_HOME='/opt/cloudera/parcels/CDH-6.2.0-1.cdh6.2.0.p0.967373/lib/hadoop'
HADOOP_TOOLS_DIR='share/hadoop/tools'
HADOOP_TOOLS_LIB_JARS_DIR='share/hadoop/tools/lib'

master节点启动一个 Socket 服务

命令:nc -lk 8888(提示:nc: command not found,通过yum install nc来安装)

flink.apache:https://flink.apache.org/zh/flink-architecture.html

参考:https://blog.csdn.net/l_521mu/article/details/114327993
https://blog.csdn.net/hxbao/article/details/107982264
https://blog.csdn.net/Black_8/article/details/107863652
https://www.cnblogs.com/hongfeng2019/p/12323655.html

flink学习项目:
https://github.com/QuakeWang/FlinkTutorial
https://github.com/mys-mx/Flink-study/tree/master/Flink_study/data

Flink常见异常和错误信息小结:https://blog.csdn.net/u013411339/article/details/105401066/

[1101]flink常用参数说明相关推荐

  1. flink常用参数说明

    一.flink run参数: flink run命令执行模板:flink run [option] -c,–class : 需要指定的main方法的类 -C,–classpath : 向每个用户代码添 ...

  2. 质控软件fastp常用参数说明

    文章目录 写在前面 参考文献 fastp功能 类似软件比较 简单示例 常用参数说明 UMI去除 质量过滤 长度过滤 低复杂度过滤 adapter过滤 通过质量值过滤每条read ployG/ployX ...

  3. R语言使用plot函数和lines函数可视化线图(line plot)时、图之间的主要区别是由选项type产生的、type参数常用参数说明、不同type生成的可视化图像对比

    R语言使用plot函数和lines函数可视化线图(line plot)时.图之间的主要区别是由选项type产生的.type参数常用参数说明.不同type生成的可视化图像对比 目录

  4. 发那科2021参数_FANUC常用参数说明

    包括运行速度,到位宽度,加减速时间常数,软限位,运行 / 停止时的位置偏差,和显示有 关的参数等,参照如下常用参数表(表2)设定. 表2常用参数说明 参数含义 FS-OI MA/MB FS-OI-Ma ...

  5. flink run常用参数说明

    flink run参数: 参数 参数全称 描述 -c –class 需要指定的main方法的类 -C –classpath 向每个用户代码添加url,他是通过UrlClassLoader加载.url需 ...

  6. docker run常用参数说明

    创建容器常用的参数说明:创建容器命令:docker run-i:表示运行容器-t:表示容器启动后会进入其命令行.加入这两个参数后,容器创建就能登录进去.即分配一个伪终端.--name :为创建的容器命 ...

  7. [Flink]Flink常用的DataStream转换算子

    目录 3.1 Map 3.2 FlatMap 3.3 Filter 3.4 KeyBy 3.5 Reduce 3.6 Fold 3.7 Aggregations 3.8 Window 3.9 Wind ...

  8. panda.read_csv的常用参数说明

    pandas.read_csv 原型: pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', na ...

  9. 大数据之flink常用算子

    Flink分为: DataSet(批处理),DataStream(流处理),他们的方法都分别为Source.Transformation.Sink: Source:负责数据的读取 Transforma ...

最新文章

  1. nodejs报错解决:Error: Can only perform operation while paused. - undefined
  2. python tableview绑定字典_TableView索引的添加
  3. 病的不轻?教你 2 招,拯救拖延症!
  4. mysql登陆salt_salt把返回写入到mysql
  5. 大妈也能看懂的大数据分布式计算
  6. 用CSS3 vh 简单实现DIV全屏居中
  7. linux mate eth0已下线,Linux Mint 18 Cinnamon 版和 MATE 版已经可以下载了
  8. bug--Unable to add window –token is not valid; is your activity running?
  9. asterisk远程注册
  10. linux apktool使用教程,简单介绍ubuntu下apktool的使用与配置
  11. 【收藏】QCIF、 CIF、2CIF、DCIF、D1(4CIF)格式介绍
  12. 1寸2寸3寸5寸6寸8寸10寸照片的具体尺寸(附常用照片尺寸对照表)
  13. 一款阿里的知识管理工具
  14. 网易云到“网抑云”:分析用户运营的指标监控和召回机制
  15. html5柱状图模板,html5生成柱状图(条形图)
  16. 连接手表_小米手表首批已到手 这些事儿你必须知道
  17. Mac版本的夜神模拟器
  18. MySQL中 find_in_set 函数如何替换成Oracle写法
  19. mysql 慢日志可视化_Mysql 慢日志分析系统搭建 —— Box Anemometer
  20. 全新8.6版本SEO快排系统(可源码级搭建)

热门文章

  1. 简谐振动的能量与合成(大学物理笔记)
  2. STM32F4的基础介绍
  3. xib、stoaryboard详解
  4. 虚拟化技术 — GuestOS Agent
  5. ArcGIS 裁剪地图显示范围
  6. 消息队列之取消会议和自动退款处理
  7. 0102Linux基础命令
  8. 【智能优化算法】改进的侏儒猫鼬优化算法(IDMO)附matlab代码
  9. 详解视频中动作识别模型与代码实践
  10. Spring的9处调用后置处理器