一,部署部分省略,官网有详细的教程,顺着步骤做就好了。

二,先说说调用spark运行wordcount案例流程

1,编写代码

package com.sjb.exampleimport org.apache.log4j.Logger
import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.sql.SparkSession//  com.sjb.example.WordCount
object WordCount {var LOGGER:Logger = Logger.getLogger(WordCount.getClass)def main(args: Array[String]): Unit = {
//    val wordFile = "file:\\C:\\Users\\Administrator\\Desktop\\test.txt"
//    val wordFile = "file:/wyyt/software/flink-1.11.2/test.txt"
//    val wordFile = "/spark/test/data/test.txt"val wordFile = "/dolphinscheduler/test/resources/spark_jar/word.txt"System.setProperty("HADOOP_USER_NAME", "hive")
//    System.setProperty("HADOOP_USER_NAME", "test")
//    System.setProperty("HADOOP_USER_NAME", "dolphinscheduler")//    val wordFile = args(0)println("接受参数信息:"+wordFile)LOGGER.error("$$$$$$接受参数信息:"+wordFile)
//    val conf = new SparkConf().setAppName("wordcount").setMaster("local[*]")val conf = new SparkConf().setAppName("wordcount")conf.set("dfs.client.use.datanode.hostname", "true")val sc = new SparkContext(conf)val input = sc.textFile(wordFile)val lines: RDD[String] = input.flatMap(line => line.split(" "))val count: RDD[(String, Int)] = lines.map(word => (word, 1)).reduceByKey { case (x, y) => x + y }count.collect().foreach(println)sc.stop()}}

2,上传jar包

3,编辑节点,执行任务

4,查询任务运行过程

5,总结问题。

记得配置spark的环境变量,在海豚安装目录 :

传入参数分为3种:
主程序就是传入给main方法的参数,比如一个路径

选型参数:就是系统参数,比如提交命令 --name  xxx

自定义参数: 就是自己定义key 名称,然后在别的地方使用,在官网视频讲解 shell 脚本的案例的时候有提到。

6,未完待续

海豚调度器初次使用 .......相关推荐

  1. Apache DolphinScheduler 海豚调度器自定义时间参数

    在Apache DolphinScheduler 海豚调度器(本文简称:小海豚) 官网中,我们看到其自定义时间的参数是这样介绍的 1.支持代码中自定义变量名,声明方式:${变量名}.可以是引用 &qu ...

  2. 海豚调度器(dolphinscheduler)再次使用,添加钉钉预警

    1,首先我们部署是海豚调度器 1.3.8 版本,由于页面只有邮件预警,所以在了解源码的同时,需要添加钉钉预警 2,说明,这一块是同事搞的,不是我搞的,新版本的dolphinscheduler已经有了钉 ...

  3. 如何在CDH5.16.2中部署海豚调度器Apache Dolphin Scheduler 1.2.0

    Apache Dolphin Scheduler 组件介绍 分布式易扩展的可视化DAG工作流任务调度系统.致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用. 官网 : h ...

  4. Dolphinscheduler/海豚调度器的安装

    Dolphinscheduler的安装 一.预安装 1.1 安装节点规划 1.2 软件下载 二.安装 2.1 创建dolphinscheduler用户 2.2 安装Java 2.3 安装Zookeep ...

  5. Apache DolphinScheduler——开源大数据调度器神器

    目 录 1. 简 介 1.1 概 念 1.2 优缺点 1.3 哪些人适合DolphinScheduler(纯属个人观点) 1.4 社区 2. 集群模式安装详解(比官网还细,个人手把手实践避坑) 2.1 ...

  6. 深入了解海豚调度DolphinScheduler

    深入了解海豚调度DolphinScheduler 一.海豚调度介绍 二.海豚调度特性 三.建议配置 四.名词解释 五.模块介绍 六.功能介绍 1.项目首页 2.工作流定义 3.工作流实例 4.任务实例 ...

  7. 海豚调度DolphinScheduler源码分析(一)

    系统架构设计 在对调度系统架构说明之前,我们先来认识一下调度系统常用的名词 1.名词解释 DAG: 全称Directed Acyclic Graph,简称DAG.工作流中的Task任务以有向无环图的形 ...

  8. 海豚调度在 Kubernetes 体系中的技术实战

    点击上方 蓝字关注我们 作者 | 杨滇 编辑 | warrior_ ✎ 编者按 Kubernetes 是一个基于容器技术.实现容器编排.提供微服务和总线的集群系统,涉及到大量的知识体系. 本文从作者的 ...

  9. 美女 Committer 手把手教你使用海豚调度

    还在为选哪个调度发愁么?还在为查使用手册愁眉不展么?来来来,先瞧一眼海豚调度的 Slogan:调度选的好,下班回家早.调度用的对,半夜安心睡.为充分贯彻这一宗旨,海豚调度一条龙服务来了,特地邀请海豚社 ...

最新文章

  1. antd提交表单_表单序列化
  2. 获取linux详细信息,Linux 获取网口详细信息
  3. Android 网格视图GridView
  4. 无线路由器天线上绑几个电池,真的会增强发射信号吗?
  5. Mono for Android 4.2初探
  6. KNN--K近邻算法
  7. Minitab 控制图
  8. 如何用猿大师播放器把海康威视硬盘录像机截取MP4视频在web页面上回放?支持本地和远程视频吗?
  9. 阿里云因发现Log4j2漏洞未及时上报,被工信部处罚!
  10. python 字符串方法 replace_python字符串方法replace()简介
  11. html多个好看的背景动态效果(附源码)
  12. 服务器如何预防入侵问题
  13. Tensorflow 源码编译笔记(C++/C层)
  14. chorme 显示“请在微信客户端打开链接”
  15. SDNUOJ 1168.FBI树
  16. Win32API:CreateDialog、DialogBox、DialogProc
  17. 面试小知识(2)为什么TCP需要三次握手和四次挥手
  18. 用html实现满屋花的网页
  19. 第三个Sprint ------第十一天
  20. 服务器被攻击后处理办法

热门文章

  1. 亚马逊个人创业这条路行的通吗?
  2. 弹窗的点击空白关闭,背景虚化,防止滚动穿透
  3. Java-Collection集合之单列集合List,以及遍历方式
  4. 加油站都需要什么手续_开加油站,需要在哪些地方审批些什么手续?
  5. 鸟哥的Linux笔记-------磁盘与文件系统
  6. C++程序设计原理与实践 习题答案 第二十六章 第26章习题答案
  7. 入门级node+uni-app开发即时通讯聊天室(3)用户的搜索以及好友添加(二)
  8. 今天开始学Java 如果统计的个数相同,则按照ASII码由小到大排序输出 。
  9. 漏洞篇(SQL注入一)
  10. vue-amap 高德地图中使用测距插件