大数据培训课程saveAsObjectFile(path)

作用:用于将RDD中的元素序列化成对象,存储到文件中。

大数据培训课程 countByKey()案例

作用:针对(K,V)类型的RDD,返回一个(K,Int)的map,表示每一个key对应的元素个数。

需求:创建一个PairRDD,统计每种key的个数

(1)创建一个PairRDD

scala> val rdd = sc.parallelize(List((1,3),(1,2),(1,4),(2,3),(3,6),(3,8)),3)

rdd: org.apache.spark.rdd.RDD[(Int, Int)] = ParallelCollectionRDD[95] at parallelize at <console>:24

(2)统计每种key的个数

scala> rdd.countByKey

res63: scala.collection.Map[Int,Long] = Map(3 -> 2, 1 -> 3, 2 -> 1)

大数据培训课程 foreach(func)案例

作用:在数据集的每一个元素上,运行函数func进行更新。

需求:创建一个RDD,对每个元素进行打印

(1)创建一个RDD

scala> var rdd = sc.makeRDD(1 to 5,2)

rdd: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[107] at makeRDD at <console>:24

(2)对该RDD每个元素进行打印

scala> rdd.foreach(println(_))

3

4

5

1

2

想要了解跟多关于大数据培训课程内容欢迎关注尚硅谷大数据培训,尚硅谷除了这些技术文章外还有免费的高质量大数据培训课程视频供广大学员下载学习。

大数据培训课程之countByKey()案例相关推荐

  1. 大数据培训课程之fold(num)(func)案例

    fold(num)(func)案例 作用:折叠操作,aggregate的简化操作,seqop和combop一样. 需求:创建一个RDD,将所有元素相加得到结果 (1)创建一个RDD scala> ...

  2. 大数据培训课程之RDD传递一个属性

    传递一个属性 1.创建Spark主程序 object TransmitTest { def main(args: Array[String]): Unit = { //1.初始化配置信息及SparkC ...

  3. 大数据培训课程之RDD中的函数传递

    RDD中的函数传递 在实际开发中我们往往需要自己定义一些对于RDD的操作,那么此时需要主要的是,初始化工作是在Driver端进行的,而实际运行程序是在Executor端进行的,这就涉及到了跨进程通信, ...

  4. 大数据培训课程之Flume拓扑结构大数据培训课程之Flume拓扑结构

    Flume拓扑结构 Flume的拓扑结构如图1-3.1-4.1-5和1-6所示: 图1-3 Flume Agent连接 图1-4 单source,多channel.sink 图1-5 Flume负载均 ...

  5. 大数据培训怎么样,怎么选择合适大数据培训机构?

    数据培训在当下是个非常热门的话题,大数据在深刻的影响着这个世界,大数据正引发新一轮革命.应运时代的变化需求,国内涌现出不少大数据培训机构.不少人问大数据培训靠谱吗?该如何选择培训机构呢? 1.看高薪就 ...

  6. 泰迪云课堂大数据培训平台业务介绍

    泰迪云课堂大数据培训业务分为几个类型,包括就业培训班.在线实习.大数据推荐课程.图书配套视频课程 .技能提升等方面.        就业培训班包括:学徒班.线下就业班.项目班      学徒班包括:大 ...

  7. 2018大数据培训学习路线图(详细完整版)

    2018大数据培训学习路线全课程目录+学习线路详解(详细完整版) 第一阶段:大数据基础Java语言基础阶段 1.1:Java开发介绍 1.1.1 Java的发展历史 1.1.2 Java的应用领域 1 ...

  8. 大数据培训ClickHouse表引擎

    表引擎 表引擎(即表的类型)决定了: 1)数据的存储方式和位置,写到哪里以及从哪里读取数据 2)支持哪些查询以及如何支持. 3)并发数据访问. 4)索引的使用(如果存在). 5)是否可以执行多线程请求 ...

  9. Java大数据培训学校全套教程-AJAX(27)-马克-专题视频课程

    Java大数据培训学校全套教程-AJAX(27)-2人已学习 课程介绍         Java大数据培训学校视频教程:"java大数据培训学校全套教材"系列课程由750集视频构成 ...

最新文章

  1. 【蓝桥杯】2019年第十届蓝桥杯省赛B组试题J — 灵能传输(前缀和,猜想结论)难度⭐⭐⭐⭐
  2. 华为云计算之存储的分类
  3. RabbitMQ消费消息幂等性问题
  4. 人身三流指什么_电气隔离是什么意思呢?
  5. 电脑键盘上每个键作用
  6. python 示例_带有示例的Python文件关闭属性
  7. android四周阴影效果_帮助独立开发者轻松创建令人惊叹的产品视觉效果
  8. 饥荒进地洞服务器无响应,饥荒联机洞穴设置及常见问题的解决方法
  9. 属性绑定与双向数据绑定
  10. php调用其他文件数组的值,PHP递归调用数组值并用其执行指定函数
  11. HTML5——锚点链接
  12. 互联网+电子招投标,正成为一种趋势
  13. Java StackTraceElement源码总结 StackTraceElement源码注释翻译和解析中英文对照版
  14. 计算机设备与驱动器空白图标,这个方法帮你删掉win10设备和驱动器里无效图标...
  15. ad7606中文资料_16位ADC数据采集模块AD7606(原理图、中文数据手册、例程等)
  16. PT2264\pt2294(带编码)无线、接收、收发
  17. 漏洞挖掘之 SQL 注入挖掘
  18. 计算机专业硕士毕业论文,计算机技术专业硕士毕业论文(9)(喜欢就下吧)...
  19. 验证选举后继路由和可行后继路由的实时性[IT傻博士原创]
  20. hexo+yilia主题添加评论

热门文章

  1. C语言控制台窗口图形界面编程
  2. 课程设计报告linux小游戏,嵌入式课程设计报告---贪吃蛇游戏.doc
  3. Linux下安装SVN服务端小白教程
  4. 四川智茂:拼多多个人店铺要缴税吗
  5. windows10系统如何关闭数字签名认证
  6. 无法双击点开计算机,小达人点读笔在电脑里面双击DAB文件无法打开,怎么办?...
  7. 雨林木风GHOST XP 在虚拟机上的安装步骤
  8. 德温特专利数据的爬取(selenium\xpath\contains解决了输入框ID老是动态改变的问题)
  9. matlab回归分析结果输出,科学网—回归分析的MATLAB和R程序实现 - 王福昌的博文...
  10. 100集华为HCIE安全培训视频教材整理 | 准入控制功能实现(七)