first()案例

作用:返回RDD中的第一个元素

需求:创建一个RDD,返回该RDD中的第一个元素

(1)创建一个RDD

scala> val rdd = sc.parallelize(1 to 10)

rdd: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[0] at parallelize at <console>:24

(2)统计该RDD的条数

scala> rdd.first

res2: Int = 1

take(n)案例

作用:返回一个由RDD的前n个元素组成的数组

需求:创建一个RDD,统计该RDD的条数

(1)创建一个RDD

scala> val rdd = sc.parallelize(Array(2,5,4,6,8,3))

rdd: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[2] at parallelize at <console>:24

(2)统计该RDD的条数

scala> rdd.take(3)

res10: Array[Int] = Array(2, 5, 4)

想要了解跟多关于大数据培训课程内容欢迎关注尚硅谷大数据培训,尚硅谷除了这些技术文章外还有免费的高质量大数据培训课程视频供广大学员下载学习。

first()案例和take(n)案例_大数据培训课程相关推荐

  1. countByKey()案例和foreach(func)案例_大数据培训课程

    12 countByKey()案例 作用:针对(K,V)类型的RDD,返回一个(K,Int)的map,表示每一个key对应的元素个数. 需求:创建一个PairRDD,统计每种key的个数 (1)创建一 ...

  2. collect()案例和count()案例_大数据培训课程

    collect()案例 作用:在驱动程序中,以数组的形式返回数据集的所有元素. 需求:创建一个RDD,并将RDD内容收集到Driver端打印 (1)创建一个RDD scala> val rdd ...

  3. 大数据培训课程数据清洗案例实操-简单解析版

    数据清洗(ETL) 在运行核心业务MapReduce程序之前,往往要先对数据进行清洗,清理掉不符合用户要求的数据.清理的过程往往只需要运行Mapper程序,不需要运行Reduce程序.大数据培训 数据 ...

  4. 【bigdata】13个大数据应用案例,告诉你最真实的大数据故事

    13个大数据应用案例,告诉你最真实的大数据故事 大数据真的太神奇了,真的可以让改变一个企业的运营吗?答案是肯定的.大数据目前是当下最火热的词了,你要是不知道大数据这个概念,都不好意思在众人面前开口了. ...

  5. Spark商业案例与性能调优实战100课》第2课:商业案例之通过RDD实现分析大数据电影点评系统中电影流行度分析

    Spark商业案例与性能调优实战100课>第2课:商业案例之通过RDD实现分析大数据电影点评系统中电影流行度分析 package com.dt.spark.coresimport org.apa ...

  6. 《Spark商业案例与性能调优实战100课》第6课:商业案例之通过Spark SQL实现大数据电影用户行为分析

    <Spark商业案例与性能调优实战100课>第6课:商业案例之通过Spark SQL实现大数据电影用户行为分析 package com.dt.spark.sparksqlimport or ...

  7. url采集工具_大数据关键技术浅谈之大数据采集

    在前几篇文章中,企通查为大家介绍了大数据处理的基本流程.从大数据的一系列处理过程中(抽取.集成.分析.解释),我们可以发现这一整套流程中涵盖了数据存储.处理.应用等多方面的技术. 大数据价值的完美体现 ...

  8. 数据的四大特征_大数据

    数据的四大特征_大数据 我们总是在谈数据分析,数据分析什么的,那我们现在先不谈数据分析,我们先来谈谈数据分析的基础--数据.那么到底什么是数据,数据有什么特征呢?这个问题虽基础却重要. 这里我们所说的 ...

  9. 大数据分析师高级证书_数据分析师资格证书好考吗_大数据分析师认证

    数据分析师资格证书好考吗_大数据分析师认证 为了适应大数据时代的要求,数据分析这一工作需要更加正规化.专业化以及职业化,因此,数据分析师应运而生,成了较多人争相报考的科目.那么 一方面,据小编了解,数 ...

最新文章

  1. JAVA-基础(Class对象及反射)
  2. Kettle使用_23 Excel表格输入ODS POI
  3. js结合css3,使用JS和CSS3实现的旗帜飘扬动画
  4. mysql root密码过期了_Mac下重置mysql的root密码
  5. 软件测试的学习之路------软件质量
  6. Hadoop集群部署权限总结
  7. 给萌新HTML5 入门指南
  8. pat04-树7. Search in a Binary Search Tree (25)
  9. Java DatagramPacket 中的坑
  10. Mac 安装 python brew
  11. s3c2440的pwm输出
  12. Atitit bootsAtitit bootstrap布局 栅格.docx目录1. 简述container与container-fluid的区别 11.1.1. 在bootstrap中的布局
  13. gan怎么输入一维数据_GAN网络,利用gan网络完成对一维数据点的生成
  14. 干货丨爱奇艺CDN IPv6系统配置
  15. 计算机应用 行动计划范文,制定计算机学习计划范文3篇0001.docx
  16. ARM_Linux开发之TFTP应用
  17. 汇编语言:以“年/月/日 时:分:秒”的格式,显示当前的日期、时间。
  18. printf中%d,%c,%s,%x各代表什么
  19. 最小相位滤波器 matlab,基于MATLAB最小相位数字滤波器的设计方法研究
  20. 【2019春招】平安科技开发实习生面经

热门文章

  1. 交通诱导信息发布系统服务器,基于TTS技术的交通语音诱导信息发布系统设计
  2. 数据结构之顺序存储与链式存储
  3. 微信小程序 联想搜索
  4. linux生成pdf乱码,com.aspose 生成pdf在linux生成PDF乱码解决(window环境正常)
  5. 动力节点—2020最新Spring教程笔记(上)
  6. 五分钟带你实战linux 创建组用户,创建新用户,修改用户组属性,修改权限的应用
  7. S7-200 SMART PLC和V20变频器绕线机控制应用
  8. 使用Quartz实现定时任务(包含管理界面)
  9. android studio 木马,155个谷歌商店Android App感染木马影响280万用户
  10. 虚拟摄像头Softcam v1.52 汉化注册版