1.Broadcast就是将数据从一个节点发送到其他的节点上。例如Driver上有一张表,而Executor中的每个并行执行的Task(100万个)都要查询这张表,那我们通过Broadcast的方式就只需要往每个Executor把这张表发送一次就行了。Executor中的每个运行的Task查询这张唯一的表,而不是每次执行的时候都从Driver获得这张表!

2.这就好像ServletContext的具体作用,只是Broadcast是分布式的共享数据。默认情况下,只要程序在运行Broadcast变量就会存在,因为Broadcast在底层是通过BlockManager管理的!但是你可以手动指定或者配置具体周期来销毁Broadcast变量!

3.Broadcast一般用于处理共享配置文件,通用的Dataset,常用的数据结构等等。但是不适合存放太大的数据在Broadcast中,Broadcast不会内存溢出,因为其数据的保存的StorageLevel是MEMORY_AND_DISK的方式。虽然如此,我们也不可以放入太大的数据在Broadcast中,因为网络IO和可能的单点压力会非常大!

4.广播Broadcast变量是只读变量,保持数据一致性。

5.spark2.0.x以前貌似有HttpBroadcast(HttpBroadcastFactory)和Torre

spark学习-34-Spark的BroadcastManager广播管理器相关推荐

  1. Spark学习之Spark调优与调试(7)

    Spark学习之Spark调优与调试(7) 1. 对Spark进行调优与调试通常需要修改Spark应用运行时配置的选项. 当创建一个SparkContext时就会创建一个SparkConf实例. 2. ...

  2. Spark学习之Spark Streaming(9)

    Spark学习之Spark Streaming(9) 1. Spark Streaming允许用户使用一套和批处理非常接近的API来编写流式计算应用,这就可以大量重用批处理应用的技术甚至代码. 2. ...

  3. Spark学习之Spark初识

    一.什么是Spark Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎.Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Had ...

  4. Spark学习之Spark Streaming

    一.简介 许多应用需要即时处理收到的数据,例如用来实时追踪页面访问统计的应用.训练机器学习模型的应用,还有自动检测异常的应用.Spark Streaming 是 Spark 为这些应用而设计的模型.它 ...

  5. ASP.NET Core on K8S深入学习(10)K8S包管理器Helm-Part 2

    本篇已加入<.NET Core on K8S学习实践系列文章索引>,可以点击查看更多容器化技术相关系列文章.上一篇 Part 1 中介绍了Helm的基本概念与基本使用,这一篇我们来自定义一 ...

  6. ASP.NET Core on K8S深入学习(10)K8S包管理器Helm-Part 1

    本篇已加入<.NET Core on K8S学习实践系列文章索引>,可以点击查看更多容器化技术相关系列文章. 关于Helm Why Helm? 虽然K8S能够很好地组织和编排容器,但是缺少 ...

  7. JMeter学习笔记--使用HTTP信息头管理器

    使用HTTP信息头管理,可以帮助测试人员设定JMeter发送的HTTP请求头所包含的信息.HTTP信息头中包含有"User-Agent"."Pragma".&q ...

  8. Spark学习之Spark RDD算子

    个人主页zicesun.com 这里,从源码的角度总结一下Spark RDD算子的用法. 单值型Transformation算子 map /*** Return a new RDD by applyi ...

  9. spark学习-35-Spark的Map任务输出跟踪器MapOutputTracker

    ##1.在sparkEnv的初始化中有这样一段代码来初始化Map任务输出跟踪器MapOutputTracker mapOutputTracker用于跟踪map阶段任务的输出状态,此状态便于reduce ...

最新文章

  1. CVPR 2021 | 基于语义聚合与自适应2D-1D配准的手部三维重建(快手)
  2. 独家 | 手把手教你用R语言做回归后的残差分析(附代码)
  3. python tkinter 布局_(4)python tkinter-布局
  4. 获取内容第一张图片地址的函数
  5. boost::mpl模块实现transform相关的测试程序
  6. Crontab中shell每分钟执行一次HDFS文件上传不执行的解决方案
  7. 数据结构-顺序查找和折半查找
  8. 程序员难以攻克的十大难题
  9. OpenShift 4.10 不可变新特性 - 利用 MachineConfig 发现节点配置漂移
  10. 国产441b电子计算机,国产441B晶体管计算机文档(讲义)
  11. JAVA语言基础-面向对象(方法重写概述及其应用)
  12. 互联网公司如何有效执行流程的心得
  13. HTML5 语义元素
  14. 计算机性能在线测评,电脑性能在线测试
  15. 74cms php在那个文件夹里面,74cms骑士人才网站系统 v5.0/v5.1后台目录地址修改教程...
  16. 端到端和非端到端的Embedding,以及embedding质量评估
  17. 【2019.05.23】JS逆向——破解裁判文书网参数(vl5x,guid )爬虫 超级详细
  18. 新技术预研Android
  19. C++学习笔记5——引用
  20. 写代码赚钱的一些门路

热门文章

  1. 一加8 Pro相机能“透视”,一加工程师:大家不要“有一个大胆的想法”
  2. 星巴克人造肉产品来了,植物牛肉餐品真香?
  3. 神武咪咕汇点燃大湾区 多益网络深化新文创实践
  4. 特斯拉电动皮卡发布:马斯克称它能防弹、能上火星,结果还没扛过一钢球......
  5. 顺丰拟发行58亿可转债:15亿投入航空运力,12亿还贷款
  6. 卢伟冰正式预告Redmi K30:首发双开孔全面屏+双模5G
  7. 小米两款狠家伙来了:最便宜的5G手机和19999元的5G环绕屏手机!
  8. 华为云的“大招”——Euler开源 Gauss开放 旨在建立云生态
  9. 小米海外召回有潜在风险的电动滑板车 中国区无此风险
  10. 雷军和董明珠“十亿赌局”胜负已定:小米格力营收差距依然很大