当前京东数据平台用到spark 的五种方式

1.spark sql 数据从Hive 同步到ES
  用python包装命令, 使用spark-submit 提交 ,run_shell_cmd(spark-submit) 具体案例可以参考另外的博文

2.机器学习会用到pyspark 自带的类似kmeans 的方法做数据加载 ,用pypsark 写 应用程序,通过shell 调

spark-submit 执行命令 包装成zip 进行发布

3.再有就是机器学习用Scalaspark  打成jar   结合shell spark-submit 打包成zip 发布

4.另外一种情况把现在python sql 脚本 发布到spark sql 的队列中 ,直接执行 ,相对改变较小,经过测试发现

需要对内存和core 和executor 要有较好的认知把握才能提高程序执行效率

5.最后一种情况是 用Java 或是 Scala python  写 spark程序 rdd ,打成jar 发布 shell zip 包 执行 ,这些个

变化相对较大,不太容易呈现  ,改写要求高,但是对提高对spark 的认识和技能掌握更有提高的空间

comment : 目前公司前四种都有用到 ,第一和第四条我有尝试测试 ,对于 第2 第3 ,第5 暂时未有深度了解,

不过迫在眉睫。

当前京东数据平台用到spark 的五种方式相关推荐

  1. CDH大数据平台搭建之SPARK集群搭建

    CDH大数据平台搭建之SPARK集群搭建 一.安装规划 二.下载 三.安装及配置 1.解压 2.修改配置文件 四.启动 五.JPS检查节点 一.安装规划 参考CHD大数据平台搭建之集群规划 二.下载 ...

  2. android mysql储存动态数据_Android数据存储五种方式总结

    本文介绍Android平台进行数据存储的五大方式,分别如下: 下面详细讲解这五种方式的特点 第一种: 使用SharedPreferences存储数据 适用范围:保存少量的数据,且这些数据的格式非常简单 ...

  3. 批量插入数据库语句java_java相关:MyBatis批量插入数据到Oracle数据库中的两种方式(实例代码)...

    java相关:MyBatis批量插入数据到Oracle数据库中的两种方式(实例代码) 发布于 2020-7-22| 复制链接 本文通过实例代码给大家分享了MyBatis批量插入数据到Oracle数据库 ...

  4. Android数据存储五种方式总结

    1 使用SharedPreferences存储数据     2 文件存储数据       3 SQLite数据库存储数据 4 使用ContentProvider存储数据 5 网络存储数据 下面详细讲解 ...

  5. 大数据正在改变客户服务的五种方式

    大数据正在改变客户服务的五种方式 任何组织的命脉,无论是否面向服务,都是需要为客户提供良好的服务.组织如何与其客户进行互动,会影响他们如何看待组织,这会影响潜在客户,除了组织最忠实的客户之外. 客户服 ...

  6. Excel中数据透视表数据源更新的三种方式

    Excel中数据透视表数据源更新的三种方式 1.在原有的基础上重新选择数据源 2.变数据源为表格形式,在创建一个透视表,之后如果添加的数据,选中透视表右键刷新即可 3.利用更新过的数据源再重新创建一个 ...

  7. 传感器信号 如何发送到服务器,传感器采集到的数据通过无线传输至监控服务器的四种方式...

    传感器采集到的数据通过无线传输至监控服务器的四种方式 [复制链接] 目前,工业物联网传感器数据采集无线传输至监控服务器比较常用的通讯解决方案主要有GPRS/4G,433MHz和2.4GHz等三种,而以 ...

  8. 前端数据交互的五种方式

    数据交互的主要五种方式:xhr .$.ajax .fetch.axios .vue-resource. 1.XMLHttpRequest是原生js基于浏览器所提供的一种可以数据交互的方式. 优点:1. ...

  9. 【大数据平台】基于Spark的美国新冠肺炎疫情数据分析及预测

    (本实验系中国地质大学(武汉)2022年秋期大数据平台及应用课程设计) 一.选题背景 新型冠状病毒疫情是由严重急性呼吸系统综合征冠状病毒2(SARS-CoV-2)导致的2019冠状病毒病(COVID- ...

最新文章

  1. 深入理解malloc和free
  2. pyqt根据名字获取控件
  3. 最详细的企业级可视化大屏教程,90%的需求看这一篇就足够了
  4. 【Flink】Error during binlog processing last offset stored = null binglog reader near position
  5. 官网下载storage manager方法
  6. html 百度地图坐标拾取,百度拾取坐标系统坐标反查是什么意思
  7. facebook登陆接入
  8. 西游记中牛魔王的雄厚实力和家业地盘
  9. 模拟二进制交叉算子(SBX)与多项式变异(PM)
  10. 1、二进制安装k8s
  11. SSM+JSP实现企业管理系统(OA管理系统源码+数据库+文档+PPT)
  12. Vue+nodejs+express天天生鲜超市购物商城平台
  13. 华中师范大学计算机学院校友,院部动态丨计算机学院:酸甜苦辣咸——你最pick谁...
  14. 量子化学计算(Gausssian)图形工作站硬件方案
  15. 微信跳一跳脚本制作思路
  16. 3ds运行linux,全能游戏模拟器 RetroArch 1.7.0发布,附Ubuntu中PPA安装
  17. VC自动生成软件版本号
  18. 业内首发车道级导航背后——详解高精定位技术演进与场景应用
  19. lay-verify
  20. html5鼠标事件监听,canvas图形监听鼠标事件

热门文章

  1. 迪文串口屏的安装方法之卡扣结构带外壳智能屏
  2. 前锋java教学大纲,【人教版初中英语教学大纲模板资讯】人教版初中英语教学大纲模板足球知识与常识 - 足球百科 - 599比分...
  3. 【复制】互联网术语、简称、缩写
  4. 列表最后一页的最后一条数据删除之后,页码自动减一
  5. 计算机网络:TCP实现聊天功能
  6. Android教程 -06 Activity的生命周期
  7. 神经网络整合算法是什么,神经网络整合算法实例
  8. MyEclipse修改GIT工具Author内默认信息
  9. android user-agent iso-8859-1,微信大众,平台消息接口开辟(31)微信浏览器HTTP_USER_AGENT断定...
  10. 微信第 1 行代码曝光!