写在第37期周报
“大数据” 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算、存储、网络都涉及,知识点广、学习难度高。

本期会给大家奉献上精彩的:Spark Streaming、Spark Sort Based Shuffle、Apache Spark、Apache Kylin、深度学习、K-Means、HBase、Redis。全是干货,希望大家喜欢!!!

#大数据和云计算技术社区#希望通过坚持定期分享能帮助同学在大数据学习道路上尽一份微博之力。相信长期坚持认真阅读周报的同学,在技术的道路上一定会日益精进!感谢编辑们的长期坚持!也请同学们继续打赏,支持社区,支持编辑们持续奉献高质量知识!

#大数据和云计算技术社区#长期招募有兴趣参与社区编辑和运营的同学,欢迎扫描文末二维码联系(参与社区工作,收获知识和进步,还有红包哦)。

特别提醒,文末有惊喜!

以下是正文,限于众编辑水平有限,不保证大家都喜欢。


Spark Streaming

自2015年携程实时计算平台搭建以来,经过两年多不断的技术演进,目前实时集群规模已达上百台,平台涵盖各个SBU与公共部门数百个实时应用,全年JStorm集群稳定性达到100%。目前实时平台主要基于JStorm与Spark Streaming构建而成,相信关注携程实时平台的朋友在去年已经看到一篇关于携程实时平台的分享:携程实时大数据平台实践分享。

https://sdk.cn/news/7562


Spark Sort Based Shuffle

本来想把这块外排序的算法完全整理清楚,自己写一下,但是最近确实事儿多,这个文章我大概读完了。虽然文章本身比较早,但是大面上基本把这个事儿能说清楚。最近我把乌斯shuffle 看完,争取自己重新总结一下。

https://blog.csdn.net/mt0803/article/details/50405266

3
Apache Spark

本文将对 Spark 的内存管理模型进行分析  主要模块有 堆内内存  堆外内存  以及task内存  希望大家能够喜欢

https://mp.weixin.qq.com/s/a4jdjJbFFrak8k0jHUBsOA

4
Apache Kylin

从 2015 年大数据部门成立至今,集群数据存储量为 9PB,服务器规模为 200+ 台。与此同时,数据需求也随着业务的发展落地不断增长,如统计分析、指标 API、运营报表等,不同业务需求差异较大,维度越来越多,需要定制化开发。面对数十亿行级别的数据,低延迟响应的特性,保障服务稳定、数据准确,

http://mp.weixin.qq.com/s/LhtmXXTnYDDCrxdQWCvvUw

5
深度学习

深度学习模型凭借其强大的表达能力和灵活的网络结构在诸多领域取得了重大突破,美团平台拥有海量的用户与商家数据,以及丰富的产品使用场景,也为深度学习的应用提供了必要的条件。本文将主要介绍深度学习模型在美团平台推荐排序场景下的应用和探索。

http://mp.weixin.qq.com/s/jdRu-cishwV8qBmGLTFJCA

6
K-Means

K-means算法具有悠久的历史,并且也是最常用的聚类算法之一。K-means算法实施起来非常简单,因此,它非常适用于机器学习新手爱好者。首先我们来回顾K-Means算法的起源,然后介绍其较为典型的应用场景。

http://mp.weixin.qq.com/s/7hVypJbpqV7t9-Tig5mK_w

7
HBase

本文基于所给出的样例数据,介绍了将数据从Client写到RegionServer的全流程。

http://mp.weixin.qq.com/s/AORh1vI3L5e7B3MAI8zizg

8
Redis

搭建任何一个服务,做到“能用”其实是非常简单的,就像我们运行一个单机版的Redis。不过一旦要做到“高可用”,事情就会变得复杂起来。业务中使用了额外的两台服务器,3个Sentinel进程+1个Slave进程,只是为了保证在那小概率的事故中依然做到服务可用。在实际业务中我们还启用了supervisor做进程监控,一旦进程意外退出,会自动尝试重新启动。

https://mp.weixin.qq.com/s/nFreAZJOECjXwFw0HhsAUA

009
开心一刻

 老师要同学们晚上在家里看三集的少年电视剧后,写观后感。

小明没有看电视剧,第二天,他写了一篇两字的作文:“停电!” 

  老师见了,说他撒谎,不可能停电,叫他晚上看第二集后再写一篇。小明还是没看,写了一篇五字的作文:“电视机坏了。”

致谢:

魏宏斌、薛述强、刘彬、刘超、廖程鹏、董言、吕西金、朱洁、蓝随、黄文辉



猜你喜欢

#大数据和云计算机技术社区#博客精选(2017)

NoSQL 还是 SQL ?这一篇讲清楚

阿里的OceanBase解密

#大数据和云计算技术#: "四有"社区介绍

大数据和云计算技术周报(第36期):NoSQL特辑

大数据和云计算技术周报(第35期)

新数仓系列:Hbase周边生态梳理(1)

《大数据架构详解》第2次修订说明

简单梳理跨数据中心数据库

云观察系列:漫谈运营商公有云发展史

云观察系列:百度云的一波三折

云观察系列:阿里云战略观察

超融合方案分析系列(7)思科超融合方案分析

加入技术讨论群

《大数据和云计算技术》社区群人数已经3000+,欢迎大家加下面助手微信,拉大家进群,自由交流。

喜欢钉钉扫码下面的群:

喜欢QQ群的,可以扫描下面二维码:

欢迎大家通过二维码打赏支持技术社区(英雄请留名,社区感谢您,打赏次数超过108+):

​大数据和云计算技术周报(第37期)相关推荐

  1. 大数据和云计算技术周报(第101期)

    导语 "大数据" 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算.存储.网络都涉及,知识点广.学习难度高. 本期会给大家奉献上精彩的:Spring熔断降级方 ...

  2. 大数据与云计算技术周报(第150期)

    导语 "大数据" 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算.存储.网络都涉及,知识点广.学习难度高. 本期会给大家奉献上精彩的:hiva.Flink. ...

  3. 大数据与云计算技术周报(第148期)

    导语 "大数据" 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算.存储.网络都涉及,知识点广.学习难度高. 本期会给大家奉献上精彩的:实时数据.ELK.re ...

  4. 大数据和云计算技术周报(第102期)

    导语 "大数据" 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算.存储.网络都涉及,知识点广.学习难度高. 本期会给大家奉献上精彩的:阿里数据库.AI.Hb ...

  5. 大数据和云计算技术周报(第7期)

    写在第7期周报 坚持是一种品格! "大数据" 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算.存储.网络都涉及,知识点广.学习难度高. #大数据和云计算技术 ...

  6. 大数据和云计算技术周报(第81期)

    大数据" 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算.存储.网络都涉及,知识点广.学习难度高. 本期会给大家奉献上精彩的:分布式事务.缓存 .排序.druid.s ...

  7. 大数据和云计算技术周报(第115期)

    导语 "大数据" 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算.存储.网络都涉及,知识点广.学习难度高. 本期会给大家奉献上精彩的:HBase.Spark ...

  8. 大数据和云计算技术周报(第182期)

    导语 "大数据" 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算.存储.网络都涉及,知识点广.学习难度高. 本期会给大家奉献上精彩的:spark.Kafka ...

  9. 大数据与云计算技术周报(第142期)

    导语 "大数据" 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算.存储.网络都涉及,知识点广.学习难度高. 本期会给大家奉献上精彩的:死锁.知识图谱.Spa ...

最新文章

  1. MySQL主从复制异步原理以及搭建
  2. crc16算法php实现,关于实现CRC16校验算法的两个函数
  3. 下列选项中 采用边界值平滑_使用Illustrator中的混合工具创建很有个性的蛋宝宝...
  4. Kafka参数broker.id详解
  5. Linux中cp和scp命令的使用方法和区别
  6. 中国移动咪咕公司:打造五新体验 做5G时代内容的聚合者与生产者
  7. java 基础之图片的多线程处理和大文件的多线程拷贝
  8. 百度AI输入法发布全感官输入2.0版本,语音技术取得世界级突破
  9. 系统设计之路:如何设计一个URL短链服务
  10. OneDrive免费5T云盘空间
  11. 现代薄膜温室大棚五大优点,常用的经济作物都有哪些?
  12. 360极速浏览器取消默认迅雷下载的正确方法
  13. 从美国创业者的成功看行业趋势
  14. 关于使用佳信客服产品时产生的14问
  15. @程序员,你需要点金融常识
  16. 谈谈单元测试:为什么要进行单元测试?
  17. MVCC和快照读丶当前读
  18. PHP笔记 17 18 19 20 21
  19. Python数据分析实战之营销组合模型
  20. [BJDCTF2020]EzPHP

热门文章

  1. mysql命令行界面出现问题,MySQL命令行界面中出现字符错误提示的原因及解决方法...
  2. 嵌入式学习笔记(1)
  3. Cassandra实例
  4. Day212.OAuth2、微信二维码登入注册功能、用户登录信息前后端供、讲师列表前后端 -谷粒学院
  5. No module named ‘pip._internal.vcs.git
  6. 测绘专业计算机编程要求,我是学工程测量,学哪一种计算机编程好
  7. ParsingError问题的解决
  8. 四色定理涂色的解 --------------------- 对网上答案的纠正
  9. ap计算机知识点总结,AP微积分重要知识点总结(全)
  10. xampp下载太慢了,这里有下载好的(mac)