打开一篇篇 IT 技术文章,你总能够看到“大规模”、“海量请求”这些字眼。如今,这些功能强大的互联网应用,都运行在大规模数据中心上,然而,对于大规模数据中心,你又了解多少呢?实际上,除了阅读一些科技文章之外,你很难得到更多关于数据中心的信息。数据中心每个机器的运行情况如何?这些机器上运行着什么样的应用?这些应用有有什么特点?对于这些问题,除了少数资深从业者之外,普通学生和企业的研究者很难了解其中细节。

1 什么是Alibaba Cluster Data?

2015 年,我们尝试在阿里巴巴的数据中心,将延迟不敏感的批量离线计算任务和延迟敏感的在线服务部署到同一批机器上运行,让在线服务用不完的资源充分被离线使用以提高机器的整体利用率。经过 3 年多的试验论证、架构调整和资源隔离优化,目前这个方案已经走向大规模生产。我们通过混部技术将集群平均资源利用率从 10% 大幅度提高到 45%。另外,通过各种优化手段,可以让更多任务运行在数据中心,将“双11”平均每万笔交易成本下降了 17%,等等。

那么,实施了一系列优化手段之后的计算机集群究竟是什么样子?混部的情况究竟如何?除了文字性的介绍,直接发布数据能够更加拉近我们与学术研究、业界同行之间的距离。为了让有兴趣的学生以及相关研究人员,可以从数据上更加深入地理解大规模数据中心,我们特别发布了这份数据集。数据集中记录了某个生产集群中服务器以及运行任务的详细情况。在数据集中,你可以详细了解到我们是如何通过混部把资源利用率提高到 45%;我们每天到底运行了多少任务;以及业务的资源需求有什么特点,等等。如何使用这份数据集,完全取决于你的需要。

2 你用这个数据可以做什么?

刚刚发布的 Alibaba Cluster Data V2018 包含 6 个文件,压缩后大小近 50GB(压缩前 270+GB),里面包含了 4000 台服务器、相应的在线应用容器和离线计算任务长达 8 天的运行情况,具体信息你可以在 GitHub 中找到。

通过这份数据,你可以:

  1. 了解当代先进数据中心的服务器以及任务运行特点;
  2. 试验你的调度、运筹等各种任务管理和集群优化方面的各种算法并撰写论文;
  3. 利用这份数据学习如何进行数据分析,揭示更多我们自己都未曾发现的规律。

只看上面这几点,没有接触过类似数据的朋友,可能对于这份数据的用处还是没有概念,下面我举几个简单的例子:

  • 电商业务在白天和晚上面临的压力不同,我们如何在业务存在波峰波谷的情况下提高整体资源利用率?
  • 你知道我们最长的 DAG 有多少依赖吗?
  • 一个典型的容器存在时间是多久?
  • 一个计算型任务的典型存在时间是多少?一个 Task 的多个 Instance 理论上彼此很相似,但是它们运行的时间都一样吗?

实际上,学者们甚至可以用这些数据作出更加精彩地分析。

2017年,我们曾开放的第一波数据(Alibaba Cluster Data V2017),已经产生了多篇优秀的学术成果。以下是学者们在论文中引用数据(Alibaba Cluster Data V2017)的例子,其中不乏被 OSDI 这样顶级学术会议收录的优秀文章。我们期待,未来你也能与我们共同分享你用这份数据产生的成果!

"LegoOS: A Disseminated, Distributed OS for Hardware Resource Disaggregation, Yizhou Shan, Yutong Huang, Yilun Chen, and Yiying Zhang, Purdue University. OSDI'18" (Best paper award!)

"Imbalance in the Cloud: an Analysis on Alibaba Cluster Trace, Chengzhi Lu et al. BIGDATA 2017"

"CharacterizingCo-located Datacenter Workloads: An Alibaba Case Study, Yue Cheng, Zheng Chai,Ali Anwar. APSys2018"

"The Elasticity and Plasticity in Semi-Containerized Co-locating Cloud Workload: aView from Alibaba Trace, Qixiao Liu and Zhibin Yu. SoCC2018"

3 Cluster Data V2018的不同

新版本 V2018 与 V2017 存在两个最大的区别:

DAG 信息加入

我们加入了离线任务的 DAG 任务信息,据了解,这是目前来自实际生产环境最大的 DAG 数据。

什么是 DAG?
离线计算任务,例如 Map Reduce、Hadoop、Spark、Flink 中常用的任务,都是以有向无环图(Directed Acyclic Graph,DAG)的形式进行编排的,其中涉及到任务之间的并行、依赖等方面。下面是一个 DAG 的例子。

规模更大

上一版数据包含了约 1300 台机器在约 24 小时的内容数据,而新版 Cluster Data V2018 中包括了 4000 台机器 8 天的数据。

Alibaba Cluster Data 开放下载:270GB 数据揭秘你不知道的阿里巴巴数据中心相关推荐

  1. 资源 | Alibaba Cluster Data 开放下载:270 GB 数据揭秘你不知道的阿里巴巴数据中心...

    戳蓝字"CSDN云计算"关注我们哦! CSDN云计算授权转载自阿里系统软件技术 作者:临石 打开一篇篇 IT 技术文章,你总能够看到"大规模"."海量 ...

  2. Alibaba Cluster Data 开源:270GB 数据揭秘你不知道的阿里巴巴数据中心

    打开一篇篇 IT 技术文章,你总能够看到"大规模"."海量请求"这些字眼.如今,这些功能强大的互联网应用,都运行在大规模数据中心上,然而,对于大规模数据中心,你 ...

  3. 2021阿里云金融数据智能峰会——阿里巴巴数据中台建设经验之谈

    简介:阿里巴巴数据中台的解决方案是在引入数据安全等级打标的基础上,实现数据智能审批,通过可信模型构建和风险量化,让智能流程代替繁琐人工.以Dataphin为例,作为阿里巴巴集团数据治理方法论基于内部实 ...

  4. 中国大数据明星企业——阿里巴巴的“数据攻防战”

    From: http://www.36dsj.com/archives/4130 平台型企业的大数据应用策略有何特点?阿里巴巴.百度.腾讯等一批平台型企业,汇集了海量用户和商家,聚集成富有张力的生态系 ...

  5. 阿里巴巴集群跟踪数据 Cluster Data V2017翻译文档

    原文链接:https://github.com/alibaba/clusterdata/blob/v2018/cluster-trace-v2017/trace_201708.md 以下阿里巴巴201 ...

  6. 年度钜献,108个大数据文档PDF开放下载

    1.大数据的开放式创新--吴甘沙 相关阅读:[PPT]吴甘沙:让不同领域的数据真正流动.融合起来,才能释放大数据的价值 下载:大数据的开放式创新--吴甘沙.pdf 2.微软严治庆--让大数据为每个人服 ...

  7. 大数据文档PDF开放下载

    收藏的关于大数据.互联网金融.征信.数据分析的文档分享出来,让大家都可以下载.我的文档主要源于自己的收藏,还有各种大会组委会的分享,当然,我自己也开通了多个文库的 VIP 下载的.36 大数据本身是一 ...

  8. 【免费下载】“后红海”时代,独家揭秘当下大数据体系

    简介:任何一种技术都会经历从阳春白雪到下里巴人的过程,就像我们对计算机的理解从 "戴着鞋套才能进的机房"变成了随处可见的智能手机.在前面 20 年中,大数据技术也经 历了这样的过程 ...

  9. KubeCon 2020 演讲集锦|《阿里巴巴云原生技术与实践 13 讲》开放下载

    2020 年 7 月 30 日至 8 月 1 日,由 Cloud Native Computing Foundation (CNCF) 主办的云原生技术大会 Cloud Native + Open S ...

最新文章

  1. MySQL的登陆错误:ERROR 1049 (42000): Unknown database 'root'
  2. 基于 Spring Boot 和 Spring Cloud 实现微服务架构
  3. TEEC_AllocateSharedMemory()和 TEEC_RegisterSharedMemory()的总结
  4. 一日千里 云计算普及势不可挡
  5. 架构实例之Demo_JSP
  6. 图解JavaScript算法排序
  7. GNS结合SecureCRT连接问题
  8. 在php里让字体划过变色,鼠标划过字体时如何用css来实现字体变色?(代码实测)...
  9. 【转】4.2SharePoint服务器端对象模型 之 使用CAML进行数据查询(Part 2)
  10. 内存管理, 对象的生命周期
  11. Altium AD20更改原理图的连接节点颜色和连线颜色(结点颜色)
  12. 京东回应收集隐私;“阿里离职女高管”遭怒怼;1.8 万安卓应用违反谷歌政策 | 极客头条...
  13. FIREDAC(DELPHI10 or 10.1)提交数据给ORACLE数据库的一个不是BUG的BUG
  14. MacOS上如何将MOV文件转换为MP4
  15. Xcode6解决storyboard没有箭头的问题
  16. python做饼图出现重影_解决echarts中饼图标签重叠的问题
  17. ALT+数字键显示的标点符号大全
  18. [ 物联网篇 ] 27 -使用libcur API 实现本地时间同步的功能,类似NTP功能
  19. java xml 方法_Java读取xml的四种方式
  20. ACM训练了日记—12月10日

热门文章

  1. SFB 项目经验-13-为某上市企业仅安装Skype for Business 2016(图解)
  2. mac 下如何使用lrzsz 上传下载文件
  3. 关于mongodb ,redis,memcache之间见不乱理还乱的关系和作用
  4. 有关Oracle角色管理
  5. 在VMware ESX Server使用华为存储
  6. 常见linux网络端口对照表(excel),常见子网掩码对照表Excel下载(反、正掩码)-数通工程师的傍身笔记...
  7. pandas dataframe 表头_python_库_pandas
  8. 19个语法助你打牢Python基础
  9. Python+selenium+firefox模拟登录微博并爬取数据(1
  10. c# 获取ajax数据,c# asp.net jQuery AJAX 从 MySQL 中获取数据