简介: 这一次,开发者社区为正在“宅家办公”的小伙伴们献上福利~这次的合集整理了一些比较受开发者欢迎的关于大数据技术领域的优质文章。

不管是初涉该领域,还是已经有一定了解,相信都能从文章中获益。大家快来学习吧~

1. 数据工程师必须掌握的7个大数据实战项目

查看原文

  • 值得收藏,数据工程师必须掌握的7个大数据实战项目

2. 阿里云大数据+AI技术沙龙上海站回顾 | ​揭秘TPC-DS 榜单第一名背后的强大引擎

查看原文

  • 11月16日的大数据+AI沙龙上海站取得圆满成功! EMR 团队在国内运营最大的 Spark 社区,为了更好地传播和分享业界最新技术和最佳实践,现在联合开源社区同行,打造一个纯粹的技术交流线下沙龙《大数据 + AI》,定期为大家做公益分享。本次分享,揭秘TPC-DS 榜单第一名背后的强大引擎,探索Pyboot如何打通大数据生态,一同学习业内最新的存储方案和机器学习平台。

3. 数字化与数据中台的价值思考——徐季秋

查看原文

  • 数据中台是指通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一标准和口径。数据中台把数据统一之后,会形成标准数据,再进行存储,形成大数据资产层,进而为客户提供高效服务。 狭义的数据中台单指数据技术,比如对海量数据进行采集、计算、存储、加工的一系列技术集合,时下我们谈到的数据中台还包括数据模型,算法服务,数据产品,数据管理以及方法论。 本篇主要从传统企业数字化转型的角度,浅析了数字中台的价值。

4. 【精品问答】大数据计算技术1000问

查看原文

  • 开发者社区策划了大数据计算技术1000问内容,包含Flink、Spark等流式计算(实时计算)、离线计算、Hbase等实践中遇到的技术问题和面试问题等维度内容。

5. 如何分析及处理 Flink 反压?

查看原文

  • 反压(backpressure)是实时计算应用开发中,特别是流式计算中,十分常见的问题。反压意味着数据管道中某个节点成为瓶颈,处理速率跟不上上游发送数据的速率,而需要对上游进行限速。

6. 开放下载!《阿里巴巴大数据及AI实战》深度解析典型场景大数据实践

查看原文

  • 深度剖析淘宝、高德、友盟+、1688、优酷、阿里妈妈、阿里影业大数据实战场景,2020不容错过的企业大数据实战手册。

7. 独家下载 |《大数据工程师必读手册》揭秘阿里如何玩转大数据

查看原文

  • 阿里巴巴如何玩转大数据?十位阿里巴巴大数据专家深度分析 ,飞天大数据平台八款产品最新玩法,2019不容错过的大数据手册——《大数据工程师必读手册》现在可以免费下载阅读啦,赶紧先睹为快吧。

8. 独家下载 |《大数据工程师必读手册》揭秘阿里如何玩转大数据

查看原文

  • 阿里巴巴如何玩转大数据?十位阿里巴巴大数据专家深度分析 ,飞天大数据平台八款产品最新玩法,2019不容错

9. 带你读《Apache Kylin权威指南》之一:Apache Kylin概述

查看原文

  • 从最早使用大数据技术来做批量处理,到现在越来越多的人要求大数据平台也能够如传统数据仓库技术一样支持交互式分析,随着数据量的不断膨胀、数据平民化的不断推进,低延迟、高并发地在Hadoop之上提供标准SQL查询能力成为必须攻破的技术难题。而Apache Kylin的诞生正是基于这个背景,并成功地完成了很多人认为不可能实现的突破。

10. 带你读《Apache Kylin权威指南》之二:快速入门

查看原文

  • 本章介绍了使用Apache Kylin前必须了解的基本概念,如星形数据模型、事实表、维表、维度、度量等,并在了解这些基本概念的基础上快速创建了基于Sample Data的模型,构建Cube,最后执行SQL查询。带领读者体验了Apache Kylin的主要使用过程。

11. 带你读《Apache Kylin权威指南》之三:Cube优化

查看原文

  • 本章从多个角度介绍了Cube的优化方法:从Cuboid剪枝的角度、从并发粒度控制的角度、从Rowkey设计的角度,还有从度量精度选择的角度。总的来说,Cube优化需要Cube管理员对Kylin有较为深刻的理解和认识,这也无形中提高了使用和管理Kylin的门槛。

12. 贾扬清谈大数据&AI发展的新挑战和新机遇

查看原文

  • 2019云栖大会大数据&AI专场,阿里巴巴高级研究员贾扬清为我们带来《大数据AI发展的新机遇和新挑战》的分享。本文主要从人工智能的概念开始讲起,谈及了深度学习的发展和模型训练,以及数据的爆发增长,着重阐述了算法、数据和算力的闭环。

13. 大数据团队从0到1

查看原文

  • “大数据”这个词,大家都已经不陌生了,已经从一个新兴的词汇变成了一个百姓茶余饭后都会聊到的概念。各种大大小小的互联网公司也都会创建自己的大数据团队,我也曾经在多家公司从事过大数据领域的开发和团队管理工作,这里写一下我自己的经历和感受。

14. 详解阿里云数据中台,一篇文章全面了解大数据“网红”

查看原文

  • 一直想写一篇关于数据中台正面文章,现在有闲时做些总结,想充分诠释一下DT内部人如何看待数据中台。 数据中台的概念是最早由阿里巴巴首次提出,是为了应对内部众多业务部门千变万化的数据需求和高速时效性的要求而成长起来的,它既要满足业务部门日常性的多个业务前台的数据需求,又要满足像双十一,六一八这样的业务高峰、应对大规模数据的线性可扩展问题、应对复杂活动场景业务系统的解耦问题,而在技术、组织架构等方面采取的一些变革。

15. 大数据人才培养经验分享

查看原文

  • 总结了一下过去5年在各个高校进行大数据人才培养的经验。

15篇大数据精品文章大合集相关推荐

  1. 酷壳网大神重要文章转载合集

    酷壳往觉得重要的文章. TCP 的那些事儿(上) TCP 的那些事儿(下)

  2. 33篇大数据治理文章打包送,技术+案例一应俱全!大数据

    一.元数据 1.90后美女程序员:元数据什么鬼? 近几年,90后这个群体开始迈入职场,逐渐出现在社会大众的视野当中,他们是极具个性的一代,他们这代技术人的新奇想法,正是现代企业需要的创新源泉- 2.轻 ...

  3. 大数据系列文章,数据人收藏!

    该系列精选文章来自于「数据社」公众号,作者从事过大数据开发,大数据架构,数据分析相关岗位,有着丰富的实战经验. 该系列文章主要包括大数据平台.数据仓库.数据挖掘等. 系列文章都是基于实战总结的干货,下 ...

  4. 【工业大数据】工厂大数据之数据源分析;如何挖掘并驾驭大数据的价值,成为“大数据企业”?

    众所周知,工业大数据是工厂智能化水平提升的关键路径,而数据源的分析和管理是工厂大数据的基础,理清理顺数据源也是实施工厂大数据的第一步.本文就对工厂的数据源进行简要分析. 数据源的划分 以下从两个维度对 ...

  5. 大数据应用 | 大数据给社会学研究带来了什么挑战?

    本文转载自公众号量化研究方法 文献来源:[实证社会科学]第六卷 编者按:这篇文章是根据邱泽奇教授在北京大学社会学系的一个讲座整理而成.为了缩短篇幅,在整理中删除了重复的.缺乏信息的内容. 今天跟大家分 ...

  6. 大数据相加_c 大数据相加 class

    <C++语言基础>参考--学生可以相加吗? 返回:贺老师课程教学链接 谈及运算,我们总是习惯"数"的运算.而实际上,像时间之类的对象也是可以进行加减运算的.再进一步,我 ...

  7. 【工业大数据】工业大数据:构建制造型企业新型能力

    2015年5月8日,国务院公布<中国制造2025>,这是中国版的"工业4.0"规划.该规划提到"加快推动新一代信息技术与制造技术融合发展,把智能制造作为两化深 ...

  8. 什么是大数据?漫谈大数据仓库与挖掘系统

    什么是大数据?漫谈大数据仓库与挖掘系统 任何比较关注业界新闻的人,都会知道近两年数字信息领域的几个关键字: 移动端.LBS.SNS和大数据(Big Data).前边三个,大家应该是很熟悉的,因为身边早 ...

  9. 2017大数据产业链的大变化:数据应用仍在奋斗 淘金路上见曙光

    文 | 中关村老李 (本文为作者独家投稿36大数据) 2017年已过去大半,是时候该回顾一下大数据在半年中的发展了.只有清楚了现在的位置,清楚行业发展的环境,才好对未来的决策做出准确的判断.(本文是针 ...

最新文章

  1. linux查看根目录使用率,Linux 查看空间使用情况的实例详解
  2. 指针应用-----链表二
  3. iOS开发使用半透明模糊效果方法整理
  4. python做mysql数据迁移_Python中MySQL数据迁移到MongoDB脚本的方法
  5. 左神算法:判断 t1 树中是否有与 t2 树拓扑结构完全相同的子树(Java版)
  6. javafx游戏_JavaFX游戏(四连环)
  7. (四)nodejs循序渐进-函数,类和对象(基础篇)
  8. 问题 I: Sequence Problem : Array Practice
  9. [转]Yii Framework: 从 model 中生成 select option
  10. 如何打开屏幕坏的手机_手机屏幕坏了怎么打开usb调试
  11. 《密码编码学与网络安全》原理与实践笔记(一)
  12. IM通讯系统分析与实战
  13. 为什么现在java这么难找,现在java工作难找吗
  14. 中兴程序员跳楼事件始末解读
  15. Android Studio如何更新至最新版本4.2.2
  16. linux双显卡配置_linux双显卡解决方案
  17. Abaqus二次开发捕获几何元素方法归纳
  18. 树根互联冲刺科创板上市:累计亏损超11亿元,和三一重工关系密切
  19. Redis的各种用途以及使用场景
  20. (附源码)springboot厨到家服务平台 毕业设计 063133

热门文章

  1. FTX创办人SBF:区块链并不是炒作,有三大应用场景可大放异彩
  2. [获取手机信息]-通过 ADB 命令获取手机信息
  3. 为什么越来越多的网站域名不加www前缀?
  4. Android打包混淆压缩
  5. 拿捏了,阿里2022最新JDK源码深度解析小册,Github全站热榜第二
  6. (2011-12-11 旧博文搬运)away3d太阳系DEMO
  7. ArcGIS栅格计算器求2个栅格数据的交集(区域)
  8. .split()用法解释
  9. 《Guava Floats类》学习笔记
  10. 理解CSS Floats