开源大数据周刊-第102期
资讯
- 重磅:Cloudera、Hortonworks 合并 !
两家大数据先驱Cloudera和Hortonworks今天宣布了它们所谓的相对平等的合并,声称将把两家公司合并成一家年收入达7.2亿美元的新实体。
- 互联网之父开源「去中心化平台 Solid」,让用户掌控数据控制权
万维网之父 Tim Berners-Lee 爵士对今天的中心化 Web 非常不满,他想要拯救互联网,方法是重新去中心化。他正式宣布了新的开源去中心化平台 Solid ,源代码发布在 GitHub 上:https://github.com/solid。
- Hadoop 衰败的 4 个原因
Cloudera和Hortonworks合并的这项交易意味着Hadoop市场再也维持不了两大竞争对手。多年来,Hadoop一直就是大数据的代名词,但市场和客户需求已然发生了变化,本文分析了几个大趋势如何共同推动了这个变化。
- Elastic 的成功上市:偶然和必然
假期期间有个公司上市了,首日大涨,市值接近50亿美元,又掀起了一波造富运动,这个公司就是Elastic。作为后端的程序员,如果没有听说过Elastic及其产品Elasticsearch,实在是太out了,快来了解一下吧。
技术
- 流计算框架Flink与Spark Streaming性能对比
Fink和Spark Streaming是目前比较主流的实时计算引擎,为了深入了解它们之间的差异,各自存在的优势和劣势,评估实时处理性能,找到其性能瓶颈并对其进行优化,我们对这两个引擎做了一系列的测试,希望为后续实时计算框架选择、性能调优提供数据参考。
- 大数据凉了?No,流式计算浪潮才刚刚开始!
本文翻译自《Streaming System》最后一章《The Evolution of Large-Scale Data Processing》,简要回顾了大数据系统发展的历史轨迹,重点讨论了流处理系统。行文轻松活泼,内容通俗易懂,不妨一读。
- Uber开源Marmaray:基于Hadoop的通用数据摄取和分散框架
对于搭建大数据平台和数据湖,通常而言是作为ETL的基础,广泛地采集各种数据源存储到Hadoop,来进行数据挖掘和分析。Uber新开源的Marmaray项目除了数据采集外,还包括数据分发,将Hadoop数据湖中的数据同步到各个在线存储系统,满足在线处理对性能和质量的更高要求。
- 支持流式处理ACID事务!Flink团队开源新作Streaming Ledger
近日,由 Apache Flink 创始人创立的 data Artisans 宣布开源 Streaming Ledger——一项激动人心的新技术,为基于流式架构的应用程序带来了串行化 ACID 事务支持。在这篇文章中,我们将解释为什么串行化 ACID 事务对于现代企业来说是一个巨大的挑战、data Artisans 如何找到解决方案以及如何将这项技术用于流式应用程序。
- 开源Kubeflow:在Kubernetes上运行机器学习
近年来Tensorflow和Kubernetes在AI和云计算领域都是异彩纷呈,火热得可以,放在一起又怎么样呢?本文是一篇关于Kuberflow:Kubernetes+Tensorflow入门级的介绍,了解一下?
开源大数据周刊-第102期相关推荐
- 开源大数据周刊-第49期
摘要: 开源大数据周刊-第49期 资讯 实时流数据分析--2017 年的 27 个预测 概述:根据Markets & Markets的预测,流数据分析市场将从 2016 年的 30 8 亿美元 ...
- 开源大数据周刊-第76期
摘要: 本期周刊包括开源大数据核心组件Hadoop和Impala的最新消息,以及HBase.Kafka.TensorFlow等主流开源组件的实践分享和技术实现,还有来自京东推荐部门的推荐系统演进史,纯 ...
- 开源大数据周刊-第30期
阿里云E-MapReduce实践 泰为在E-MapReduce上的考量与实践 阿里云EMR是基于 Hadoop 的生态环境来搭建,同时可以跟阿里云的对象存储服务OSS等云服务进行无缝数据交换,方便用户 ...
- 开源大数据周刊-第34期
阿里云E-MapReduce实践 使用E-MapReduce服务处理阿里云文件存储(NAS)的数据 文件存储是阿里云今年新推出的存储服务,因为它提供标准的文件访问协议,用户无需对现有应用做任何修改,即 ...
- 开源大数据周刊-第50期
摘要: 本周刊的内容包括人工智能在软件和硬件上的最新进展,以及Kylin.Kudu等开源软件的实践和实现原理分析 资讯 谷歌TPU之后还有高通,人工智能芯片竞赛已经展开 谷歌有了自己的人工智能芯片TP ...
- 开源大数据周刊-第11期
摘要: 开源有四个阶段:拥抱开源.回馈开源.融合开源.回报开源 阿里云E-Mapreduce动态 E-Mapreduce团队 1.3.3版本 (已经发布) 商业化发布,用户无需申请即可使用E-MapR ...
- 开源大数据周刊-第15期
摘要: 最近大数据的一些论断,如:中国大数据发展10大趋势5大挑战,数据在工业的崛起将重塑整个商业社会,涂子沛:都说收集数据很难,也许是思维错了. 阿里云E-Mapreduce动态 E-Mapredu ...
- 开源大数据周刊-第72期
摘要: 资讯: <新一代人工智能发展规划>启动实施 公布首批开放创新平台 科技部于11月15日在北京召开了<新一代人工智能发展规划>暨重大科技项目启动会.本次会议紧紧围绕新一代 ...
- 开源大数据周刊-第32期
摘要: 阿里云E-MapReduce环境介绍;阿里巴巴向.Apache软件基金会捐赠消息中间件RocketMQ; Spark, HBase, Hadoop技术分享. 阿里云E-MapReduce实践 ...
最新文章
- Java 理解泛型的基本含义
- 结构体struct 联合体 union
- ORACLE学习笔记--性能优化2
- 以后教育孩子学好数学的方法 多思动漫数学
- oracle exp执行失败,Oracle EXP-EXP-00091的错误原因及处理方法
- oracle 存储过程 stored procedure 查询一条记录或多条记录
- TypeScript+vue使用与迁移经验总结
- ubuntu高版本环境变量问题
- (36)FPGA原语设计(BUFIO)
- python中类的构成_Python中类型关系和继承关系实例详解
- 光照强度曲线图android,有关光合作用的曲线图的分析(一) - xyz的日志 - 网易博客...
- mysql 表字段信息从一张表迁移到另一张表_Mysql之分库分表
- linux wifi驱动rtl8188移植
- javaCRC8计算的坑
- 二本计算机软件工程专业大学排名,哪些二本大学的软件工程专业最好
- 常用八大数据结构总结及应用场景-附示例截图
- oracle数据库rac切换,RAC切换归档模式
- 博物馆 库房rfid_博物馆RFID综合管理解决方案
- 我的架构师之路——书单
- 集成模型Bagging和Boosting的区别