资讯

  • 重磅:Cloudera、Hortonworks 合并 !

两家大数据先驱Cloudera和Hortonworks今天宣布了它们所谓的相对平等的合并,声称将把两家公司合并成一家年收入达7.2亿美元的新实体。

  • 互联网之父开源「去中心化平台 Solid」,让用户掌控数据控制权

万维网之父 Tim Berners-Lee 爵士对今天的中心化 Web 非常不满,他想要拯救互联网,方法是重新去中心化。他正式宣布了新的开源去中心化平台 Solid ,源代码发布在 GitHub 上:https://github.com/solid。

  • Hadoop 衰败的 4 个原因

Cloudera和Hortonworks合并的这项交易意味着Hadoop市场再也维持不了两大竞争对手。多年来,Hadoop一直就是大数据的代名词,但市场和客户需求已然发生了变化,本文分析了几个大趋势如何共同推动了这个变化。

  • Elastic 的成功上市:偶然和必然

假期期间有个公司上市了,首日大涨,市值接近50亿美元,又掀起了一波造富运动,这个公司就是Elastic。作为后端的程序员,如果没有听说过Elastic及其产品Elasticsearch,实在是太out了,快来了解一下吧。

技术

  • 流计算框架Flink与Spark Streaming性能对比

Fink和Spark Streaming是目前比较主流的实时计算引擎,为了深入了解它们之间的差异,各自存在的优势和劣势,评估实时处理性能,找到其性能瓶颈并对其进行优化,我们对这两个引擎做了一系列的测试,希望为后续实时计算框架选择、性能调优提供数据参考。

  • 大数据凉了?No,流式计算浪潮才刚刚开始!

本文翻译自《Streaming System》最后一章《The Evolution of Large-Scale Data Processing》,简要回顾了大数据系统发展的历史轨迹,重点讨论了流处理系统。行文轻松活泼,内容通俗易懂,不妨一读。

  • Uber开源Marmaray:基于Hadoop的通用数据摄取和分散框架

对于搭建大数据平台和数据湖,通常而言是作为ETL的基础,广泛地采集各种数据源存储到Hadoop,来进行数据挖掘和分析。Uber新开源的Marmaray项目除了数据采集外,还包括数据分发,将Hadoop数据湖中的数据同步到各个在线存储系统,满足在线处理对性能和质量的更高要求。

  • 支持流式处理ACID事务!Flink团队开源新作Streaming Ledger

近日,由 Apache Flink 创始人创立的 data Artisans 宣布开源 Streaming Ledger——一项激动人心的新技术,为基于流式架构的应用程序带来了串行化 ACID 事务支持。在这篇文章中,我们将解释为什么串行化 ACID 事务对于现代企业来说是一个巨大的挑战、data Artisans 如何找到解决方案以及如何将这项技术用于流式应用程序。

  • 开源Kubeflow:在Kubernetes上运行机器学习

近年来Tensorflow和Kubernetes在AI和云计算领域都是异彩纷呈,火热得可以,放在一起又怎么样呢?本文是一篇关于Kuberflow:Kubernetes+Tensorflow入门级的介绍,了解一下?

开源大数据周刊-第102期相关推荐

  1. 开源大数据周刊-第49期

    摘要: 开源大数据周刊-第49期 资讯 实时流数据分析--2017 年的 27 个预测 概述:根据Markets & Markets的预测,流数据分析市场将从 2016 年的 30 8 亿美元 ...

  2. 开源大数据周刊-第76期

    摘要: 本期周刊包括开源大数据核心组件Hadoop和Impala的最新消息,以及HBase.Kafka.TensorFlow等主流开源组件的实践分享和技术实现,还有来自京东推荐部门的推荐系统演进史,纯 ...

  3. 开源大数据周刊-第30期

    阿里云E-MapReduce实践 泰为在E-MapReduce上的考量与实践 阿里云EMR是基于 Hadoop 的生态环境来搭建,同时可以跟阿里云的对象存储服务OSS等云服务进行无缝数据交换,方便用户 ...

  4. 开源大数据周刊-第34期

    阿里云E-MapReduce实践 使用E-MapReduce服务处理阿里云文件存储(NAS)的数据 文件存储是阿里云今年新推出的存储服务,因为它提供标准的文件访问协议,用户无需对现有应用做任何修改,即 ...

  5. 开源大数据周刊-第50期

    摘要: 本周刊的内容包括人工智能在软件和硬件上的最新进展,以及Kylin.Kudu等开源软件的实践和实现原理分析 资讯 谷歌TPU之后还有高通,人工智能芯片竞赛已经展开 谷歌有了自己的人工智能芯片TP ...

  6. 开源大数据周刊-第11期

    摘要: 开源有四个阶段:拥抱开源.回馈开源.融合开源.回报开源 阿里云E-Mapreduce动态 E-Mapreduce团队 1.3.3版本 (已经发布) 商业化发布,用户无需申请即可使用E-MapR ...

  7. 开源大数据周刊-第15期

    摘要: 最近大数据的一些论断,如:中国大数据发展10大趋势5大挑战,数据在工业的崛起将重塑整个商业社会,涂子沛:都说收集数据很难,也许是思维错了. 阿里云E-Mapreduce动态 E-Mapredu ...

  8. 开源大数据周刊-第72期

    摘要: 资讯: <新一代人工智能发展规划>启动实施 公布首批开放创新平台 科技部于11月15日在北京召开了<新一代人工智能发展规划>暨重大科技项目启动会.本次会议紧紧围绕新一代 ...

  9. 开源大数据周刊-第32期

    摘要: 阿里云E-MapReduce环境介绍;阿里巴巴向.Apache软件基金会捐赠消息中间件RocketMQ; Spark, HBase, Hadoop技术分享. 阿里云E-MapReduce实践 ...

最新文章

  1. Java 理解泛型的基本含义
  2. 结构体struct 联合体 union
  3. ORACLE学习笔记--性能优化2
  4. 以后教育孩子学好数学的方法 多思动漫数学
  5. oracle exp执行失败,Oracle EXP-EXP-00091的错误原因及处理方法
  6. oracle 存储过程 stored procedure 查询一条记录或多条记录
  7. TypeScript+vue使用与迁移经验总结
  8. ubuntu高版本环境变量问题
  9. (36)FPGA原语设计(BUFIO)
  10. python中类的构成_Python中类型关系和继承关系实例详解
  11. 光照强度曲线图android,有关光合作用的曲线图的分析(一) - xyz的日志 - 网易博客...
  12. mysql 表字段信息从一张表迁移到另一张表_Mysql之分库分表
  13. linux wifi驱动rtl8188移植
  14. javaCRC8计算的坑
  15. 二本计算机软件工程专业大学排名,哪些二本大学的软件工程专业最好
  16. 常用八大数据结构总结及应用场景-附示例截图
  17. oracle数据库rac切换,RAC切换归档模式
  18. 博物馆 库房rfid_博物馆RFID综合管理解决方案
  19. 我的架构师之路——书单
  20. 集成模型Bagging和Boosting的区别

热门文章

  1. android sudio jni 调用so_UE4:UPL 与 JNI 调用的最佳实践
  2. typescript数组,对象,接口实例
  3. AI最后--热门游戏引擎(CN地区)
  4. 分布式全局ID生成器设计
  5. 为什么说产品经理都该懂一点机器学习?
  6. ActiveMQ的安装搭建
  7. jQuery(三) javascript跨域问题(JSONP解决)
  8. Oracle Study--Oracle RAC CacheFusion(MindMap)
  9. SQL中跨服务器查询
  10. SaltStack配置文件