摘要:

阿里云E-MapReduce实践 E-MapReduce的HBase集群间迁移 E-MapReduce提供HBase服务,本文介绍了几种HBase集群间迁移的方法。 E-MapReduce中Spark 2.x读写MaxCompute数据 最新的aliyun-emapreduce-sdk将MaxCompute数据以DataSource的方式接入Spark 2.x,用户可以使用类似Spark 2.x中读写json/parquet/csv的方式来访问MaxCompute。

阿里云E-MapReduce实践

  • E-MapReduce的HBase集群间迁移
    E-MapReduce提供HBase服务,本文介绍了几种HBase集群间迁移的方法。
  • E-MapReduce中Spark 2.x读写MaxCompute数据
    最新的aliyun-emapreduce-sdk将MaxCompute数据以DataSource的方式接入Spark 2.x,用户可以使用类似Spark 2.x中读写json/parquet/csv的方式来访问MaxCompute。

资讯

  • 数据API经济与大规模数据流通:从水的寓言说起
    近期数据API接口服务逐渐兴起,正因数据API服务允许需求方“挑数据”,并具备“开箱即用”以及降低交易成本与门槛等优点,将会成为数据能力开放与交易流通的重要手段。但数据API从当前的实践来看远非完美,运营不慎会导致类似金融领域洗钱行为的“洗数”活动出现,并在隐私保护、计费方面存在不足,因此本文提出了“增强型数据交换导向API”的概念,使得数据API经济能在深思熟虑的顶层设计下运行。本文将从一个寓言故事引出上述探讨。
  • 对农业大数据资源目录体系的一点思考
    笔者对农业大数据资源的目录体系做了一些思考和探索,从多个维度和领域对农业大数据进行了初步的规划分类,并对技术实现思路进行了初步的考虑。
  • 基于MIT研发出脑控机器人:可使用脑波为机器人纠错
    麻省理工学院的计算机科学和人工智能实验室(CSAIL)的团队和波士顿大学打造出了一种反馈系统,让人类仅用大脑就可以迅速纠正机器人犯下的错误,这款 MIT 研发出的反馈系统能够让人类操作者仅通过大脑信号就能实时纠正机器人做出的选择。
  • (技术)基于Hadoop的数据仓库Hive 基础知识
    Hive是基于Hadoop的数据仓库工具,可对存储在HDFS上的文件中的数据集进行数据整理、特殊查询和分析处理,提供了类似于SQL语言的查询语言–HiveQL,可通过HQL语句实现简单的MR统计,Hive将HQL语句转换成MR任务进行执行。
  • (技术)Flink-CEP论文与源码解读之状态与状态转换
    Flink的CEP设计与实现重度参考了论文《Efficient Pattern Matching over Event Streams》。该文章结合论文谈了Flink CEP的设计。
  • (技术)Spark性能优化之道——解决Spark数据倾斜(Data Skew)的N种姿势
    文结合实例详细阐明了Spark数据倾斜的几种场景以及对应的解决方案,包括避免数据源倾斜,调整并行度,使用自定义Partitioner,使用Map侧Join代替Reduce侧Join,给倾斜Key加上随机前缀等。
  • (技术)从0到1认识 Spark SQL Catalyst
    本文主要介绍SparkSQL的优化器系统Catalyst。

开源大数据周刊-第44期相关推荐

  1. 开源大数据周刊-第49期

    摘要: 开源大数据周刊-第49期 资讯 实时流数据分析--2017 年的 27 个预测 概述:根据Markets & Markets的预测,流数据分析市场将从 2016 年的 30 8 亿美元 ...

  2. 开源大数据周刊-第30期

    阿里云E-MapReduce实践 泰为在E-MapReduce上的考量与实践 阿里云EMR是基于 Hadoop 的生态环境来搭建,同时可以跟阿里云的对象存储服务OSS等云服务进行无缝数据交换,方便用户 ...

  3. 开源大数据周刊-第76期

    摘要: 本期周刊包括开源大数据核心组件Hadoop和Impala的最新消息,以及HBase.Kafka.TensorFlow等主流开源组件的实践分享和技术实现,还有来自京东推荐部门的推荐系统演进史,纯 ...

  4. 开源大数据周刊-第34期

    阿里云E-MapReduce实践 使用E-MapReduce服务处理阿里云文件存储(NAS)的数据 文件存储是阿里云今年新推出的存储服务,因为它提供标准的文件访问协议,用户无需对现有应用做任何修改,即 ...

  5. 开源大数据周刊-第50期

    摘要: 本周刊的内容包括人工智能在软件和硬件上的最新进展,以及Kylin.Kudu等开源软件的实践和实现原理分析 资讯 谷歌TPU之后还有高通,人工智能芯片竞赛已经展开 谷歌有了自己的人工智能芯片TP ...

  6. 开源大数据周刊-第11期

    摘要: 开源有四个阶段:拥抱开源.回馈开源.融合开源.回报开源 阿里云E-Mapreduce动态 E-Mapreduce团队 1.3.3版本 (已经发布) 商业化发布,用户无需申请即可使用E-MapR ...

  7. 开源大数据周刊-第15期

    摘要: 最近大数据的一些论断,如:中国大数据发展10大趋势5大挑战,数据在工业的崛起将重塑整个商业社会,涂子沛:都说收集数据很难,也许是思维错了. 阿里云E-Mapreduce动态 E-Mapredu ...

  8. 开源大数据周刊-第72期

    摘要: 资讯: <新一代人工智能发展规划>启动实施 公布首批开放创新平台 科技部于11月15日在北京召开了<新一代人工智能发展规划>暨重大科技项目启动会.本次会议紧紧围绕新一代 ...

  9. 开源大数据周刊-第102期

    资讯 重磅:Cloudera.Hortonworks 合并 ! 两家大数据先驱Cloudera和Hortonworks今天宣布了它们所谓的相对平等的合并,声称将把两家公司合并成一家年收入达7.2亿美元 ...

最新文章

  1. strrchr 字符查找函数
  2. 犯了一个连接数据库的低级错误
  3. 【Java语法】关于使用new和不使用new的数组值传递还是引用传递的问题
  4. 《毅力–如何培养自律的习惯》读书笔记
  5. 从常识看中国经济社会-再续之续:套利
  6. 二级MS Office公共基础知识错题本(1)
  7. 如何深入学习python_菜鸟如何学好python
  8. [导入]创建一个ASP通用分页类代码部分
  9. CCF201412-2 Z字形扫描(模拟)
  10. 线程学习9——Mutex类
  11. 网站运维都需要做什么工作
  12. 解決win7打开EXE文件总是出现安全警告
  13. Elasticsearch2.4.X 搜索引擎框架 安装配置
  14. html留言页面设计,html的留言板制作(js)
  15. 如何区分是前端BUG还是后端BUG
  16. 【转】Photoshop 用户名.组织或序列号丢失或无效.应用程序无法继续.
  17. npm init @vitejs/app的背后,仅是npm CLI的冰山一角
  18. essay--网络常用省略语大全(ZT)
  19. 层次方框图、Warnier图、IPO图
  20. 关于神经网络算法使用场景的思考

热门文章

  1. 深入入门正则表达式(java) - 匹配原理 - 1 - 引擎分类与普适原则
  2. 苹果应用开发架构及项目结构
  3. weblogic java虚拟机_weblogic server 性能及调优-调优 java 虚拟机.doc
  4. Openldap配置TLS加密传输(完整版——shell脚本实现[即在客户端执行代码,即可实现TLS加密])
  5. 关于hive开窗函数的问题
  6. 十五周 苏浪浪 201771010120
  7. SQL Server 2008 无法删除用户的解决方法
  8. CVPR 2014 ObjectnessBING 原文翻译
  9. OpenCv中实现了三种立体匹配算法:
  10. Android URL