大数据的处理过程可以分为大数据采集、存储、结构化处理、隐私保护、挖掘、结果展示(发布)等,各种领域的大数据应用一般都会涉及到这些基本过程,但不同应用可能会有所侧重。对于互联网大数据而言,由于其具有独特完整的大数据特点,除了共性技术外,采集技术、结构化处理技术、隐私保护也非常突出。

  有很多算法和模型可以解决这些处理过程中的技术问题,并且为了最终用户的使用方便,它们大都被进一步的封装,形成了比较简单易用的操作平台。目前大数据技术平台有很多,归纳起来可以按照以下方式进行分类:

  (1)从大数据处理的过程来分:包括数据存储、数据挖掘分析、以及为完成高效分析挖掘而设计的计算平台,它们完成数据采集、ETL、存储、结构化处理、挖掘、分析、预测、应用等功能。

  (2)从大数据处理的数据类型来划分:可以分为针对关系型数据、非关系型数据(图数据、文本数据、网络型数据等)、半结构化数据、混合类型数据处理的技术平台。

  (3)从大数据处理的方式来划分:可以分为批量处理、实时处理、综合处理。其中批量数据是对成批数据进行一次性处理,而实时处理(流处理)对处理的延时有严格的要求,综合处理是指同时具备批量处理和实时处理两种方式。

  (4)从平台对数据的部署方式看:可以分为基于内存的、基于磁盘的。前者在分布式系统内部的数据交换是在内存中进行,后者则是通过磁盘文件的方式。

  此外,技术平台还有分布式、集中式之分,云环境和非云环境之分等。阿里云大数据平台构建在阿里云云计算基础设施之上,为用户提供了大数据存储、计算能力、大数据分析挖掘、以及输出展示等服务,用户可以容易地实现BI商业智能、人工智能服务,具备一站式数据应用能力。

  不同的大数据技术平台提供了对这些处理过程的支持,有的平台可能会支持多个过程,但是侧重点也不同,支持的深度也有所不同,因此有必要熟悉各种平台的功能,并做出比较分析,以便在实际应用中选择适合于自己需求的技术平台。

  选择一个合适的大数据技术平台是非常重要的,它能够使得大数据应用开发更加容易、让开发人员更集中精力在业务层面的数据分析与处理上。一些共性的基础问题,例如数据如何存储、如何检索、数据统计等,就可以由平台来完成。选择合适的大数据技术平台应当考虑以下因素:

  (1)平台的功能与性能:由于不同平台侧重的功能不同,平台的性能也就有很多需要考察的方面。比如对于存储平台来说,数据的存储效率、读写效率、并发访问能力、对结构化与非结构化数据存储的支持,所提供的数据访问接口等方面就是比较重要的。对于大数据挖掘平台来说,所支持的挖掘算法、算法的封装程度、数据挖掘结果的展示能力、挖掘算法的时间和空间复杂度等,是比较重要的指标。

  (2)平台的集成度:好的平台应该具有较高的集成度,为用户提供良好的操作界面,具有完善的帮助和使用手册、系统易于配置、移植性好。同时随着目前软件开源的趋势,开源平台有助于其版本的快速升级,尽快发现其中的bug,此外,开源的架构也比较容易进行扩展,植入更多的新算法,这对于最终用户而言也是比较重要的。

  (3)是否符合技术发展趋势:大数据技术是当前发展和研究的热点,其最终将走向逐步成熟,可以预见在这个过程中,并非所有的技术平台都能生存下来。只有符合技术发展趋势的技术平台才会被用户、被技术开发人员所接受。因此,一些不支持分布式、集群计算的平台大概只能针对较小的数据量,侧重于对挖掘算法的验证。而与云计算、物联网、人工智能联系密切的技术平台将成为主流,是技术发展趋势。

  技术迭代更新速度加快,当我们花很多时间去掌握熟悉某种技术平台后,可能新的更好的技术平台出现了,导致我们受累奔波于各种技术平台,因此,最好的策略就是全面系统地掌握大数据技术的原理和实现方案,这样学习新的技术平台就很容易上手。

大数据技术平台主要分为哪几类相关推荐

  1. 目前大数据技术平台有很多,主要可以分为哪几类?

    大数据的处理过程可以分为大数据采集.存储.结构化处理.隐私保护.挖掘.结果展示(发布)等,各种领域的大数据应用一般都会涉及到这些基本过程,但不同应用可能会有所侧重.对于互联网大数据而言,由于其具有独特 ...

  2. 大数据建设意义_大数据技术平台建设方案(ppt)

    应急指挥一张图可视化平台方案(ppt) 大数据平台架构建设方案(图文) 大数据平台技术架构解决方案(ppt)大数据平台总体架构方案(ppt)大数据平台框架选型分析方案(图文)大数据可视化分析平台应用方 ...

  3. 大数据入门学习者主要分为哪几类,从业方向有哪些?

    "人才荒"."高考热门专业"."需求大"."缺口150万人"."稀缺职位"."年薪百万&q ...

  4. 大数据技术的发展方向

    大数据是由数量巨大.结构复杂.类型众多的数据结构的数据集合,在合理时间内,通过对该该数据集合的管理.处理.并整理成为能帮助政府机构和企业进行管理.决策的讯息. 大数据技术发展可以分为六个方向: 1.在 ...

  5. 志翔科技亮相2022数博会 工业大数据技术支撑电力数智化

    2022年5月26日,2022中国国际大数据产业博览会(简称"数博会")线上开展,工业大数据企业志翔科技亮相云展会,展示了公司工业大数据产品在电力行业的应用和成果.自2018年志翔 ...

  6. 数据科学家和大数据技术人员工具包

    数据科学家的常用工具与基本思路,数据分析师和数据科学家使用的工具综合概述,包括开源的技术平台相关工具.挖掘分析处理工具.其它常见工具等几百种,几十个大类,部分网址.为数据科学教育和知识分享,提高数据科 ...

  7. 昂贵、复杂、低效...中小型企业如何打破大数据技术栈困境?

    大数据已经成为当代经济增长的重要驱动力 数字经济,已经成为当今经济发展中非常重要的一部分. 与农业经济.工业经济如出一辙,数字经济活动需要土地.劳动力.资本.技术以及相应配套基础设施.不同之处在于:第 ...

  8. 【2015年第4期】基于大数据技术的P2P网贷平台风险预警模型

    基于大数据技术的P2P网贷平台风险预警模型 林春雨1,李崇纲1,许方圆2,许会泉1,石 磊1,卢祥虎1 (1. 北京金信网银金融信息服务有限公司 北京 100101:2. 国网能源研究院 北京 100 ...

  9. 医疗大数据服务平台技术架构有哪些

    医疗健康大数据服务平台是一个包含多个业务系统.多个自身管理软件.是一系列软.硬件和人员.政策支持的综合系统体系,统一建设医疗健康云计算服务中心,集中存储居民医疗卫生信息和居民电子健康档案等数据,满足社 ...

最新文章

  1. Spread for Windows Forms高级主题(5)---数据处理
  2. android调用flutter aar_Flutter原生混合开发
  3. 一个用理性设计的搞笑游戏
  4. C#后台创建Excel文件的那点事儿
  5. java 线程模型_Java基础篇之Java线程模型
  6. 启动之后自己关闭_电脑一开都是广告,请问怎么永久关闭?
  7. 理解Flexbox弹性盒子
  8. Android 系统 (39)---OTA后启动第三方APP出现APP Crash
  9. [妙味Ajax]第一课:原理和封装
  10. 2017-2018-1 20155201 20155313 实验一 开发环境的熟悉
  11. thinkpadx1mdt 网络启动_二二、MDT 2013 Update 1批量部署-硬件驱动使用、驱动库建立及自动识别...
  12. Springboot封装的好的发送post请求的工具类
  13. RecorderManager安卓仿微信自定义音视频录制第三方库
  14. 女性有十大超能力,你知道吗?
  15. Git跨团队协作和Win7凭据管理器
  16. WeUI+移动端照片上传、显示、预览、下载功能
  17. 用递归及非递归方式实现树状结构的遍历函数
  18. Unity VR开发教程 OpenXR+XR Interaction Toolkit (六)手与物品交互(触摸、抓取)
  19. 真够色!这个AI项目让画师们激动中又透露着瑟瑟发抖!忍不住想尝试
  20. 转:Redis监控技巧

热门文章

  1. JSP内置对象实现表的增删查改
  2. Camel In Action 读书笔记 (8)
  3. 2011对于运维的思考
  4. SSAS实践问题记录--OLAP 存储引擎中存在错误: 处理时找到重复的属性键
  5. java中的@Override标签
  6. 程序员面试金典——3.6双栈排序
  7. 【深度学习】深度学习分类与模型评估
  8. Hub与Switch的帧的广播细节
  9. ubuntu安装中文字体,python plt 绘图显示中文
  10. Latex中插入超链接/网址