今的数据具有多种多样的形式,而且来自许多不同的数据源。更为重要的是,除非有需要的那些人易于获得大数据,除非能迅速获得洞察力,否则大数据分析工具的用处并不是很大。那么大数据分析将遇到哪些困难?

  1、解决方案无法提供新见解或及时的见解

  (1)数据不足

  有些组织可能由于分析数据不足,无法生成新的见解。在这种情况下,可以进行数据审核,并确保现有数据集成提供所需的见解。新数据源的集成也可以消除数据的缺乏。还需要检查原始数据是如何进入系统的,并确保所有可能的维度和指标均已经公开并进行分析。最后,数据存储的多样性也可能是一个问题。可以通过引入数据湖来解决这一问题。

  (2)数据响应慢

  当组织需要实时接收见解时,通常会发生这种情况,但是其系统是为批处理而设计的。因此有些数据现在仍无法使用,因为它们仍在收集或预处理中。

  检查组织的ETL(提取、转换、加载)是否能够根据更频繁的计划来处理数据。在某些情况下,批处理驱动的解决方案可以将计划调整提高两倍。

  (3)新系统采用旧方法

  虽然组织采用了新系统。但是通过原有的办法很难获得更好的答案。这主要是一个业务问题,并且针对这一问题的解决方案因情况而异。最好的方法是咨询行业专家,行业专家在分析方法方面拥有丰富经验,并且了解其业务领域。

  2、不准确的分析

  (1)源数据质量差

  如果组织的系统依赖于有缺陷、错误或不完整的数据,那么获得的结果将会很糟糕。数据质量管理和涵盖ETL过程每个阶段的强制性数据验证过程,可以帮助确保不同级别(语法、语义、业务等)的传入数据的质量。它使组织能够识别并清除错误,并确保对某个区域的修改立即显示出来,从而使数据纯净而准确。

  (2)与数据流有关的系统缺陷

  过对开发生命周期进行高质量的测试和验证,可以减少此类问题的发生,从而最大程度地减少数据处理问题。即使使用高质量数据,组织的分析也可能会提供不准确的结果。在这种情况下,有必要对系统进行详细检查,并检查数据处理算法的实施是否无故障

  3、在复杂的环境中使用数据分析

  (1)数据可视化显示凌乱

  如果组织的报告复杂程度太高。这很耗时或很难找到必要的信息。可以通过聘请用户界面(UI)/用户体验(UX)专家来解决此问题,这将帮助组织创建引人注目的用户界面,该界面易于浏览和使用。

  (2)系统设计过度

  数据分析系统处理的场景很多,并且为组织提供了比其需要还要多的功能,从而模糊了重点。这也会消耗更多的硬件资源,并增加成本。因此,用户只能使用部分功能,其他的一些功能有些浪费,并且其解决方案过于复杂。

  确定多余的功能对于组织很重要。使组织的团队定义关键指标:希望可以准确地测量和分析什么,经常使用哪些功能以及关注点是什么。然后摒弃所有不必要的功能。让业务领域的专家来帮助组织进行数据分析也是一个很好的选择。

  4、系统响应时间长

  (1)数据组织效率低下

  也许组织的数据组织起来非常困难。最好检查其数据仓库是否根据所需的用例和方案进行设计。如果不是这样,重新设计肯定会有所帮助。

  (2)大数据分析基础设施和资源利用问题

  问题可能出在系统本身,这意味着它已达到其可扩展性极限,也可能是组织的硬件基础设施不再足够。

  这里最简单的解决方案是升级,即为系统添加更多计算资源。只要它能在可承受的预算范围内帮助改善系统响应,并且只要资源得到合理利用就很好。从战略角度来看,更明智的方法是将系统拆分为单独的组件,并对其进行独立扩展。但是需要记住的是,这可能需要对系统重新设计并进行额外的投资。

  5、维护成本昂贵

  (1)过时的技术

  组织最好的解决办法是采用新技术。从长远来看,它们不仅可以降低系统的维护成本,还可以提高可靠性、可用性和可扩展性。逐步进行系统重新设计,并逐步采用新元素替换旧元素也很重要。

  (2)并非最佳的基础设施

  基础设施总有一些优化成本的空间。如果组织仍然采用的是内部部署设施,将业务迁移到云平台可能是一个不错的选择。使用云计算解决方案,组织可以按需付费,从而显著降低成本。

  (3)选择了设计过度的系统

  如果组织没有使用大多数系统功能,则需要继续为其使用的基础设施支付费用。组织根据自己的需求修改业务指标并优化系统。可以采用更加符合业务需求的简单版本替换某些组件。

  想在合适的时候让合适的人员获得合适的数据,你就要有一套灵活、可扩展的基础设施,能够可靠地将前端系统与后端系统整合起来,并且让贵公司的业务顺畅运行起来。

大数据分析存在哪些困难相关推荐

  1. 政府大数据应用的反思;大数据分析应用常见的困难

    来源:网络大数据 摘要:在智慧城市建设中,以支持政府决策为名的大数据中心建设如火如荼,但利用大数据改进决策的成功案例却鲜有,与大数据中心的投资不成比例,令人质疑大数据中心遍地开花模式的合理性. 一.政 ...

  2. 智慧政务:政府运用大数据分析技术取得哪些成果

    我们越来越多地听到政府领导人谈论在其机构内建立分析文化的必要性.领导者希望他们的员工将分析作为变革的推动者,将注意力和资源集中在实现组织的使命目标上. 实现这些组织的任务目标的目标意味着,支持该目标的 ...

  3. 《Spark大数据分析:核心概念、技术及实践》大数据技术一览

    本节书摘来自华章出版社<Spark大数据分析:核心概念.技术及实践>一书中的第1章,第1节,作者穆罕默德·古勒(Mohammed Guller)更多章节内容可以访问云栖社区"华章 ...

  4. (实际开发大数据分析系统)网络爬虫获取数据与销售数据分析系统

    大数据分析应用系统的完整开发过程分为数据采集.数据存储.数据计算和数据分析和展示四个部分. 数据采集:WebCollector框架 数据存储:SQL 数据计算: 数据分析和展示:Java EE 流程就 ...

  5. 【干货下载】大数据分析的四个关键环节

    本文提炼自神策数据与 Ping++ 联合举办的沙龙 Growth Workshop 中神策数据创始人 & CEO 桑文锋的分享,主题为<大数据分析的四个关键环节>.PPT 干货获取 ...

  6. 营销大数据分析 关键技术_营销分析的3个最关键技能

    营销大数据分析 关键技术 Perhaps more than any other field, marketing, especially digital marketing, revolves al ...

  7. 宏基因组大数据分析的质量控制流程规范

    宏基因组大数据分析的质量控制流程规范 郑广勇1,杨桢1,曹瑞芳1,刘婉2,李亦学1,2,张国庆1,2 1. 中国科学院上海生命科学研究院生物医学大数据中心,上海 200031 2. 上海生物信息技术研 ...

  8. 试述hadoop生态系统以及每个部分的具体功能_Hadoop在大数据分析中的意义和作用...

    什么是Hadoop? Apache Hadoop是一个开放源代码软件框架,用于开发在分布式计算环境中执行的数据处理应用程序. 使用HADOOP构建的应用程序可在分布在商用计算机群集上的大型数据集上运行 ...

  9. 大数据分析的优势有哪些特点

    在当今时代,大数据分析不再仅仅用于实验目的.许多公司开始通过这种方法获得更多真实的结果,并且他们正在努力围绕更多的数据和模型.它是一个用来描述海量实时流数据的收集.可用性和处理的术语.这三个V只是体积 ...

最新文章

  1. cpu子系统(优化)
  2. Ubuntu14.04安装apt-get方法Lnmp环境
  3. SQL增删改查,基础
  4. 基于多任务学习和负反馈的深度召回模型
  5. 限制排列与棋盘多项式
  6. php ci框架 自动验证,CodeIgniter表单验证方法实例详解
  7. python调用系统命令_linux里面python调用系统命令问题
  8. 【Android教程】Android用户系统管理
  9. 数字时钟仿真电路设计
  10. 【无标题】输入圆锥体半径r以及高度h,并计算它的体积。
  11. Python 招聘信息爬取及可视化
  12. 少儿Python视频课程A级简介
  13. 微信小程序之二级联动下拉列表
  14. STL原理与构建——阅读笔记
  15. 程序员番茄炒生熟鸡蛋
  16. 一男老师每日百词转载+连载(2)
  17. 即将到来的星期二-dasBlog 2.0和Medium Trust
  18. 易语言制作计算软件简单步骤_视频解说不想自己录,用什么简单好用的配音软件制作?...
  19. 公司CEO,利用恶意邮件部署勒索软件
  20. Apple 在中国的维修和保修政策

热门文章

  1. Java程序运行时间的计算
  2. Spring MVC 解读——context:component-scan/
  3. virtualbox导致Windows7重启
  4. 浅谈线性判别分析LDA
  5. found.000是什么,能删除吗
  6. tensorflow实现余弦cosine相似度
  7. Application.mk文件官方使用说明
  8. Java面试题系列(X)优化tomcat配置
  9. vue+webapi 实现WebSocket 推送
  10. 利用jquery实现电商网站常用特效之:五星评分