企业开展大数据分析,首先应开展业务调研和数据调研工作,明确分析需求,其次应开展数据准备工作,即选择数据源、进行数据抽样选择、数据类型选择、缺失值处理、异常值检测和处理、数据标准化、数据簇分类、变量选择等,再次应进行数据处理工作,即进行数据采集、数据清洗、数据转换等工作,最后开展数据分析建模及展现工作。大数据分析建模需要进行5个步骤,即选择模型、训练模型、评估模型、应用模型、优化模型结构。

  1.选择分析模型

  基于收集到的业务需求、数据需求等信息,研究决定选择具体的模型,如行为事件分析、漏斗分析、留存分析、分布分析、点击分析、用户行为分析、分群分析、属性分析等模型,以便更好地切合具体的应用场景和分析需求。

  2.训练分析模型

  每个数据分析模型的模式基本是固定的,但其中存在一些不确定的参数变量或要素在里面,通过其中的变量或要素适应变化多端的应用需求,这样模型才会有通用性。企业需要通过训练模型找到最合适的参数或变量要素,并基于真实的业务数据来确定最合适的模型参数。

  3.评估分析模型

  需要将具体的数据分析模型放在其特定的业务应用场景下(如物资采购、产品销售、生产制造等)对数据分析模型进行评估,评价模型质量的常用指标包括平均误差率、判定系数,评估分类预测模型质量的常用指标包括正确率、查全率、查准率、ROC曲线和AUC值等。

  4.应用分析模型

  对数据分析模型评估测量完成后,需要将此模型应用于业务基础的实践中去,从分布式数据仓库中加载主数据、主题数据等,通过数据展现等方式将各类结构化和非结构化数据中隐含的信息显示出来,用于解决工作中的业务问题的,比如预测客户行为、科学划分客户群等。

  5.优化分析模型

  企业在评估数据分析模型中,如果发现模型欠拟合或过拟合,说明这个模型有待优化;在真实应用场景中,定期进行优化,或者当发现模型在真实的业务场景中效果不好时,也要启动优化,具体优化的措施可考虑重新选择模型、调整模型参数、增加变量因子等。

  大数据分析建模建议

  数据分析建模是企业大数据应用的重要基础,通过建模不仅有效地组织了原始数据,而且为数据展现提供了重要支撑,企业在开展数据分析建模过程中应注意以下几点:

  大数据分析建模

  1.重视需求牵引作用,深化业务问题解决

  企业应结合业务发展目标,梳理经营生产过程中的瓶颈问题,以问题为导向,重视业务需求调研工作,清理业务流程和业务数据,研究数据来源、采集通道和映射关系,深入梳理数据基础,不断推进业务问题的解决并构建合理的业务架构。

  2.加大数据积累力度,夯实数据体系基础

  企业应深化信息系统应用,提升业务流程和业务数据上线力度,深化物联网、云计算等新兴技术应用,提高数据采集效率,丰富数据积累力度;完善主数据、主题数据、数据建模等标准规范,构建包含业务、指标、报表等的数据体系,夯实数据体系基础。

  3.加大人员队伍建设,提高技术支撑能力

  企业应加大技术专家、业务专家、数据分析师、数据管理员、运营专家等专业人员的培养,调动业务部门参与数据分析的积极性和主动性。同时加大数据分析、数据建模、数据挖掘技术储备、技术工具库和模型库建设,提高技术支撑能力。

  大数据分析建模是数据到信息转变的重要支撑,也是凸显数据价值实现的重要环节,企业应加强业务需求调研与业务架构优化,夯实数据基础和应用基础,不断选择、训练、评估、应用和优化模型,不断推进大数据分析建模的应用,为转型升级奠定坚实基础。

大数据分析平台建模及建议相关推荐

  1. 阿里大数据分析与应用(part3)--常用的大数据分析平台

    学习笔记,仅供参考,有错必纠 文章目录 常用的大数据分析平台 什么是大数据分析平台 基于Hadoop的大数据分析平台 阿里云大数据平台 典型阿里云大数据平台架构 MaxCompute MaxCompu ...

  2. canoco5冗余分析步骤_打造高性能的大数据分析平台

    大数据时代,大数据的应用与挖掘,大数据的分析和决策,大数据在经济社会的运行轨道上发挥着愈来愈重要的作用.对于大数据分析,现在好多互联网金融公司和传统的商业银行.证券基金公司都非常看重.个个都想在大数据 ...

  3. 初学者如何快速开发大数据分析平台

    大数据在近几年受到越来越多的关注,如何将大数据快速落地于生产实践,产生相应的经济价值一直是一个值得关注的问题.当谈到大数据,人们首先想到的是,是不是的linux,是不是的学习java,这给大数据技术的 ...

  4. 如何打造高性能大数据分析平台

    大数据分析系统作为一个关键性的系统在各个公司迅速崛起.但是这种海量规模的数据带来了前所未有的性能挑战.同时,如果大数据分析系统无法在第一时间为运营决策提供关键数据,那么这样的大数据分析系统一文不值.本 ...

  5. 186页13万字智慧能源大数据分析平台建设方案

    目录 智慧能源大数据分析平台及能源集团数字化平台建设方案 目录 一.相关项目背景 二.需求理解 2.1 需求理解 三.方案设计 3.1 整体方案设计 3.3.1 整体架构 3.3.2 解决方案说明 3 ...

  6. 【转】使用Apache Kylin搭建企业级开源大数据分析平台

    http://www.thebigdata.cn/JieJueFangAn/30143.html 本篇文章整理自史少锋4月23日在『1024大数据技术峰会』上的分享实录:使用Apache Kylin搭 ...

  7. 大数据分析平台的作用有什么

    大数据分析平台的主要目标是为大数据技术研发和应用项目实施提供高效完备的开发与运行环境.为此,大数据分析平台的总体功能包括以下主要方面: (1)云计算环境:整个平台基于云计算环境,主要包括:云存储.云资 ...

  8. 大数据分析平台具备怎样的功能

    人工智能产品的层出不穷,更多的大数据分析智能工具引进到人们眼前,信息化的世界悄然而来,为您带来大数据挖掘分析平台让您的工作效率提升!那么大数据分析平台具备怎样的功能? 一.它必须容纳海量数据 如果大数 ...

  9. 如何搭建大数据分析平台

    大数据分析平台可以真正帮用户解决井底之蛙,一叶障目的问题,用户通过大数据分析平台可以获得全面的数据信息,发现事物间的关联性,多角度去看待问题,辅助我们做出正确的决策,实现数据价值最大化. 搭建企业的大 ...

最新文章

  1. 基于图像的摄像机姿态估计方法评析
  2. 探讨微软团队开发利器VSTS之安装及部署篇
  3. Python 官网宣布,正式发布 Python 3.8.0!
  4. python怎么创建列表_用Python将一个列表分割成小列表的实例讲解 Python 如何创建一个带小数的列表...
  5. SAP Hybris的类型系统更改和ABAP的LOAD_PROGRAM_TABLE_MISMATCH
  6. 李洪强iOS开发之- 实现简单的弹窗
  7. 加油站会员管理系统源码php_加油站使用会员管理系统,如何解决行业瓶颈?
  8. angularjs的三种注入方式
  9. bootstrap modal 一闪
  10. shell制表与脚本运行进度条写法
  11. 注册表实现欢迎界面的修改
  12. Caffe学习:Solver
  13. python爬取豆瓣电影影评_Python3爬虫实战:以爬取豆瓣电影为例
  14. 树莓派运用阿里云API实现语音识别
  15. linux离线安装netstat,在Ubuntu中安装netstat等网络工具
  16. signature=3beca855c07ddd1a2414928f7d848f80,Rory Edelman doing signature with style.
  17. [实用工具] 如何免费下载 IEEE、ECCV、ICCV、CVPR、ACL等文章!
  18. wps是什么意思 wps段落设置在哪里,不着急的就看看吧!
  19. MCDM方法及matlab应用四:COPRAS 方法、案例及matlab应用
  20. 笔记本和利用服务器算力直连,顺网云电脑技术突破:实现利用网吧空余算力

热门文章

  1. 在CentOS4上安装JMagick
  2. Linux中的常用命令
  3. 《.NET应用架构设计:原则、模式与实践》新书博客-2.1.1-设计原则简述
  4. C++——unique()和unique_copy()
  5. Leetcode 199
  6. Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2问题解决
  7. 第三周课程总结&实验报告一
  8. 删除指定目录下的所有文件与更改文件扩展名
  9. C#Const与static readonly的区别
  10. [转]static和final的区别