为什么你的 数据分析 成果总是难以落地?数据分析的价值总是远远低于预期?相信看完这篇文章,每个人都能找到一个属于自己的答案。本人先后在电力、军工、金融等行业担任数据分析师,有多年行业经验。从平时的工作中总结出以下六个数据分析时要注意的原则 ,希望能对大家有所帮助。

1 、遵循数据分析标准流程

数据分析遵循一定的流程,不仅可以保证数据分析每一个阶段的工作内容有章可循,而且还可以让分析最终的结果更加准确,更加有说服力。一般情况下,数据分析分为以下几个步骤:

1)      业务理解,确定目标、明确分析需求;

2)      数据理解,收集原始数据、描述数据、探索数据、检验数据质量;

3)      数据准备,选择数据、清洗数据、构造数据、整合数据、格式化数据;

4)      建立模型,选择建模技术、参数调优、生成测试计划、构建模型;

5)      评估模型,对模型进行较为全面的评价,评价结果、重审过程;

6)      成果部署,分析结果应用。

2 、明确数据分析目标

在数据分析前期,要做到充分沟通、理解业务规则、关注业务痛点、了解用户需求、换位思考,明确为什么要做数据分析,要达到一个什么目标。这样才能保证后续的收集数据、确定分析主题、分析数据、分析结果应用等工作都能够围绕分析目标开展,保证最终能够从整体目标的角度去总结分析成果。

3 、业务与数据结合确定分析主题

以解决业务问题为目标,以数据现状为基础,确定分析主题。前期要做好充分的准备,以业务问题为导向,以业务梳理为重点,进行多轮讨论,分析主题避免过大,针对业务痛点,实现知现状、明原因、可预测、有价值。另外,分析数据的范围除了重点关注的业务指标数据,还要尽量考虑扩展外延数据,比如经济指标数据、气象数据、财务数据等。确定分析主题之前,要进行数据支撑情况的初步判断,避免中途发现数据质量或者数据范围不能支撑分析工作的情况发生。确定分析主题之后,详细论证分析可行性,保证分析过程的清晰性,才能开始分析工作。

4 、多种分析方法结合

分析过程中尽量运用多种分析方法,以提高分析的准确性和可靠性。例如,运用定性定量相结合的分析方法对于数据进行分析;融合交互式自助BI、数据挖掘、自然语言处理等多种分析方法;高级分析和可视化分析相结合等。

5 、选择合适的分析工具

工欲善其事,必先利其器,数据分析过程中要选择合适的分析工具做分析。SPSS、SAS、Alteryx、美林Tempo、RapidMiner、R、Python等这几种工具都是业界比较认可的数据分析产品。它们各有其优势,SPSS 较早进入国内市场,发展已经相对成熟,有大量参考书可供参考,操作上容易上手,简单易学。SAS由于其功能强大而且可以编程,很受高级用户的欢迎。Alteryx 工作流打包成应用,为小企业直接提供应用,地理数据分析功能强大。美林数据的Tempo大数据分析平台功能全面,在高级分析和可视化分析相结合上具有明显优势。RapidMiner易用性和用户体验做得很好,并且内置了很多案例用户可直接替换数据源去使用。R 是开源免费的,具有良好的扩展性和丰富的资源,涵盖了多种行业中数据分析的几乎所有方法,分析数据更灵活。Python,有各种各样功能强大的库,做数据处理很方便,跟MATLAB很像。

6 、分析结论尽量图表化

经过严谨推导得出的结论,首先要精简明确,3-5条即可。其次要与业务问题结合,给出解决方案或建议方案。第三尽量图表化,要增强其可读性。

利用美林数据 Tempo 大数据分析平台 实现的某企业KPI分析报告

数据分析过程中,除了以上六条原则,还要避免以下3种情况:

1 )时间安排不合理

在开始分析工作之前,一定要做一个明确的进度计划,时间分配的原则是:数据收集、整理及建模占70%,数据可视化展现及分析报告占25%,其他占5%。(数据的收集、整理和建模的过程,是反复迭代的过程)

2 )数据源选择不合理

一般企业中的数据来源有很多,SAP、TMS、CRM及各部门业务系统,每个渠道的数据各有特点。这时,应该慎重考虑从哪个渠道获取数据更加快捷有效。数据源选择不合理,不仅影响结论的可靠性,而且有返工的风险。

3 )沟通不充分

无论是分析人员内部的沟通还是与外部相关人员的沟通,都是至关重要的。与外部人员沟通效不顺畅,可能造成前期需求不清,中间业务逻辑混乱,最终导致数据分析结果差强人意。与内部人员沟通效率低,可能造成分析进度滞后,分析工作开展不畅等诸多问题,直接影响分析效果。

对于数据分析师,分析经验的积累与专业知识的提升同样重要,因为有些问题不是只用专业知识就能解决的,所以在平时的工作中要有意识的去学习业务知识、掌握先进的分析工具,做一个有心人!

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/31550086/viewspace-2212778/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/31550086/viewspace-2212778/

数据分析的六大黄金法则相关推荐

  1. 揭穿数据分析的六大谎言

    目前许多企业在决策时仍沿用以往的个人经验,没有用数据说话,这在实际决策运行时会出现很多问题.在数据分析行业发展成熟的国家,90%的市场决策和经营决策都是通过数据分析研究确定的.用数据说话,重视定量分析 ...

  2. 通过数据分析改进并达成SEO优化目标

    相信有不少朋友说,数据分析,对网站优化没什么用,分析过后该怎么做还怎么做,其实这是不对滴.对于数据分析与SEO优化之间的关系,凡是行业前辈,行业大牛们,无不非常重视,因为一个以流量与成交量为目的的网站 ...

  3. 拓扑数据分析在机器学习中的应用

    作者:曾凤 责任编辑:周建丁(zhoujd@csdn.net) 本文为<程序员>原创文章,未经允许不得转载,更多精彩文章请订阅2016年<程序员>http://dingyue. ...

  4. 企业大数据分析的趋势是怎样

    企业大数据分析具有六大趋势,主要是工作角色专业化.必须具备机器学习的经验.监管的星期.处在技术前沿.云计算和相关机制.必须具备基本的商务智能经验六大趋势.大数据和高级分析解决方案是有价值的,现在几乎每 ...

  5. 运维安全加固规范_DBA如何巧用“三十六计”保障数据库安全?

    数据库安全运筹帷幄三十六计 根据多年在数据行业摸爬滚打,积淀下来的经验心得,分享一个"向左向右"的理论. 在数据库安全领域,左,是走为上计,相当于逃跑机制,当没有有效安全机制来保证 ...

  6. 阿里云-数据仓库-全链路大数据开发治理平台-DataWorks的数字世界

    一.前言 上文我讲到 阿里云-数据仓库-数据分析开发神器-ODPS ,今天我带领大家一起走进神器的成长环境及它的数据世界. 二. DataWorks是什么 DataWorks基于MaxCompute. ...

  7. 数加生产制造执行系统(MES)——优势

    生产制造执行系统(MES)改善了成本.用工.效率.质量以及能耗管理等多方面的运营水平 ,对生产管理信息化提出具体的实现方案,可以更好解决生产问题,避免计划赶不上变化,导致产量不能达到预期标准,能够实现 ...

  8. 《python数据挖掘》和《python数据挖掘入门与实践》两本书读后感

    这些天花了很多时间来学习数据挖掘这门课程,有很多心得和感悟,所以写下这篇博客来表达自己读完这两本书的感受! 首先推荐大家通过这两本书来入门数据挖掘这个领域,python数据挖掘这本书较容易,还花了很大 ...

  9. 大数据分析工资单:六大行员工再涨薪 人均年薪超26万

    随着农行3月30日上交业绩"答卷",国有六大行年报已悉数披露完毕.2019年,六家国有银行共实现净利润约1.12万亿元,平均日赚30.59亿元.从各家银行亮出的"家底&q ...

最新文章

  1. 深度学习上的又一重点发现——利用MSCNN实现人群密度监测
  2. [Java]Stack栈和Heap堆的区别(终结篇)[转]
  3. .NET 数据访问架构指南(转)
  4. python enumerate
  5. 修改一个列表中的一个单词小技巧笔记
  6. Silverlight/Windows8/WPF/WP7/HTML5周学习导读(10月15日-10月21日)
  7. 2016和2017的区别就是昨晚和今早
  8. 一位网友在某职业论坛上就发了一个相关的帖子
  9. 基于DEAP库的python进化算法-7.多目标遗传算法NSGA-II
  10. Atitit  ocr识别原理 与概论 attilax总结
  11. BeanFactory和FactoryBean区别
  12. MATLAB 学习笔记(5)MATLAB 数据的导入和导出
  13. java String字符串去除()里的内容
  14. (java中的super)不会飞还能叫Superman吗
  15. 免费直播 | Three.js 实现粒子雷雨特效,走入前端 3D 世界!
  16. bcoma 应用程序发生错误_打开网页老是出现《应用程序错误》是怎么回事?
  17. python实现录屏录音小工具
  18. 医疗数据安全 | 健康医疗数据安全服务体系建设思考
  19. 这篇文章记录平时学习、项目中遇到的问题(未解决的居多)
  20. 2007年 西安站 东到西开 列车时刻表

热门文章

  1. JSON 格式化和校验工具
  2. eclipse设置代码格式化(详解)
  3. 海思HI35xx语音识别方案
  4. oracle不能打开新任务,virtualbox 不能为虚拟电脑打开一个新任务?
  5. 农夫住房抵押贷款叫醒农村沉睡资本
  6. python alphashape_Python alphashape包_程序模块 - PyPI - Python中文网
  7. Java依赖注入(DI)实例详解
  8. 技巧 | 使用基础绘图系统绘制「森林图」
  9. python算法工程师需要会写什么_算法工程师到底在干嘛
  10. raise ValueError(“‘label‘ must be of length ‘x‘“)