点击上方蓝色字体,关注我们

作者简介

浩彬老撕,R语言中文社区特邀作者,好玩的IBM数据工程师,立志做数据科学界的段子手。

个人公众号:探数寻理

在大数据时代下,数据科学家可说是当下最迷人的职业。在大家的眼中,数据科学家的主要任务是能够利用诸如统计分析,机器学习等技术,能够从海量的结构化以及非结构化数据中获得洞察,从而改进优化商业决策或者产品。

从上面的定位中看,与大多数职业不同的是,数据科学家的工作职责并不仅仅服务于企业工作流程的某个环节,而是贯穿于从前期商业理解到后期商业优化的全流程。那在整个流程当中,数据科学家需要完成或经历哪些阶段,我们不妨借助IBM数据分析的全生命周期剖析一下。

IBM提出数据分析的全生命周期是指从制定业务计划到发现问题并解决问题的一个完整的业务循环决策过程,一个数据科学家在此过程中主要包括如下分析任务:

1.计划性分析

计划性分析的主要重点是能够制定更为准确的计划、预算和预测。企业每年都要花费不计其数的时间编制详细的业务计划、业务预测和业务报告,用于推动他们的战略决策和绩效管理流程。在计划性分析的过程中,至关重要的事故信息必须及时准确,而且可以随着业务状况的变化而轻松更新。

2.描述性分析

描述性分析的主要重点是能够更为准确、可靠地监控、检测、分析及报告业务及财务数据。一般来说,我们可以借助仪表盘等可视化手段完成对数据的探索,从而帮助生产强大的数据洞察。描述性分析看似简单,但是理想的情况下,真正的精髓在于帮助数据分析师可ui直观地呈现数据,讲述数据中的“故事”,最终揭示全新的洞察。

3.诊断性分析

诊断性分析的主要重点是能够探索及分析业务问题发生的根源。相比于传统的基于结构化数据分析,诊断性分析将进一步结合结构化数据与非结构化数据进行深度洞察,通过深度的自然语言处理过程,结合实体和概念抽取等手段,诊断性分析将进一步为我们揭示了事情“为什么发生”。

4.预测性分析

预测性分析的主要重点是能够基于业务需求,建立并部署准确的预测性模型。预测分析涵盖了各种统计学技术,包括利用机器学习,数据挖掘等技术来分析当前及历史数据,从而对未来,或其他不确定的事件进行预测。在商业领域,预测模型从历史和交易数据探索规律,以识别可能的风险和商机。模型捕捉各个因素之间的联系,以评估风险及与之相关的潜在的条件,从而指导交易方案的决策。

5.解释性分析

诊断性分析的主要重点是能够借助于数据洞察,通过运筹优化等手段优化业务决策。解释性分析的核心在于优化,它应用数学和逻辑,以期提高效率。它本身并不关心概率,或者尝试通过查看过去发生的事来预测未来。但它基于事实—成本和收益、可用的资源和需求、目标和限制—使用数学算法和逻辑找到 最 佳 的 计 划 或 活 动 安 排。

直白地说,这五个分析任务我们可以把它理解为数据科学家的“五板斧”

毫无疑问,对于数据科学家来说,以上的“五板斧”都是十分的重要,对于不同的业务需求,我们需要根据实际情况选择不同分析方法。

值得注意的是,随着近几年数据科技的技术技术手段越来越高,分析人员已经逐渐从传统的结构化数据分析,慢慢把精力放在了非结构化数据当中。因为相比于传统的基于结构化数据分析,诊断性分析将进一步结合结构化数据与非结构化数据进行深度洞察,因此也有写小伙伴把“诊断性分析”称作“五板斧”中的“屠龙刀”。

好了,关于这把“屠龙刀”的进一步讨论,我们将在明天“数据分析五板斧与里面的屠龙刀(下)”为大家详细介绍如何针对非结构化数据进行深入分析。

往期回顾:

统计挖掘的一些事一些情(一)

统计挖掘的一些事一些情(二)——回归分析(附数据)

统计挖掘那些事(三)-超详尽回归分析指南(理论+动手案例)

统计挖掘那些事(四)-9个相关R先生的故事(理论+动手案例)

统计挖掘那些事(五)--(理论+案例)如何通俗地理解极大似然估计?

统计挖掘那些事(六)——强大的逻辑回归(理论+案例)

统计挖掘那些事(七)—— 如何直观地理解过拟合与欠拟合那些事~

统计挖掘那些事(八)—— 分层抽样与交叉验证

好玩

通俗

易懂

de

机器学习课程

Now

限免

限免

限免

现在扫描下方二维码即可免费学习

点击阅读原文即可购买配套教材书籍

数据分析五板斧与里面的屠龙刀(上)相关推荐

  1. XMOVE3.0手持终端——软件介绍(五):在2KB内存的单片机上实现的T9中文输入法

    编者注: X-MOVE是作者在业余时间于2010年6月份启动的以运动传感开发,算法和应用的平台,目前已经发展了三个版本,第四版的开发接近尾声.发布在博客园仅为交流技术,不存在商业目的,作者保留一切权利 ...

  2. Linux入门第五集!MySQL8在Linux上的安装!MySQL的Linux资源分享!

    Linux入门第五集!MySQL8在Linux上的安装!MySQL的Linux资源分享! 一.Mysql的Linux版本下载! 博主采用的是mysql-8.0.25-1.el7.x86_64.rpm- ...

  3. java习题4.1-将学生的学习成绩按不同的分数段分为优、良、中、及格和不及格五个登记,从键盘上输入一个0~100的成绩,输出相应的等级。要求用switch语句实现

    将学生的学习成绩按不同的分数段分为优.良.中.及格和不及格五个登记,从键盘上输入一个0~100的成绩,输出相应的等级.要求用switch语句实现 import java.util.Scanner;pu ...

  4. python数据分析方法五种_加速Python数据分析的10个简单技巧(上)

    总有一些小贴士和技巧在编程领域是非常有用的.有时,一个小技巧可以节省时间甚至可以挽救生命.一个小的快捷方式或附加组件有时会被证明是天赐之物,并能真正提高生产力.因此,我总结了一些我最喜欢的一些贴士和技 ...

  5. 大数据分析五步法流程顺序

    我们知道做认识事情都有个流程顺序,正确的流程可以事半功倍,错误的流程往往会导致事情重新来做.流程如此重要,具体到数据分析的流程也是一样的,数据分析可以分为五步,过程和家里的贤内助做饭的过程相似,分为问 ...

  6. [Pyhon大数据分析] 五.人民网新闻话题抓取及Gephi构建主题知识图谱

    该系列文章是Python大数据分析系列博客,包括网络爬虫.可视化分析.GIS地图显示.情感分析.舆情分析.主题挖掘.威胁情报溯源.知识图谱.预测预警及AI和NLP应用等.希望该系列文章对您有所帮助. ...

  7. 26 - 数据分析与Excel(Excel 快速入门上)

    Day 26 一.数据分析 随着互联网+的不断深入,网络中的数据量飞速膨胀.身处信息的海洋,在这个数据高速爆发的时代,企业想要快速发展,不能只简单地靠历史的经验,想要快速成功,就要认清数据.企业.社会 ...

  8. Python数据分析实践项目 教育平台的线上课程智能推荐

    嗨喽! 大家好,我是"流水不争先,争的是滔滔不绝"的翀,欢迎大家来交流学习,一起入坑数据分析,希望我们一起好好学习,天天向上,目前在社会毒打中~~ 文章目录 摘要 关键词:数据分析 ...

  9. 时序图如何表现分支_静态时序分析圣经翻译计划——第五章:延迟计算 (上)...

    本章节介绍了用于布局前后时序验证的基于单元(cell-based)的设计的延迟计算(delay calculation). ● 前几章重点介绍了对互连线和单元库的建模,单元和互连线建模技术可用于获得设 ...

  10. 程序员的基本功:为什么非要学Python数据分析?答案早就写在JD上了...

    在大数据浪潮当中,数据分析是这个时代的不二"掘金技能". 我们每一个人,每天无时无刻都在生产数据,一分钟内,微博上新发的数据量超过10万,b站的视频播放量超过600万...... ...

最新文章

  1. ubuntu ssh 客户端查看服务器端图形界面
  2. R语言协方差分析(analysis of covariance)实战:协方差分析ANCOVA(analysis of covariance)(检查模型假设)、拟合协方差分析ANCOVA模型、事后分析
  3. ASP.NET网络编程中常用到的27个函数集
  4. Android直播app用什么技术可以做到延迟小一些?
  5. 视觉研究的前世今生(上)王天珍(武汉理工大学)
  6. 【机器视觉】——相机和镜头的选择
  7. 你竟然没用 Nuget 构建项目?
  8. java获取10位随机数_Java基础:JAVA中BitSet使用详解
  9. PyTorch:将模型转换为torch.jit.ScriptModule
  10. 2022 年人工智能全球最具影响力学者榜单 AI 2000 正式发布
  11. 我❤️—Python自动化测试,30岁熬到月薪20K+,分享我的多年面试经…
  12. 复数相关的等式及证明
  13. Shell常用快捷键
  14. 拓端tecdat|Tableau 数据可视化:探索性图形分析新生儿死亡率数据
  15. 【优化算法】白鲨优化算法(WSO)【含Matlab源码 623期】
  16. Python实现线性反馈移位寄存器实例信息安全导论期中小作业
  17. 彻底拿下QSPI双闪存W25Q256| STM32H750| QSPI 双FLASH |cubeIDE |下载算法(二)
  18. win10 win+shift+s 截图存哪里去了
  19. android实现从耳机和自带麦克风,android插上耳机的时候仍然使用机身的麦克风录音,解决!...
  20. 问题解决:Failed to download metadata for repo ‘appstream‘: Cannot prepare internal mirrorlist:...

热门文章

  1. 一个架构师谈什么是架构,以及怎么成为架构师
  2. 用户空间和内核空间是什么?
  3. 关于MYSQL ERROR1045 报错的解决办法
  4. Win7 maven安装及配置
  5. jQuery解决ajax请求的跨域问题
  6. 【转】NSArray排序方法
  7. java_log_02
  8. Android 数字动画
  9. unity player 显示播放错误时的解决办法
  10. 专线维护 07/11