几乎每个行业的组织现在都充斥着比他们知道如何处理更多的数据。但是,他们如何获取所有这些信息并使用它来获得有助于改进运营和规划前进道路的新见解?从数据到洞察力再到决策制定的确切过程对于每个组织来说都略有不同。但我对跨行业最佳实践的观察揭示了该流程的通用架构。

寻求利用数据科学进行战略决策的组织应遵循以下五个步骤:

1. 理解数据结构

考虑零售业。任何在 Shopify 等平台上开设电子商务商店的人几乎都会立即开始收集数据——有关来自不同渠道、供应商、库存、客户评论和其他来源的交易信息。现在,假设零售商希望更好地了解其客户,包括他们喜欢的东西、不喜欢的东西以及影响他们购买决策的因素。回答这类(看似简单)的问题很快就会变得复杂,因为客户有不同的偏好,以及与品牌互动的不同方式。有些人可能只购买一种产品,而其他人则是忠实的回头客。但是通过在微观和宏观层面进行仔细分析,组织可以开始全面了解其客户群,

(来源:http://bj.dyrs.com.cn/story/202112/1171014?source=wx)

2. 使用结构创建预测模型

这是步骤 1 中的零售商获取其所有数据并开始提出具体问题的过程的一部分,例如:“27 号衬衫在来年春天的销售情况如何?” 在数据科学家将现有数据转化为更加结构化的形式后,他们可以应用预测方法来回答这些问题。对于利益相关者来说,将细微差别引入流程的这一方面非常重要。例如,红色衬衫可能卖得很好,但也许过去一周有明显的下降趋势。通过分析历史数据,组织可能会发现这种低迷仅仅是可预测的季节性小问题,或由于不可预测的外部事件(例如全球大流行的突然出现)。通常,人们会问这样一个问题:“多少数据才足够?” 但实际上,这是一个错误的问题。反而,

3. 了解数据中的动态

在大众的想象中,数据科学通常是一个非常静态的过程:您获取数据,通过神经网络运行它,然后做出预测。但实际上,零售和金融领域(以及其他数据科学特别有价值的领域)中的数据在不断变化。此外,数据有时会因收集数据的组织所做的选择而产生偏差。精明的数据科学团队必须考虑所有这些变量。再次谈到零售:从 2020 年 2 月(在 COVID 爆发之前)到 2021 年 1 月(大流行的高峰期),进入组织的数据不可避免地发生了很大变化,此后随着危机的消长和消退又发生了几次变化. 因此,在发展对数据的理解以及构建预测模型的同时,必须考虑到这种动态。

4. 采用现代机器学习技术

(来源:http://bj.dyrs.com.cn/story/202112/1171015?source=wx)

处理来自电子表格的数值数据以做出基于数据的预测和决策是一回事。但现在想象一下,这些电子表格单元格中的数字变成了非结构化对象,例如图像和文本。为了利用这种非结构化数据,组织需要利用现代机器学习 (ML) 方法。这极大地增加了组织可以用来进行预测的数据的数量和类型。当然,易于量化的指标(例如历史销售数据)非常有用。但是来自在线客户评论甚至社交媒体互动的非结构化数据可以更全面地了解市场上正在发生的事情以及原因。

5. 开发有效的场景分析(又名推荐)系统

最后,数据科学团队需要将所有内容整合在一起,以实时、大规模地做出连续决策。这种决策不可避免地涉及决策者或需要帮助执行“情景分析”并需要使用历史数据“建议”的人。事实上,推荐系统就是对这个问题的回答。

通常,推荐系统一直关注电子商务中的应用,例如“如果你喜欢这个,你可能会喜欢那个”。然而,它们在电子商务之外有广泛的应用,包括各种娱乐和寻路应用、金融、政策制定、匹配市场(叫车、在线约会、演出市场等),以及更普遍的任何需要搜索之外的帮助的应用。为了说明创建有效推荐系统的挑战和机遇,请考虑一个简单的例子:亚马逊维护着数百万种产品的库存,并拥有数亿客户。在推荐引擎的两边,有大量的变量需要处理。但是,通过正确处理这一部分,该公司能够增加收入并更好地满足其客户。

从外面看,数据科学似乎是一个非常神秘的实践。但是,太空旅行、建造摩天大楼或进行心脏直视手术的实践也是如此。与这些其他实践一样,数据科学受规则的约束,这些规则可以帮助指导组织和个人取得成功。
相关实战:http://bj.dyrs.com.cn/story/202112/1171012?source=wx
http://bj.dyrs.com.cn/story/202112/1171013?source=wx
http://bj.dyrs.com.cn/story/202112/1171011?source=wx
http://bj.dyrs.com.cn/story/202112/1171009?source=wx

基于数据的决策的 5 个步骤相关推荐

  1. 给Clouderamanager集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤(图文详解)...

    不多说,直接上干货! 这个很简单,在集群机器里,选择就是了,本来自带就有Impala的. 扩展博客 给Ambari集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤(图文详解) 欢迎大 ...

  2. Dataphin核心功能(四):安全——基于数据权限分类分级和敏感数据保护,保障企业数据安全

    简介: <数据安全法>的发布,对企业的数据安全使用和管理提出了更高的要求.Dataphin提供基于数据分级分类和数据脱敏的敏感数据识别和保护能力,助力企业建立合规的数据安全体系,保障企业数 ...

  3. 下一个风口-基于数据湖架构下的数据治理

    前言 随着大数据.人工智能.云计算.物联网等数字化技术的普及和广泛应用,传统的数据仓库模式,在快速发展的企业面前已然显的力不从心.数据湖,是可以容纳大量的原始数据的存储库和处理系统,已经成为企业应用大 ...

  4. 毫米波雷达视觉融合方案综述(数据级/决策级/特征级融合)

    摘要:本论文详细介绍了基于毫米波雷达和视觉融合的障碍物检测方法,从任务介绍.评估标准和数据集三方面展开. 转载自:自动驾驶之心 原文地址:毫米波雷达视觉融合方案综述(数据级/决策级/特征级融合) 自动 ...

  5. 盒装数据:一种基于数据盒的数据产品形态

    盒装数据:一种基于数据盒的数据产品形态 叶雅珍1,2, 朱扬勇1,2 1.复旦大学计算机科学技术学院 2.上海市数据科学重点实验室 摘要:与通常的商品市场一样,数据市场中流通的数据商品也分为标准产品和 ...

  6. 大数据催生决策新模式 未来将改变更多

    "数据多跑路.群众少跑腿",如今,对大数据的应用已经开始切实影响到百姓的日常生活.李彦宏:数据本身不会产生很大的价值,只有共享出来跟各个行业比如教育.医疗.金融等相结合才能产生价值 ...

  7. 把一个dataset的表放在另一个dataset里面_视频自监督一. STCR: 一个基于数据增强的简单有效正则项 (降低静态信息的影响)...

    视频自监督一. STCR: 一个基于数据增强的简单有效正则项 (降低静态信息的影响) 今天介绍一个我们近期做的关于视频自监督的简单工作: Self-supervised learning using ...

  8. 糗事百科李威: 如何基于数据构建推荐系统,助力精细化运营?

    作者:李威,糗事百科产品总监 来源:GrowingIO 2019 增长大会(北京)演讲 (全文累计 7000 余字,建议先收藏,或移步文末直接观看演讲视频) 大家好,我是李威,来自糗事百科. 今天主要 ...

  9. 论文分享:大数据智能决策,《自动化学报》

    在全球信息化快速发展的背景下, 大数据已经成为一种战略资源.各行各业的决策活动在频度.广度及复杂性上较以往有着本质的不同.决策过程中的不确定性因素增多, 决策分析的难度不断加大.传统的数据分析方法以及 ...

最新文章

  1. boost log 能不能循环覆盖_前端基础进阶(十四):深入核心,详解事件循环机制...
  2. /proc文件夹介绍
  3. 今日头条 CEO 张一鸣:面试了 2000 个年轻人
  4. html认识数字游戏大全,认识数字小游戏,就是这么简单!为孩子收藏
  5. new与malloc的区别,以及内存分配浅析
  6. 人工智能+大数据 首个自动驾驶平台诞生
  7. HTML引入媒体查询CSS,CSS3 多媒体查询
  8. 使用@Order调整配置类加载顺序
  9. 修改element-ui源码使日期范围date-picker支持年范围选择
  10. 【NLP之情感分析】华为云NLP算法专家:全面解读文本情感分析任务
  11. Android【报错】Description Resource Path Location Type Call requires API level 9 (current min is 8):
  12. Java 并发编程的艺术
  13. 游戏模型制作的注意事项 项目模型规范总结
  14. Oracle迁移到mysql字符集_oracle数据库字符集characterset迁移及变更系列一
  15. 【渗透测试】VulnHub-Lord Of The Root: 1.0.1
  16. 0805的高频绕线电感有什么特征
  17. 开源GIS技术讨论,欢迎加群
  18. Python中 list[:]与 list 的区别
  19. 图片路径不存在,替换问题图片
  20. RF- BuiltIn库-should关键字

热门文章

  1. 医药营销数字化转型大潮之下,战略布局是突围的关键
  2. Java web 红头文件打印方案之协同OA
  3. 第五届ACM/IEEE边缘计算国际研讨会 论文征集
  4. MySQL中group_concat函数用法总结
  5. 二进制,十进制,位移运算符
  6. 关于商业智能 BI 认知上的误区,你有几个
  7. 网络时间的那些事及 ntpq 详解
  8. 用3种方式打开下载链接
  9. yoga 使用 鼠标设置
  10. archlinux微信安装