第三-完成

一旦产品构建完成,你仍然需要做一些事情来使项目更加成功并使你的未来生活更轻松。那么我们如何完成数据科学项目呢?

10-交付

完成阶段的第一步是产品交付。为了创建可以交付给客户的有效产品,首先必须了解客户的观点。其次,你需要选择最佳的方式将项目成果反馈给客户。最后,你必须选择要包含在产品中的信息和结果以及要放弃的内容。在产品创建和交付过程中做出好的选择可以大大提高项目的成功机会。

沟通媒介可以采取多种形式。在数据科学中,产品最重要的一个方面是客户是否积极参与产品并且能够使用产品来回答多种可能的问题。具体的沟通媒介有很多方式:

·       向客户提交结果可能是最简单的选项,其中包括文本、表格、图表和其他信息,这些信息可以解决你的项目要回答的部分或全部问题。

·       在一些数据科学项目中,数据集的分析和结果也可用项目原始数据范围之外的数据,其中可能包括原始数据生成的数据、其他不同来源的类似数据、或由于某种原因尚未分析的其他数据。在这种情况下,如果你可以为客户创建可以执行分析新数据集并生成结果的分析工具,对客户有所帮助。同时客户可以有效地使用此分析工具,并继续在将来和各种(但类似的)数据集中回答他们的主要问题,这是最好的情况。

·       如果你想提供比分析工具更好的产品,你可能需要构建某种类型的完整的应用程。如果你正在考虑提供交互式图形应用程序,那么你必须设计,构建和部署它。通常,这些都不是一项小任务。如果你希望应用程序具有许多功能并且具有灵活性,那么设计它并构建它将变得更加困难。

除了决定提供结果的媒介外,你还必须决定它将包含哪些结果。有些结果和内容可能是包含的明显选择,但对于其他信息位,可能不那么明显。通常,你希望包含尽可能多的有用信息和尽可能多的结果,但你希望避免客户可能误解或误用你选择包含的结果。在许多情况下,这可以是微妙的平衡,并且它在很大程度上取决于具体项目以及客户和其他人对结果的知识和经验。

11-进行修订

产品交付后,我们会在初步反馈后继续修改产品。一旦客户开始使用该产品,就有可能出现一系列全新的问题。尽管你付出了最大努力,但你可能没有预料到客户使用产品的方式的各个方面。即使产品完成了它应该做的事情,你的客户和用户也可能不会做这些事情并且有效地完成这些工作。

通常很难从客户、用户或其他任何人那里获得建设性的反馈。因此一些数据科学家提供完产品后就会忘记它们,一些数据科学家提供产品后会选择等待客户提供反馈。进行产品修订可能会非常棘手,找到合适的解决方案和实施策略取决于你遇到的问题类型以及你需要更改以解决问题的方法。如果在整个项目过程中,你始终保持对不确定性和许多可能结果的认识,那么你发现自己现在面临的结果与你之前预期的结果不同可能就不足为奇了。但是,如果你一直勤奋,问题很小,修复相对容易。

一旦你发现产品出现问题并弄清楚如何修复产品,仍然需要决定是否修复产品。一些人最初的倾向是每个问题都需要解决,这不一定是真的。如果有理由可以说服你不想进行修复问题,那就需要慎重考虑了,因为如果选择盲目地修复发现的每个问题,那一定会花费大量的时间和精力。

12-结束项

数据科学过程的最后一步是将其包装起来。随着数据科学项目的结束,似乎所有的工作都已完成,剩下的就是修复任何剩余的错误,然后才能完全停止思考并继续下一个。但在完成项目调试之前,你可以采取一些措施来增加未来成功的机会,无论是扩展同一个项目还是完全不同的项目。

现在有两种方法可以增加你未来成功的机会。一种方法是确保在将来的任何时候你都可以轻松地再次获取该项目并重做、扩展或修改它。通过这样做,你将增加在后续项目中获得成功的机会,所以,你需要从现在开始开始挖掘项目材料和代码并记下你用什么做的或者你是怎么做到的。最实用的方法是通过文档存储

提高未来项目成功率的第二种方法是尽可能多地从这个项目中学习,并将这些知识带到每个未来的项目中。通过进行项目分解,你可以从中梳理出有用的知识,这包括审查旧目标、旧计划、技术选择、团队协作等。是否可以应用于未来项目,通过项目回溯在事后进行思考,可以帮助发现有用的知识,使你能够以不同的方式做事,并在下次更好。

不确定性充斥在我们每个人工作的方方面面,记住过去给你带来问题的所有不确定因素,可以防止类似的事情再次发生。从数据到分析再到项目目标,几乎任何事情都可能在短时间内发生变化。了解所有可能性不仅是一项艰巨的挑战,而且几乎是不可能的。良好的数据科学家和伟大的数据科学家之间的区别在于能够预见可能出现的问题并做好准备。

结论

数据科学仍然具有新领域的光环。它的大多数组成部分:统计学、软件开发、基于证据的问题解决等等,这些可能是属于旧领域的知识,但数据科学似乎是这些部分的新组合成新的东西。数据科学的核心并不关心特定的数据库实现或编程语言,即使这些对于从业者来说是必不可少的,其核心应该是数据内容,给定项目的目标以及用于实现这些目标的数据分析方法之间的相互作用。

原文链接
本文为云栖社区原创内容,未经允许不得转载。

像数据科学家一样思考:12步指南(下)相关推荐

  1. 像数据科学家一样思考:12步指南(中)

    像数据科学家一样思考:12步指南(上)<像数据科学家一样思考> 7-工程产品 下一步是建立统计软件.如果统计是分析和从数据中得出结论的框架,那么软件就是将这个框架付诸行动的工具.数据科学家 ...

  2. 像数据科学家一样思考:12步指南(上)

    介绍 目前,数据科学家正在受到很多关注,因此,有关数据科学的书籍正在激增.我看过很多关于数据科学的书籍,在我看来他们中的大多数更关注工具和技术,而不是数据科学中细微问题的解决.直到我遇到Brian G ...

  3. 像数据科学家一样思考:12步指南(上) 1

    介绍 目前,数据科学家正在受到很多关注,因此,有关数据科学的书籍正在激增.我看过很多关于数据科学的书籍,在我看来他们中的大多数更关注工具和技术,而不是数据科学中细微问题的解决.直到我遇到Brian G ...

  4. 大数据 端到端_成为数据科学家的端到端指南

    大数据 端到端 数据科学提示/入门指南 (DATA SCIENCE TIPS /BEGINNERS GUIDE) Data Science has improved considerably over ...

  5. 【自译】八步成为数据科学家

    成为数据科学家只需要8步,看起来很简单的呢~~~ 转载于:https://www.cnblogs.com/SevnChen/p/5320896.html

  6. 如何成为一位数据科学家

    故事背景  这是kaggle的Titanic入门例子教程,我前面也写过一篇,这次工作是进一步清晰和完善整个步骤.大多数初学者都迷失在数据科学分析这个领域,因为他们陷入了黑盒子方法,使用他们不了解的库和 ...

  7. 如何成为一个优秀的数据科学家的投石之路

    故事背景 这是kaggle的Titanic入门例子教程,我前面也写过一篇,这次工作是进一步清晰和完善整个步骤.大多数初学者都迷失在数据科学分析这个领域,因为他们陷入了黑盒子方法,使用他们不了解的库和算 ...

  8. 从本科生到数据科学家,为啥这个职业门槛高?

    参与文末话题讨论,每日赠送异步图书 --异步小编 William Chen是Quora的一位数据科学家,在那里他协助Quora发展壮大,为这个世界分享知识.在拿到哈佛大学的统计和应用数学双学位之后,他 ...

  9. 如何成为一名合格的数据科学家?这5个要点一定要掌握

    导读:大数据时代方兴未艾,人工智能时代又呼啸而至.在人工智能时代,将数据的价值发挥出来的要素有资金.数据.平台.技术.人员等.数据科学家是人员要素中最为重要的部分,是需要企业非常重视的. 之前的文章& ...

最新文章

  1. nginx反向代理、负载均衡以及分布式下的session保持
  2. NeurIPS 2019:计算机视觉论文回顾
  3. Hive元数据信息表详解
  4. B端运营的核心技能,学会了还怕做不好业务吗?
  5. drupal全部都是节点_如果Drupal是一支乐队,那将是Rush
  6. rc.local介绍(linux启动系列之一)
  7. [Ext JS 4] Grid 组件
  8. 无盘网吧服务器比单机快吗,锐起无盘网吧系统打造比有盘更快的速度
  9. 《大数据时代》读后感
  10. c#_Form调用另一个Form中的按钮和方法
  11. Shell 脚本正则表达式(一)
  12. python音频处理库librosa基本操作
  13. 天龙八部服务器维护几点开服,天龙八部开服时间表2020-开服时间表一览
  14. 计算机研究生论文数学公式,研究生论文公式符号细则.doc
  15. 2021年河南高考--各高校在河南录取分数线预测(本科二批——文科)
  16. 读书百客:《轮台歌奉送封大夫出师西征》赏析
  17. 杨天宇20190912-1 每周例行报告
  18. 【问题导向】利用R语言进行情感分析
  19. matlab三相短路电流计算程序_电力系统三相短路计算的MATLAB代码
  20. runoob爬取python模块实例

热门文章

  1. Java技术知识点的一些总结
  2. mysql查看session对应的ip_Mysql 查看session连接数,状态 | 学步园
  3. yolov4 开发环境搭建_YOLOv4 的各种新实现、配置、测试、训练资源汇总
  4. python继承如何进行引用传递的区别_python在什么情况下会引用传递呢?
  5. 计算机视觉中的多视图几何_基于深度学习的视觉三维重建研究总结
  6. 【学习笔记】数据链路层——随机访问介质访问控制(ALOHA、CSMA、CSMA/CD、CSMA/CA),截断二进制指数规避算法
  7. 紫金计算机网络,南京理工大学紫金学院《计算机网络技术》考试复习试题试题(含答案解析)2...
  8. 加装的硬盘进入后点不了文件夹_在外接移动硬盘上制作win to go教程
  9. 489个学位点被撤销,2018撤销和增列学位授权点名单公布
  10. linux s删除第一行,Linux文本处理三驾马车之一sed