虚幻蓝图数据传递

In today’s business climate, strategic moats are built with data. Long gone are the days when you could build a new business line on software without a data play. Data was originally compared to oil, suggesting data fuels innovation engines. More recently, the Economist penned the comparison of data to sunlight because, like solar rays, data will be everywhere and underlie everything. Data is also the new infrastructure on which savvy business people erect differentiated business models.

在当今的商业环境中,战略护城河是用数据构建的。 不用数据就可以在软件上建立新业务线的日子已经一去不复返了。 最初将数据与石油进行了比较,表明数据推动了创新引擎的发展。 最近,《 经济学人 》将数据与日光进行了比较,因为就像太阳光线一样,数据将无处不在,并且构成一切的基础。 数据也是精明的商人在其上建立差异化业务模型的新基础架构。

Designing data products is costly. Data scientists and machine learning engineers top the charts of highest paid professionals, next to surgeons and doctors. Needless to say, it takes financial prowess and aligned business incentives to graduate a data science project from an experiment into a production application. The blueprint for successful data products consists of three core elements: business workflows, distribution channels, data sources.

设计数据产品的成本很高。 数据科学家和机器学习工程师紧随外科医生和医生之后,成为薪酬最高的专业人士。 不用说,要使数据科学项目从实验毕业到生产应用程序,就需要财务能力和一致的业务激励。 成功数据产品的蓝图包含三个核心元素:业务工作流,分销渠道,数据源。

业务流程 (Business Workflows)

Data products emerge as an application layer built on top of business workflows. Data products have a track record of success when deployed in operational settings such as admin process automation, customer support, regulatory compliance. That is to say that data products are currently assigned to the “safe” back-office where failures in performance are less costly.

数据产品作为构建在业务工作流之上的应用程序层出现。 数据产品在操作设置(例如管理流程自动化,客户支持,法规遵从性)中部署时具有成功的记录。 也就是说,当前将数据产品分配给性能故障成本较低的“安全”后台。

Not every business workflow can enable a data product. I’ve prepared and vetted with a number of enterprise companies a scorecard to qualify business workflows for data product applications. Check it out!

并非每个业务工作流程都可以启用数据产品。 我已经为许多企业公司准备了一个计分卡,并对其进行了审查,以使数据产品应用程序的业务工作流程合格。 看看这个!

数据源 (Data Sources)

Public data or open data is available for everyone to access, modify, reuse, and share. Open data organizations are the counterparts of organizations supporting open source software. Their work empowers citizens and can strengthen democracies, streamline processes and systems in society, government, and private businesses. A few awesome open data sources are World Bank Open Data, Global Health Observatory Data, Google Public Data Explorer, Registry of Open Data on AWS, US Census Bureau.

公开数据或开放数据可供所有人访问,修改,重用和共享。 开放数据组织是支持开源软件的组织的对等组织。 他们的工作赋予公民权力,可以加强民主制,简化社会,政府和私营企业的流程和系统。 几个很棒的开放数据源包括世界银行开放数据 , 全球卫生观察站数据 , Google公共数据浏览器 , AWS开放数据注册处 , 美国人口普查局 。

Private data sources are the backbone of well-differentiated companies like Google, Amazon, and Facebook. A first-mover strategy enables a company to leapfrog in data aggregation games → data gravity. Search results, product/movie recommendations, and social networks improve with data. That’s why established players are here to stay unless we make it plain simple for machine learning systems to share and learn from disparate data sources.Licensing rights for private data get complex. A common problem across the board is that the owner of the data source cannot sub-license data externally. This means that private data can only be leveraged by products owned by the same organization that owns the data. Catch-22? If data was collected according to a license with sub-licensing clauses, this opens up opportunities for commercializing private data outside the parent organization.We have to address the elephant in the room. Across companies, data management practices fall on a broad spectrum. Leading companies set an example by following ethical, privacy, and security rules. Some industries took matters in their own hands and established data privacy standards and frameworks. In healthcare and financial services, data privacy is enforced by regulatory agencies. Consumer industries have to abide by consumer privacy acts. Rule of thumb for everyone and anyone: always de-identify data and license silos of aggregated data as often as possible.

私有数据源是差异化的公司(如Google,Amazon和Facebook)的骨干。 先行者策略使公司能够在数据聚合游戏→数据重力方面实现跨越式发展。 搜索结果,产品/电影推荐和社交网络会随着数据的增长而改善。 这就是为什么除非我们简单地让机器学习系统共享不同的数据源并从中学习,否则成熟的参与者会留下来的原因。私有数据的许可权变得复杂。 全面的普遍问题是数据源的所有者无法在外部对数据进行再许可。 这意味着私有数据只能由拥有该数据的同一组织拥有的产品来利用。 赶上22? 如果数据是根据具有分许可条款的许可收集的,这将为将私有数据商业化到其上级组织之外提供了机会。我们必须解决这个问题。 在整个公司中,数据管理实践涉及广泛。 领先的公司通过遵循道德,隐私和安全规则树立了榜样。 一些行业自行处理事务,并建立了数据隐私标准和框架。 在医疗保健和金融服务中,数据隐私由监管机构执行。 消费行业必须遵守消费者隐私法。 每个人和任何人的经验法则:总是尽可能多地取消识别数据并许可汇总数据的孤岛。

Synthetic data is a saving grace depending on the data product at hand. Computer algorithms have gotten really good at generating synthetic data: be it videos of celebrities or Nature articles, we can fake it all. Similar techniques can be used to generate synthetic data that trains the machine learning models behind a data product. To bootstrap such algorithms with relevant data seeds, companies can set up data donation programs — internal or external- with the proper data use agreement in place.

根据手头的数据产品, 合成数据是一种节省的选择。 计算机算法已经非常擅长生成合成数据:无论是名人视频还是《 自然》杂志的视频,我们都可以伪造。 可以使用类似的技术来生成综合数据,以训练数据产品背后的机器学习模型。 为了用相关的数据种子引导此类算法,公司可以建立适当的数据使用协议的内部或外部数据捐赠程序。

分销渠道 (Distribution Channels)

A product well built is only half the story. Your product is signed and sealed, now it needs to be delivered. A few distribution channels are available for enterprise products. Each distribution channel has implications on the product pricing model and on the overall product strategy (build vs buy vs acquire).

精心打造的产品只是故事的一半。 您的产品已签名并盖章,现在需要交付。 企业产品有一些分销渠道。 每个分销渠道都对产品定价模型和整体产品策略(构建,购买与获取)有影响。

On a final note, data-driven products will require continuous monitoring for quality performance. You might ask why all this scrutiny, humans doing the same task are not monitored 24/7. Let’s just say that humans undergo quarterly training on ethics and are responsible for their actions. Machines act in silence so we need to inquire about their behavior using monitoring scripts. It’s a good practice to monitor product performance and flag corner cases. Start by defining internal policies for failure management, product ethics, and human-in-the-loop review.

最后,数据驱动产品将需要持续监控质量性能。 您可能会问,为什么没有对所有执行相同任务的人员进行全天候24/7监控。 可以说,人们每季度接受一次道德操守培训,并对自己的行为负责。 机器处于静默状态,因此我们需要使用监视脚本来查询它们的行为。 监视产品性能和标记极端情况是一个好习惯。 首先定义内部策略以进行故障管理,产品道德规范和人在回路审查。

翻译自: https://towardsdatascience.com/a-strategy-blueprint-for-data-products-a158ad6bf449

虚幻蓝图数据传递


http://www.taodudu.cc/news/show-4258458.html

相关文章:

  • ue4导入倾斜摄影_倾斜摄影如何和bim结合?倾斜摄影数据怎么导?我来告诉你!...
  • FPS游戏UE4逆向视频教程
  • ad18差分布线,设置差分对
  • JAVA写100以内的偶数和
  • verilog中pullup和pulldown的用法
  • 信号源输出的负载阻抗与输出幅值的关系
  • 阻抗匹配基础知识详解
  • 实用电路:用MOS管模拟的可调功率电阻
  • Xilinx 7系列FPGA收发器架构之硬件设计指导(一)
  • nginx平台初探(100%)
  • 硬件学习(三)电阻作用
  • 单片机c语言小车转圈,用51单片机编写的智能小车全程前进的C程序
  • 初学51单片机制作智能小车心得
  • 51单片机智能蓝牙小车
  • 【51单片机实例】智能小车(一)--------小车的前进、后退和停止
  • 《Excel高手捷径:一招鲜,吃遍天》一第3招 快捷键的妙用
  • DLL load failed while importing _cvxcore解决办法
  • ImportError: DLL load failed while importing qhull:问题解决
  • ImportError: DLL load failed while importing _multiarray_umath: 找不到指定的模块(pyinstaller打包的问题)
  • jupyter notebook出现DLL load failed while importing _multiarray_umath: 找不到指定的模块
  • 修复 yum 坏掉 报错There was a problem importing one of the Python modules 教程
  • Unity-tweak-tool插件
  • GIthub上关于新冠肺炎数据整理的项目汇总
  • IDEA 隐藏窗口标题栏(去掉 Win10 白色标题栏)
  • WGCLOUD在windows部署运行怎么实现隐藏窗口
  • MFC隐藏窗口时解决窗口闪烁问题
  • BeanCurrentlyInCreationException异常分析及解决
  • Another app is currently holding the yum lock解决方法
  • ORA-01940: cannot drop a user that is currently connected 问题解决
  • linux提示Another app is currently holding the xtables lock. Perhaps you want to use the -w option?

虚幻蓝图数据传递_数据产品的战略蓝图相关推荐

  1. integer是值传递还是引用传递_数据值Value传递-高位传递

    立题简介: 内容:数据值Value传递-高位传递: 来源:实际得出: 作用:数据值Value传递-高位传递: 开发环境:Windows10+Visual Studio 2013:: 日期:2019-0 ...

  2. 三个activity之间跳转 数据传递_第二百四十二回:Android中Fragment之间的数据传递概述...

    各位看官们大家好,上一回中咱们说的是Android中Activity之间数据传递的例子,这一回咱们说的例子是Fragment之间的数据传递.闲话休提,言归正转.让我们一起Talk Android吧! ...

  3. netflix 数据科学家_数据科学和机器学习在Netflix中的应用

    netflix 数据科学家 数据科学 , 机器学习 , 技术 (Data Science, Machine Learning, Technology) Using data science, Netf ...

  4. python个人数据脱敏_数据脱敏的处理方法及查询

    [摘要] 关键词:集算器.SPL.数据脱敏.报表 1).数据脱敏是"指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护.在涉及客户安全数据或者一些商业性敏感数据的情况下, ...

  5. 知识产权大数据平台_数据科学家的知识产权

    知识产权大数据平台 Data Scientists use software they didn't write and data they don't own pretty much all the ...

  6. python处理数据可视化_数据整理101:使用Python提取,处理和可视化NBA数据

    python处理数据可视化 由Viraj Parekh | 2017年4月6日 (by Viraj Parekh | April 6, 2017) This is a basic tutorial u ...

  7. api可以主动采集用户数据吗_数据埋点采集的那些事儿

    数据采集是数据分析的基础,而埋点是最主要的采集方式.那么数据埋点采集到底都是哪些事呢?我们主要从三个方面来看:什么是埋点,埋点怎么设计,埋点的应用. 一.数据采集以及常见数据问题 1.1数据采集 数据 ...

  8. 【Flutter】Flutter 混合开发 ( 安卓端向 Flutter 传递数据 | FlutterFragment 数据传递 | FlutterActivity 数据传递 )

    文章目录 前言 一.FlutterFragment 数据传递 二.FlutterActivity 数据传递 三.相关资源 前言 在上一篇博客 [Flutter]Flutter 混合开发 ( 关联 An ...

  9. 数据探查_数据科学家,开始使用探查器

    数据探查 Data scientists often need to write a lot of complex, slow, CPU- and I/O-heavy code - whether y ...

最新文章

  1. RF-LIO:面向高动态场景的紧耦合LiDAR惯导融合里程计(IROS 2021)
  2. 从MSSQL添加对Oracle的链接服务器的存储过程
  3. ITK:过滤器Filter和ParallelizeImageRegion比较
  4. WPF 动态更换图片路径
  5. 如何利用多核CPU来加速你的Linux命令
  6. 中国历史上影响最大的10首诗
  7. POJ 2184 Cow Exhibition
  8. 求职简历介绍html5模板
  9. redis优化查询的两种方式
  10. sql去除字符串中首尾空格
  11. springboot项目中使用spring的xml文件
  12. if else终结者——策略模式
  13. js 如何计算当年清明节日期
  14. 认知计算、大数据及人工智能革命
  15. 堆转存目录/tmp或日志目录/var/log可用空间小于 10.0 吉字节。
  16. 加拿大布鲁克大学计算机科学,布鲁克大学(Brock University)
  17. 华尔街追逐中国机遇,阿里巴巴收盘价创下历史新高
  18. java计算机毕业设计计算机课程在线培训学习管理系统MyBatis+系统+LW文档+源码+调试部署
  19. c语言程序设计书店销售管理系统,C语言课程设计-书店管理系统
  20. 自动气象站解决方案 案例分享

热门文章

  1. 在Linux环境下使用ffmpeg将PCM音频数据编码成aac数据
  2. 2022G3锅炉水处理国家题库及答案
  3. 三星Galaxy S22、三星Galaxy22+和三星Galaxy22 Ultra区别
  4. docker 常用命令(二)——容器命令
  5. Django REST framework(十)路由集routers的使用
  6. B站千万粉丝——老师好我叫何同学
  7. 360极速浏览器显示密码
  8. 图片公式提取至文档word
  9. sendgrid html text,Laravel + SendGrid htmlspecialchars()期望参数1为字符串,给定对象
  10. 哺乳时宝宝一边吃奶,另一边却自动流出来,这是怎么回事?