对于企业的业务人员,特别是数据科学家人群来说,Informatica的Intelligent Data Platform不仅是一个智能化的大数据预处理工具,而且可以像业务系统一样为企业带来直接的价值。

  互联网企业通常会强调细节和微创新,把产品的某一项功能做到极致,借此牢牢吸引大量用户。但是企业级厂商则不同,它们更倾向于将产品平台化。平台化的好处是可以把尽量多的功能集成在一起,方便部署与管理,而且可以借平台屏蔽底层架构的复杂性。软件厂商尤喜平台化,比如数据保护厂商有数据保护和统一管理平台,大数据产品厂商有大数据处理通用平台等。

  今年5月,独立企业数据集成软件提供商Informatica在一年一度的Informatica World上发布了Intelligent Data Platform。作为下一代数据平台,Intelligent Data Platform可以在正确的时间提供正确的数据,并通过铺设一条虚拟数据的高速公路,将人员、位置、设备以更加智能化的方式紧密联系在一起,为大数据应用提供更好的支持。

  提升智能化水平

  Intelligent Data Platform包含三大核心:第一,Informatica Vibe虚拟数据机。Vibe是一种嵌入式的数据处理引擎,可以提供针对任何位置、格式或来源的数据的普遍的访问能力,且支持客户“一次映射,多次部署”;第二,数据基础设施。数据基础设施层能够在任何规模的环境中系统、连续地交付干净、安全、互连的数据,从部门级到企业级,从事务数据到大数据,从内部部署到云端皆可;第三,数据智能。Informatica独创的数据智能层将为客户重新定位数据基础设施层所创建的元数据,从而提高数据的可见性,改善决策过程,并提升运营的智能化水平。

  Intelligent Data Platform能够以正确的方式将正确的数据传递给相关的人员或发送到正确的位置。Informatica公司大中国区首席产品顾问但彬归纳了Intelligent Data Platform的主要功能:Informatica可以在正确的时间提供最高质量的正确数据;Informatica能够将数据交付到正确的位置,包括企业内部或云端;Informatica 可以将数据交付给正确的人员,无论是IT人员、分析师、数据管理员,还是业务用户;Informatica可以将数据交付给正确的设备,包括联网设备或自动化决策系统;Informatica能以正确的方式交付数据,并确保数据安全可靠、经过授权且已获得保护。

  Intelligent Data Platform在Informatica World 2014大会上一发布,即受到了与会的Informatica的用户的普遍欢迎。Informatica在大会上展示了一系列Intelligent Data Platform的应用案例,包括自助服务数据集成(Springbok 项目)、数据导向型安全管理(Secure@Source 项目)和360 度全方位业务实体(MDM 10)等。目前,Intelligent Data Platform还没有完全商品化。之所以在Informatica World 2014提前发布Intelligent Data Platform,Informatica是想在产品正式发布前先听听用户的反馈,然后根据用户的反馈进一步对Intelligent Data Platform进行完善,再择机发布商用化的版本。这种在产品正式发布前先与客户进行交流已经成了Informatica开发新产品的一个惯例。

  为数据科学家服务

  有业内人士指出,大数据已经发展到一个新的阶段,仍然按照传统商业智能(BI)的思路和方法解决大数据的问题已经不合时宜。传统BI采用包括数据采集、存储、处理、分析和呈现等环节在内的纵向数据处理方式,而新的大数据处理和利用方式则是分布式、扁平化的。

  传统的数据处理方式是模式化的,用户需要什么,厂商就提供什么样的解决方案,但这些解决方案通常是固定的、不能灵活扩展的。如果用户提出了新的要求,想在原有系统中增添新功能或进行修改会十分麻烦。而Intelligent Data Platform可以解决这一问题,因为它是一个智能化的平台,可以为集中到“数据湖”中的各种类型的数据建立相关性,然后再提供给业务应用或通过接口与分析工具衔接。

  在进行大数据处理时,传统的数据库和分析技术还有用吗?但彬认为,传统技术与新技术之间不是谁对谁错的问题,而是要针对不同的应用选择适合的技术。比如,银行常见的商业行为分析仍然可以采用数据库技术,而一些预测性的大数据挖掘项目则要采用新的大数据处理技术,呈现数据之间的关联性。

  “Intelligent Data Platform给用户带来的最大改变是解放了IT人员。原来IT人员既要做业务也要搞技术。未来,我们希望IT人员可以把工作重心放在做开发和系统集成上,而业务人员可以基于Intelligent Data Platform将业务描述得更清楚,并且可以自动生成一些规则。”但彬介绍说。

  支撑Intelligent Data Platform的底层技术是Informatica的Vibe虚拟数据机,它也是所有Informatica产品的基础引擎。在这个引擎之上,Informatica可以帮助客户进行数据集成,提升数据质量。Intelligent Data Platform是一个集成化的平台,从IT的角度讲,其实施肯定会存在一些挑战,但它确实能给企业的业务带来更多价值。“IT人员可以完成数据的抽取和存储,然后提交数据用于分析。”但彬告诉记者,“但是企业的业务人员或数据科学家可以标记数据的质量、发现问题,从数据中发现更多有价值的东西。所以,我们希望业务人员能借助Intelligent Data Platform更多地接触和利用数据,而不仅仅是IT人员。”

  在推出Intelligent Data Platform的同时,Informatica还提出了“数据湖”的概念。所谓数据湖,就是将不同来源的数据存放在一起,但并不是将未经处理的数据简单地堆放在一起,而是要将这些数据进行预先处理,建立数据之间的联系,这更有利于日后的大数据处理。

  大数据是业务系统

  传统的数据处理与分析都是IT人员的事,因此IT人员必须掌握丰富的数学知识和计算机技术。但是,大数据的最终目标是为企业业务和应用服务,而IT人员通常不太了解业务,这就造成了大数据技术与应用的脱节。但彬表示,Intelligent Data Platform最理想的使用者是企业的业务人员或数据科学家,因为他们更了解业务需求,可以利用Intelligent Data Platform更好地解读大数据分析结果。

  大数据处理系统是一个IT工具,还是业务系统呢?不同的定位决定了大数据处理系统的不同“命运”。“中国的很多客户通常将大数据处理系统当成一个IT工具来使用。从IT运维的角度来看,IT人员只负责保证系统的正常运行、开关,虽然偶尔也会编写一些代码,但毕竟不能从业务的角度充分利用大数据处理系统。在这种情况下,大数据处理系统只是一个IT支撑和保障系统,而不能直接给企业带来商业价值。”但彬介绍说,“如果将大数据处理系统当成一个业务系统来对待,那么业务人员就可以利用这个平台更好地挖掘数据,给业务带来直接的价值。”

  据记者了解,一个具有单一功能的大数据产品可能需要几十万元,而一套比较完善的大数据整体解决方案的价格可能达到上千万元。如果不能充分发挥大数据产品应有的价值,那么对企业来说无疑是一种巨大的浪费。但彬表示:“如果企业只把大数据产品当成一个IT工具,那么可能不会持续地对产品进行升级,也不会购买厂商的专业服务,一旦遇到解决不了的问题,就可能轻易放弃。”

  Informatica曾经带国内某银行的技术人员去美国与Informatica的客户交流。让但彬吃惊的是,美国客户参与交流的全是公司的业务人员,讲的全是业务系统如何运行。参与交流的中国客户全是技术人员,想了解的是美国企业如何构建一个大数据系统,而不太关心系统如何运行和如何给企业带来价值。如此强烈的反差给中国的用户提了一个醒:第一,部署大数据应用应该以业务为中心和出发点;第二,企业最好自己主导大数据系统的部署与应用,因为企业最了解自身的业务需求,可以更充分地利用大数据平台,提高数据分析的效率。

大数据产品不仅仅是IT工具相关推荐

  1. 定义大数据:不仅仅是海量结构性数据

    文章讲的是 定义大数据:不仅仅是海量结构性数据, 大数据如果仅仅是海量的结构性数据,那么解决的办法就比较的单一,用户通过购买更多的存储设备,提高存储设备的效率等解决此类问题.然而,当人们发现数据库中的 ...

  2. 李永辉:IBM大数据产品及实践路线图

    文章讲的是李永辉:IBM大数据产品及实践路线图,近日,主题为"行胜于言"的2013 IBM大数据与分析高峰论坛在北京举行,会上正式发布了大数据分析加速技术BLU Accelerat ...

  3. 天冕数据开发平台通过信通院“大数据产品能力评测”

    近日, "大数据产品能力评测"评审会圆满结束. 评审会专家由来自中国信息通信研究院(以下简称"中国信通院").北京航空航天大学.中央财经大学.北京邮电大学.北京 ...

  4. 第一章 阿里大数据产品体系

    1.大数据基础知识 什么是数据分析? 数据分析是基于商业目的,有目的的进行收集.整理.加工和分析数据,提炼有价值信息的过程. 数据分析流程:需求分析明确目标➡️数据收集加工处理➡️数据分析数据展现➡️ ...

  5. 【赵渝强老师】阿里云大数据ACP认证之阿里大数据产品体系

    阿里大数据产品体系是基于阿里云飞天平台上的数据处理服务.主要分为阿里云大数据基础产品和阿里云数加平台,其产品架构图如下所示: 一.阿里云大数据基础产品 1.云数据库--RDS(ApsaraDB for ...

  6. 基于云原生的大数据产品前端实践 | 第七期图文直播文字回放

     点击"蓝字"关注我们 2月5日晚,智领云第七次社群图文技术直播如约而至.本次直播由智领云Web开发经理陈磊为大家分享了<基于云原生的大数据产品前端实践>主题内容,其中 ...

  7. 山东双数认证大数据产品登记条件

    1.评估的大数据产品及服务应符合我国相关标准和技术规范. 2.参与评估的产品应是本单位享有著作权或者经过著作权人或者其他权利人许可其生产的大数据 产品,产权清晰无纠纷. 3.平台及工具类产品应通过具备 ...

  8. 大数据产品经理python_大数据岗位要求之数据产品经理

    继上篇介绍了数据分析师岗位的要求,这篇介绍数据产品经理的岗位要求(距上篇的更新时间有点久),还是先从几个大厂数据产品经理原始的岗位要求看起. 滴滴 1.本科以上学历: 2.2年以上数据分析.数据产品等 ...

  9. 读书笔记丨《数据产品经理修炼手册:从零基础到大数据产品实践》丨DAY5

    内容:第5章 大数据分析平台实践 时间:2022年8月7日 5.1 大数据分析平台的前世今生 5.1.1 大数据分析平台构建的背景         构建一个大数据分析平台,结合多个业务系统,从中抽取海 ...

最新文章

  1. 外部排序归并排序 败者树
  2. python打包_cx_freeze
  3. springboot配置文件加载位置
  4. WebRTC媒体服务器开源项目介绍
  5. win环境下,django+postgresql配置
  6. vue-router之路由属性配置说明
  7. mysql show profile详解_SQL 性能分析利器 show profile
  8. Pytest框架集成Allure定制测试报告详解(一)
  9. B2B2C商城系统源码 多商户商城源码 Wap+App+小程序源码
  10. VMware Cloud Director Availability 4.3 下载 | 灾难恢复和迁移 | DRaaS
  11. extjs实现选择多表自定义查询功能————前台部分(ext源码)
  12. 猴子搬香蕉 php,猴子搬香蕉
  13. CVE-2017-11176: A step-by-step Linux Kernel exploitation (part 4/4)
  14. C#操作Oracle数据库中文乱码 US7ASCII字符集 (解决方案)
  15. 迁移学习_迁移学习简明手册(王晋东)_阅读笔记5-6
  16. 通过JAVA代码,将文字生成图片
  17. 【连载】draft伦理
  18. Win10 误删winsock注册表修复。 winsock.reg
  19. kafka 可以脱离 zookeeper 单独使用吗
  20. 微信windows版_微信悄悄更新,这个烦人的功能限制,终于被取消

热门文章

  1. 华为总裁任正非谈企业管理:正确的方向来自于妥协
  2. linux ”我的草稿“
  3. mysql为什么每天0点就装东西_MySQL的详细安装教程
  4. 一位资深程序员面试Python工程师的岗位心得和历程
  5. Python爬虫,利用scrapy来编写一个爬虫
  6. 还在为学习Python没有路线发愁吗?
  7. c# wpf listbox 高度_农村太阳能路灯厂家报价表2020(不同高度)
  8. @aspect注解类不生效_springboot:@Transactional注解 VS @Service注解
  9. linux红帽网页中文乱码解决,【linux学习笔记】安装redhat时中文显示乱码(小方框)解决方法...
  10. cic曲线是什么_贝塞尔曲线基本用法