大数据的成长路径一定是个长期成长过程,实用分析工具与先进分析理念,真正释放数字化分析的力量,由人类轨迹产生的数据,与机器自动产生的数据得出洞见,从管理决策推导运营方案,最终实现数据价值提升。无论是为促销产品还是作为战略目标,大数据已然成为很多公司和机构过度使用的术语。笔者认为,数据基本就是两类,一类是人类轨迹产生的数据,另一类机器自动产生的数据。这两类数据构成了我们今天的大数据多结构化数据源。大数据不仅要关注实际数据量的多少,而最重要的是关注在大数据的处理方法,让数据产生巨大的创新价值。这也就是为何以谷歌为代表的技术创新类的公司会在未来成为全球市值最高的公司的核心原因之一。

实现工业4.0或中国制造2025的前提之一是构建智能工厂,其核心要素包括了信息物理系统(CPS),物联网(IOT),智能认知,社交媒体,云计算与移动,以及M2M。智能工厂构成了工业4.0的一个关键特征。智能工厂将从现在通过中央控制中的模式转向通过自行优化和控制其制造流程来实现。

柔性生产的三个方面

1.人、机器和资源如同在一个社交网络里自然地相互沟通协作。

2.生产出来的智能产品能够理解自己被制造的细节以及将如何用。它们积极协助生产过程,回答诸如“我是什么时候被制造的”“哪组参数应被用来处理我”“我应该被传送到哪”等等问题。

3.机器和产品之间的数据传输将通过使用微处理器、存储装置、传感器和发送器来实现。这些装置将被嵌入至几乎所有可想象的机器、待加工产品、材料、智能工具和用于组织数据流的新型软件,由此实现产品和机器的相互通信并和交换数据。

大数据在智能工业的特征

1.处理方法比数据本身值钱

无论是为促销产品还是作为战略目标的方式,大数据已然成为很多公司和机构过度使用的术语。2012年高德纳(Gartner)给出德大数据定义里面,特别强调大数据是多样化信息资产,不仅关注实际数据,而最最重要的是关注大数据处理方法。数据量大还是量小本身并不是判断大数据价值的核心指标,而数据的实时性(velocity)和多元性(variety)应该对大数据的定义和价值更具直接的影响。

2.多结构化数据:包含人类和机器数据

我们大多数人会认为大数据包含了非结构化数据与结构化数据。我更提倡大数据是“多结构化数据”的说法,无论是自由文本还是关系数据库等,大数据可以由人类产生的数据足迹与机器自动生产的数据两大板块形成。大数据的工具和技术能够为不同的结构化数据服务。在信息化与工业化融合的过程与商业活动中,我们需要加强机器数据的采集,分析,并且把此项工作作为智能制造的核心工作之一。

3.大数据的机器数据让我们的业务变得透明

在现代工业供应链中,随着大数据应用的普及,我们可以感受到了从采购,生产,物流与销售市场都是大数据的战场。大数据可以帮助我们实现客户的分析和挖掘,它的应用场景包括了实时核心,交易,服务,后台服务等。通过的载体包括了手机,传感器,穿戴设备,3D打印机和平板电脑等。传感器数据属于工业大数据类别之一,从这些机器数据中,我们可以保障生产,满足法律法规的要求,提升环保,改善客户服务。通过帮我们找到已经发生的问题做好协助预测相类似问题未来重复发生的几率与时间。

  大数据的挑战

1.用理性了解大数据

作为与工业4.0联系最为紧密的两化融合任务,中国制造2015其核心是生产过程、产品的智能化,以及互联网与制造业的融。数据的灵活处理性成为第一个焦点。随着传统数据库(database)和数据仓库(datawarehouse)的运行越来越缓慢,并很难满足企业业务的发展需要,数据的灵活性就成为了推动大数据技术发展的一个重要推动力。

2.从Hadoop走向数据湖

2015年的大数据领域被看作是“数据湖(datalake)”与“数据藻泽”的状态之争。无论学术杰如何去诠释,其核心是强调一种基于对象的数据存储方式将收集来的数据以其最原生的格式(多结构化的)存储下来留作日后使用。“数据湖”具有很高的价值定位,它代表了一种可扩展的基础架构,非常经济且超级灵活。

3.自主大数据数据服务成为主流

随着大数据工具和服务的发展,2015年,IT行业将逐渐缓解发展瓶颈的局面,许多商业用户和数据科学家将会借助相关工具和服务访问大量数据。自助服务大数据将成为IT行业的一种趋势,它允许商业用户可以通过自助服务接触大数据。自助服务还可以帮助开发者、数据科学家和数据分析师直接进行数据探索和处理工作。当我们了解大数据的时候,业务的价值和IT的成本是我们主要衡量未来IT的标准,业务价值驱动大数据创新。Hadoop不再成为我们讨论的大数据主题。我们需要了解更多的是业务创新,数据变现和业务场景的探索。

下一代的大数据体系——数据湖

每个数据项都应有清楚的追踪,可追溯其源系统以及该数据项产生的时间等信息。2010年JamesDixon以此理念,创造了数据湖(dataLake)这个术语,当时他打算将数据湖泊作为单一数据源来使用,而多数据源将形成“水景园”。尽管还是最初的构想,如今最普遍的应用是将数据湖泊当做许多数据源的结合。现有数据仓库在分析能力的缺失,业务对数据获取能力的提升,高级分析方法的创新是一种必然。

数据湖泊是近十年出现的术语,用来描述数据世界中,数据分析管道的重要组成部分。作为一个信息系统,数据湖泊是大型的基于对象的存储库,数据以其原始格式存储。通过全面的监控和分析,通过数据的分析模型的建立,学习,模拟,行动,最终实现内容认知的智能。有并行体系以及无需移动数据即可对数据进行计算操作的明显特点。

特点1:数据湖泊是一个并行体系,能够存储大数据

数据湖泊的每个数据元素都有独特的标识符,并有一组扩展的元数据标签。

数据湖泊以数据源提供数据时的原格式(不论原格式是什么)存储原始数据。没有预设的数据模式,每个数据源都可以使用任何模式。由消费者根据自己的目的来理解数据。

特点2:数据湖体系无需移动数据即可对数据进行计算操作

通常数据仓库一方面要清理,一方面还要聚合数据,从而使分析更加容易。但科学家往往也反对这点,因为聚合意味着丢弃数据。你不知道今天或者几年以后哪些数据会有价值,所以数据湖泊应包含所有数据。数据湖泊使用平坦架构存储数据。这个理念是建立一个单一存储区,用来存储组织内任何人员可能需要分析的所有原始数据。通常人们使用Hadoop对湖泊内的数据进行各种操作,但这个概念比Hadoop要宽泛的多。

总结

大数据技术自身在快速的发展,从1.0到大数据3.0的数据湖时代,我们要理性的看待大数据,在关注数据量的同时,应该更加重视数据分析的能力和方法。笔者认为,实用分析工具与先进分析理念,真正释放数字化分析的力量,由人类轨迹产生的数据,与机器自动产生的数据得出洞见,从管理决策推导运营方案,最终实现数据价值提升。

业界有很多大数据的技术公司提供不同的技术,其中也包含了一大堆的开源软件开发出来的。大数据的成长路径一定是个长期成长过程。在不同的阶段,来打造不同的IT能力,我们倡导的是开放式大数据架构。不仅仅为大的数据集服务,同时企业中业务人员有很多小数据集的分析和探索。在很好满足业务的不同需求下,大数据一定是一种混搭技术,利用现有的IT投资来达到整个回报的最大化。特别在中国智能制造2025的变革中,数据湖不会是数据仓库和BI平台的终结者,但数据湖一定是未来企业数据技术(DT)的核心纽带,成为引导中国制造2025变革的数字宠儿。

本文转自d1net(转载)

中国制造2025变革,背后的大数据来龙去脉相关推荐

  1. 中国制造2025背后的大数据作用

    实现工业4.0或中国制造2025的前提之一是构建智能工厂,其核心要素包括了信息物理系统(CPS),物联网(IOT),智能认知,社交媒体,云计算与移动,以及M2M. 智能工厂构成了工业4.0的一个关键特 ...

  2. 51信用卡孙海涛:信用卡账单背后的大数据 | 万物互联创新大会

    11月13日,以"大数据与智能时代"为主题的第二届万物互联创新大会在杭州召开.当日下午,连续创业者."51信用卡管家"的创始人兼CEO孙海涛为大会带来了题为&l ...

  3. 中国制造2025与机器人——苏大机电学院院长谈机器人发展趋势

    苏州小样社区正式开幕,苏州大学相成机器人与智能装备研究院也强势入驻. 在总理"万众创新,全民创业"的号召下,创业的热情也空前的高涨,而如何给创业者提供一个良好的创客空间就显得尤为重 ...

  4. 90%人工智能公司都亏损?AI盈利难背后的大数据门槛

    AI落地场景在不断增多,但赚钱依旧艰难. 根据亿欧报告显示,2018年全年,近90%的人工智能公司处于亏损状态,而10%赚钱的企业基本是技术提供商.从谈概念.讲技术,到拼场景.抢落地,建立在大数据基础 ...

  5. 双11奇迹背后的大数据平台,不喧哗,自有声!

    00:02:05 成交额超100亿 00:57:56 成交额超666亿 01:47:26 成交额超1000亿 15:49:39 成交额超1682亿 22:28:37 成交额超2000亿 2018年双1 ...

  6. 阿里80亿贷款细节曝光 并购背后图谋大数据

    阿里在移动互联入口的一系列收购背后,更隐藏着马云在大数据上的布局马云卸任CEO之前的一周,阿里巴巴集团(以下简称阿里巴巴)与9家银行签署了80亿美元的融资贷款.这是继去年4笔总额为40亿美元的贷款后, ...

  7. 智慧城市的背后是大数据的深度挖掘和利用

    原文链接 摘要: 智慧城市主要以信息技术为支撑,发展智慧城市的目的是为了科学化地决策,提高管理效率,同时也为了资源配置的高效和集约.可见智慧城市的背后,实质是大数据的深度挖掘和利用.由国家政策层面传递 ...

  8. 带你走进微博背后的大数据原理:微博推荐算法

    在介绍微博推荐算法之前,我们先聊一聊推荐系统和推荐算法.有这样一些问题:推荐系统适用哪些场景?用来解决什么问题.具有怎样的价值?效果如何衡量? 推荐系统诞生很早,但真正被大家所重视,缘起于以" ...

  9. 百度推荐引擎及其背后的大数据架构揭秘

    在互联网世界中,什么技术代表着人工智能被广泛应用的未来?2012年12月22日,在以"推荐系统实战"为主题的百度技术沙龙上,百度推荐与个性化部高级工程师们与来自亚马逊.豆瓣网.清华 ...

最新文章

  1. MongoDB数据库(一:基本操作)
  2. clickhouse安装包_ClickHouse单机部署
  3. 关于vc中Warning: skipping non-radio button in group的警告
  4. has_a php,PHP has encountered a Stack overflow问题解决方法
  5. 重置一个画面大小的方法
  6. php mysql 框架 php5.2_简单快速安装Apache+PHP+MySql服务环境(四)—— 将php版本升级到7.2...
  7. fetch ajax cros,由 Fetch 跨域 看 CORS
  8. 游戏开发中的数学和物理算法(13):点积和叉积
  9. selenium webdriver 学习总结-元素定位
  10. 杭州云栖大会10月起航,这里有一份最全的大会剧透
  11. protues仿真——元件改造
  12. 金山文字和Word中的格式刷更顺手(转)
  13. 【fake_useragent】网络爬虫获取随机User-Agent
  14. 群晖万兆文件服务器,NAS进阶 篇三:2019年最具性价比的NAS硬件是什么暨黑群晖万兆搭建经验介绍...
  15. 燕山大学计算机二级加综测吗,燕山大学大学生创业协会2018至2019季学期综合测评证明(图)...
  16. Instagram第三方接入
  17. 烤薯条的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告
  18. 举着一片片小小柔柔的叶子
  19. 执行service iptables status时报错
  20. 支付宝手机唤起app支付

热门文章

  1. linux中top和ps的内存区别,linux - top与ps间的区别
  2. 表格外粗内细怎么设置_金游艇复刻机芯-N厂灰游艇价格 | 复刻表评测
  3. php 有子目录,php列出目录中所有子目录的实现代码
  4. bigdecimal 保留两位小数_Python的保留小数及对齐
  5. 3d打印主要的切片参数类型_3D打印机切片参数详情说明
  6. linux物理内存地址与iomem,一种Linux系统物理内存镜像文件分析方法_4
  7. Android Studio-------添加按钮
  8. 线程池优化之充分利用线程池资源
  9. (三)图像转灰度图Python实现
  10. html图片平移,CSS3 按钮悬停时背景图片平移入场