当前,我们正在加速进入数字经济时代。根据联合国《2019年数字经济报告》的统计,数字经济的规模估计占全球生产总值的4.5%~15.5%,而中国和美国是引领世界数字经济发展的核心。而2018年,中国数字经济规模超过30万亿元、占GDP比重达34.8%,已经成为中国经济增长的新动力。数据,正在深刻改变全社会的生产和生活。

正如同石油时代有社会化油气基础设施、电力时代有社会化电力基础设施,数据作为数字经济的新能源,同样也需要社会化数据基础设施。作为一种新的社会公用资源,数据基础设施是涉及经济、技术乃至社会发展的宏大命题,如何以统一标准建设全社会统一的数据基础设施,需要各方的共同努力,当然其中也包括由华为发起的鲲鹏计算产业联盟。

在2019年11月19日的首届全球数据基础设施论坛上,中国信息通信研究院与华为合作发布了《数据基础设施白皮书2019》,同时华为面向鲲鹏计算产业启动了数据基础设施战略并推出了数据虚拟化河图引擎(HetuEngine)。河图引擎具备“一个入口、一个目录、一份数据、统一安全”四大核心能力。华为同时宣布将于2020年6月开源河图引擎内核,方便开发者定制化开发。

华为Cloud & AI产品与服务总裁侯金龙在首届全球数据基础设施论坛上表示,“大禹得河图后始见清明”,即大禹通过河图掌握河流山川复杂的地形地貌,顺利完成治水大业,而河图引擎的寓意则为全社会实现治“数”大业。

数字经济催生新数据基础设施

(华为Cloud & AI产品与服务总裁侯金龙)

GIV2025报告显示,到2025年,全球将产生180ZB数据。而世界经济论坛认为,到2020年全球数据总量也不过44ZB,也就是说未来5年全球数据总量要翻至少4倍。5G、IoT、自动驾驶、4K/8K视频等新技术的出现,持续推动着数据增长,相应要求强大的数据流动能力。数据已经成为数字经济时代的生产要素,而且是最核心的生产要素,数据甚至被认为已经超过石油的价值。

就像石油经济时代有“采-运-炼-储-用”一整套完成的数据基础设施一样,数字经济时代也需要面向海量数据的“采-存-算-管-用”数据基础设施。然而,自全球开始进入数字经济时代以来,海量数据虽然蕴含巨大的价值,也带来了前所未有的挑战,数据“存不下、流不动、用不好”成为了各行业数据应用最普遍的难题。

在数据“存不下”问题方面,由于当前的存储系统多为传统架构以及成本等原因,仅有不到2%的企业数据被保存。“存不下”特别表现为存储扩展性不足、存储协议类型单一、存储成本高昂。在数据“流不动”问题方面,体现在由来已久的数据孤岛难题,主要是应用孤岛、管理孤岛和地理孤岛等数据三孤岛,而产生数据三孤岛的根本原因在于企业在建设数据基础设施时会选择不同的计算资源、网络资源和存储资源来满足不同诉求,相应形成了算力墙、网络墙和介质墙等资源三堵墙。“用不好”则指的是大量数据未存储、找不到数据、谁对数据负责等问题导致数据供应不足,无法释放数据价值。

《数据基础设施白皮书2019》指出,越来越多的企业已经意识到,数据基础设施是数字经济成功的关键,而数据“存不下、流不动、用不好”等问题也促成了各行业积极构建新型数据基础设施,加速实现数据价值变现。数据基础设施的范围应涵盖接入、存储、计算、管理和数据使能五个领域,通过汇聚各方数据,提供“采-存-算-管-用”全生命周期的支撑能力,构建全方位的数据安全体系,打造开放的数据生态环境,让数据存得了、流得动、用得好,将数据资源转变为数据资产。

新的数据基础设施是传统IT基础设施的延伸,以数据为中心,服务于数据,最大化数据价值。数据基础设施包括数据存储、数据处理、数据管理系统、数据虚拟化引擎等,具备融合、智能、开放三大特征。

新一代数据基础设施

侯金龙在首届全球数据基础设施论坛上强调,针对当前全社会面临的数据基础设施挑战,华为希望希望对数据的采、存、算、管、用实施端到端的整合和优化,让数据在全生命周期内更好用,数据的每比特发挥价值最大,数据的每比特成本最优!

为实现这个追求,华为打造了融合、智能、开放的数据基础设施,让数据系统从孤立走向融合,从复杂走向智能,从封闭走向开放。而在这个过程中,首先就要建立生态联盟,借助全生态的力量,共建一个能够造福整个社会的具有一致架构的公共数据基础设施,这就是华为推动建设鲲鹏计算产业生态的初衷。2019年9月19日华为基于“鲲鹏+昇腾”双引擎正式全面启航计算战略,宣布开源服务器操作系统、GaussDB OLTP单机版数据库,开放鲲鹏主板,通过硬件开放、软件开源、使能合作伙伴,推动鲲鹏计算产业生态的发展壮大。

鲲鹏计算产业是指华为与产业合作伙伴携手,共同为各行各业提供基于鲲鹏和昇腾处理器的领先IT基础设施及行业应用,包括PC、服务器、存储、操作系统、中间件、虚拟化、数据库、云服务及行业应用等。华为作为鲲鹏计算产业的成员,聚焦于发展鲲鹏和昇腾处理器等核心能力,通过战略性、长周期的研发投入,吸纳优秀人才和先进技术,为产业提供绿色节能、安全可靠、极致性能的算力底座;而上下游厂商基于鲲鹏和昇腾处理器发展自有品牌的产品和解决方案,与系统软件及行业应用厂商一起打造有竞争力的差异化解决方案。

(数据基础设施架构图,来源:《数据基础设施白皮书2019》)

华为新一代数据基础设施以及推出河图引擎,进一步丰富了鲲鹏计算产业的方案和技术能力。华为数据基础设施包括数据存储、数据处理、数据管理系统、数据虚拟化引擎等,“融合、智能、开放”是华为新一代数据基础设施的重要关键词。其中,“融合”指的是基于华为在存储、数据库、大数据等技术领域的突破,打破“存储内部系统墙”、“数据库与存储链路墙”、“大数据与存储配置墙”、“数据库与大数据协同墙”这四堵墙,让数据融合更彻底,帮助客户实现TCO降低30%以上、数据访问和处理性能提升2倍、分析效率提升100%。

“智能”指的是基于AI芯片、存储和华为云的三层架构,通过云上云下结合、云上训练和云下推理,让系统越用越快、越用越省。其中,依托昇腾处理器的AI能力,自动学习和识别IO流,提升Cache预取命中率,系统整体性能提升20%;依托鲲鹏处理器的多核算力,根据不同的数据类型,实时优化数据缩减算法,TCO降低25%;结合华为云自身大规模运营经验,包括提前14天预测硬盘故障,提前60天预测性能瓶颈,提前365天预测容量不足,其中30%的故障可以自我修复等。

“开放”指的是针对找数难、取数难、用数难的问题,推出数据虚拟化引擎HetuEngine,屏蔽数据类型差异、地域差异、语法差异,让数据治理、使用简单。HetuEngine通过“一个入口、一个目录、一份数据、统一安全”四大核心能力,屏蔽数据基础设施的复杂度,让伙伴像使用“数据库”一样使用“大数据”,可复用现有的生态、工具和技能,提升开发效率2到10倍。

简单的理解,HetuEngine就是对各种数据库和大数据存储文件中数据的进一步抽象,“一个目录”可实现数据全域共享、打破数据孤岛,“一个接口”统一SQL接口、降低开发成本,“一份数据”让数据零搬迁、提升时效性,“统一安全”完整保护数据、保障安全开放。HetuEngine引擎可对底层各数据中心的RDBMS、HDFS、ElasticSearch、Redis、In-Memory DB、Kafka等进行统一的数据管理和治理,而将于2020年6月上线的openHetu为开源版的内核,即把华为HetuEngine的能力向全社会开放扩散,进而上升为全社会的数据基础设施标准,相当于智能社会数据管理的“操作系统”,向上支撑智慧政务、智慧金融、智慧交通等智能社会应用。

展望2020年,马上就要进入全球每年都要递增一个2020全年数据总量的新常态,这对数据基础设施的建设提出了极高的要求。《数据基础设施白皮书2019》指出,成长中的数据基础设施,其稳定性和先进性将深刻影响企业数字化转型的效果和进程。进一步,每个企业的数据基础设施也将融入一个全社会共享的数据基础设施,因此华为和鲲鹏计算产业生态所推进的数据基础设施无疑将对全社会数据基础设施标准产生深远影响。(文/宁川)

数据基础设施加速数字经济,“河图”引擎推进鲲鹏计算产业相关推荐

  1. 华云数据:做数字经济时代的信创云计算专家

    ​2021年,被视为信创云的元年 从外部政策层面看,"十四五"期间,信创产业将进入加速发展阶段,信创从政府等领域蔓延到金融.运营商等行业,进而向着更广阔的市场发散.据中国电子学会预 ...

  2. 大数据助推数字经济时代到来

    当前,大数据.云计算.物联网.人工智能.区块链等新技术不断显现,人类加速进入数字经济时代.此前在贵阳召开的中国国际大数据产业博览会上,与会专家表示,大数据正在重塑传统产业结构和形态,催生众多新产业.新 ...

  3. 【产业互联网周报】华为面向鲲鹏计算产业启动数据基础设施战略;阿里王坚当选中国工程院院士...

    关注ITValue,看企业级最新鲜.最具价值报道! [产业互联网周报是由钛媒体TMTpost发布的特色产品,将整合本周最重要的企业级服务.云计算.大数据领域的前沿趋势.重磅政策及行研报告.] 产业互联 ...

  4. “鲲鹏新时代、中原更出彩” 2020数字经济峰会暨黄河鲲鹏生态发展大会召开

    2020年9月28日,以"鲲鹏新时代.中原更出彩"为主题的2020数字经济峰会暨黄河鲲鹏生态发展大会在郑州黄河迎宾馆如期举办.本次峰会由河南省政府主办,与全国鲲鹏业界的领军人士,就 ...

  5. 华云数据荣登“2021数字经济产业TOP100”榜单

    ​12月22日,在2021重庆(涪陵)数字经济高峰论坛上,创业黑马联合重庆市涪陵区人民政府.<上海证券报>.<证券日报>.投资界.融资中国等权威媒体,与63家数字经济投资机构投 ...

  6. Zerohm:新一代区块链基础设施赋能数字经济

    Zerohm定位为支持智能数字资产发展的价值互联网基础网络,致力于为数字经济提供区块链化的全套解决方案,赋能互联网和实体经济的发展,目前已经提出引领业界的单链分层体系架构,以及多链生态构建方案,并在性 ...

  7. 江苏区块链产业发展试点公示 点燃苏州数字经济新引擎

    近日,江苏省工信厅公示了2022年江苏省区块链产业发展试点示范项目名单.苏州市8个项目入选,占比近40%,位居全省第一. 此次公示的江苏省区块链产业发展试点示范项目中,集中在苏州相城区.苏州工业园区和 ...

  8. 杨澜对话华为周跃峰:发展数字经济,存储技术是关键

    2020年5月28日,针对海量数据存储场景,华为面向全球发布了全新一代OceanStor存储Pacific系列新品.发布会上,嘉宾主持.阳光媒体集团董事长.知名媒体人杨澜,和华为数据存储与机器视觉产品 ...

  9. 星辰天合参加首届数字驱动创新峰会 强调以 SDS 加速数据基础设施建设

    5 月 11 日,2023 数字驱动创新峰会在北京新世纪日航饭店隆重举办.作为赛迪网.<数字经济>杂志社首次主办的数字驱动峰会,本届峰会以"新要素.新生产.新经济"为主 ...

最新文章

  1. (Android 即时通讯) [悬赏],不管是谁发现一个漏洞奖励人民币1000元!
  2. Keil宏定义和如何知道单片机资源名称
  3. 输出值(4)输出值的应用
  4. swoole 简单的聊天室
  5. hibernate3.4+struts1.3分页封装,有兴趣者可以看一下
  6. 正确使用 SharePoint 对象避免内存泄漏(续)
  7. 在 Centos7 用Jexus服务器 运行.Net Core 只需几步
  8. python有趣的面试题_一道3行代码的Python面试题,我懵逼了...|python基础教程|python入门|python教程...
  9. Vue Router 4 快速入门
  10. 泛微oa系统什么框架_泛微移动办公OA系统走进江苏国曜信息科技有限公司
  11. Linux总结篇 linux命令 虚拟机 - (二)
  12. 计算机显示器模糊,显示器模糊,我来教您电脑显示器模糊怎么办
  13. 无线通信中存在的远近效应、多普勒效应、多径效应以及其应对策略
  14. C语言实现wav文件的读写
  15. networkx笔记
  16. 智能灯杆网关有什么必备功能
  17. 斯坦福大学计算机排名多少,斯坦福大学全球排名第几
  18. Android如何生成设备节点
  19. cant download je-7.4.5.jar with maven [ com.sleepycat:je:jar:7.4.5 ]
  20. 解决ubuntu18.04版本点击右键无法创建空白文档的问题

热门文章

  1. 基于windows 10打造的kali工具集-ICS Windows v2.0
  2. 远程桌面连接时,用电脑名不能连接,用IP就可以,为什么
  3. 苹果 App 转移图文详解
  4. 易语言编写的时间校准器源码
  5. 贵阳经开区管委会考察团到访数澜科技,共探城市数据运营解决方案
  6. [HDU6960]Necklace of Beads
  7. Windows7的自述
  8. 计算机设备维护保养和网络巡检,弱电设备的维护保养及巡检管理制度
  9. 对物联网通信技术原理的认知与理解
  10. ACL 2018 ACCEPTED PAPER