2018年预测:GPU数据库或是未来的数据库统治者!
数据库市场似乎已经很久没有足以撼动MySQL地位的数据库出现了,我们习惯于看到MySQL占据各大数据库排行榜的首位。MySQL确实是很棒的一款开源数据库,也是目前应用最广泛的数据库。甚至不少业内人士都认为未来属于MySQL,但事实果真如此吗?
为了探讨这个问题,本文特意邀请了SQream Technologies首席执行官Ami Gal,他的观点是GPU数据库才是未来的趋势,来看看他的理由是什么吧!
Ami拥有超过20年的技术和创业经验,技术背景深厚,曾担任Magic Software (MGIC)业务发展副总裁,在高性能和复杂数据集成环境中创造了新的增长引擎。他有这个想法的原因很简单:GPU可以远高于CPU的速度读取和处理数据,每年的性能提高速度大约为40%左右(等于数据增长率)。
目前,在几个核心领域(如深度学习,虚拟现实和自动驾驶汽车)之外的计算机领域,图形处理单元(GPU)的功能仍然相对未知。事实上,对于大多数人来说,使用GPU进行非图形计算的想法也是前所未闻的。然而,这种想法马上就可以被改变,一切从GPU数据库开始。
很多人都知道GPU是比CPU更好的计算资源。当工程师和架构师意识到在屏幕上渲染复杂图像是一个可并行化问题,也就是说,可以同时处理多个指令流的指令时,GPU就作为CPU的有效替代方案而与大众见面了。
起初,解决问题的方式是创建一个新的处理单元,它具有数千个不太复杂的内核和更快更高带宽的内核,努力的结果是无论在读取还是处理数据方面,这个新的处理单元都远远超过了CPU。(现在你可能开始明白为什么GPU对于数据库来说是可取的,毕竟GPU本来在数据读取和处理方面就是擅长的)
其实,GPU数据库早已经发展得非常不错了!
早在2016年,数据就在以每年大约40%的速度增长着,而且还有明显加速趋势。1TB存储的智能手机出现,企业处理的数据规模也上升到了PB级别,而CPU每年只有10%—20%的提升,数据的增长速度已经远远超过了CPU能处理的数据,这让GPU数据库得以面世。
起初,数据库行业很多从业人员并不看好GPU数据库,认为不过是一阵风,只适合于那些小众领域,与内存数据配合使用。
就在他们坚信着未来仍将是传统数据库的天下时,GPU数据库已经在很多行业悄悄被采纳了,包括一向对新技术接纳程度有限的政府部门。美国邮政总局就是一个很好的例子,他们的数据库管理着遍布20万条投递路线的1.54亿个地址,还包括邮递员的位置数据,可想而知这个数据库的量级有多大了。通过GPU数据库,邮政总局可以迅速处理复杂查询,所用时间几乎与载入网页时间相当。
除此之外,GPU数据库在金融、电信、零售、安全等等行业均已有广泛应用。
看看现在CPU和GPU可以处理的原始FLOPS:
CPU - 200 gigaflops - 每秒200亿次浮点运算
GPU - 120 teraflops - 每秒120万亿次浮点运算
因为GPU可以同时处理很多计算,所以可以分而治之。大问题被分解成小问题,一次解决。另一方面,基于CPU的数据库受其上内核数量的限制,并且被优化以运行序列化计算。这导致一个数据库只能同时处理几个查询,只好一个接一个地查询。
未来,很多人会开始看到GPU数据库的革命性和强大功能。
GPU数据库为每个GPU包含数千个内核。这使数据库可以同时运行数千个查询,并使用更高的带宽内存来启动。
大多数企业都有投资回报率。虽然一个完整的GPU服务器可能会很昂贵,但它可以匹配几十个甚至几百个传统CPU服务器的计算能力。
GPU数据如何实施?
大多数GPU数据库运行在云端,适用于从IBM Bluemix到亚马逊AWS的各种环境。数据库搭建完毕,可以使用行业标准的驱动程序,使用标准SQL查询数据,驱动程序包括:
JDBC和ODBC
Python、Jupyter和sklearn 等
R及其他机器学习库
大多数GPU数据库的搭建过程都十分简单,不需要十分强大的技能,而且它们往往是与现有生态系统兼容的。对于数据科学工作而言,工作负载可以从几小时缩短至几分钟,甚至更少。
所有这些都为GPU数据库的发展创造了一个非常有说服力的理由,并且很快就会导致它的广泛普及。
2018年预测:GPU数据库或是未来的数据库统治者!相关推荐
- 数据库大赛50强之「中国人民大学」:培养工程性精英人才,共筑数据库美好未来
历经激烈角逐,2021 OceanBase 数据库大赛初赛终于落下帷幕.此次大赛吸引了国内外246所高校,200家企业,1179支团队,近2000名数据库爱好者报名参赛.最终,根据性能跑分排名,初赛5 ...
- 一个面向未来的数据库应使用哪些技术?
本文为PingCAP联合创始人兼CTO 黄东旭在TiDB DevCon 2019 上的演讲实录,分享了其对数据库行业大趋势以及未来数据库技术的看法. PingCAP其实并不是一个特别擅长发明名词的公司 ...
- 为什么云原生+分布式是数据库的未来?
2020 云栖大会期间,阿里巴巴正式成立云原生技术委员会,同时推出了云原生多模数据库Lindorm.云原生分布式数据库PolarDB-X.云原生数据仓库AnalyticDB(ADB).云原生数据湖分析 ...
- 数据库的未来 - HTAP,软件、硬件、云生态的融合
标签 PostgreSQL , GPU , FPGA , CPU , TPU , PL/language , 科研 , 嵌入式计算 , UDF , CUDA , 数据库嵌入式编程 , 流式计算 , 科 ...
- 腾讯TDSQL提出三个“数据库之问”,数据库技术未来重点在哪?
李海翔,网名"那海蓝蓝",腾讯金融云数据库技术专家.中国人民大学信息学院工程硕士企业导师.著有<数据库事务处理的艺术:事务管理和并发访问控制>.<数据库查询优化器 ...
- 中英数据库专家谈:数据库的过去、未来和现在
简介:数据库是什么?未来的数据会被存在DNA里?数据库里的数据湖是什么? 1月16日,扫地僧做了一场直播,请到我的同事--数据库资深专家封神,和来自帝国理工的高级讲师Thomas Heinis(托马斯 ...
- 从历史见证未来,Distributed SQL?云原生数据库? 多模型数据库?
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可. 本作品 (李兆龙 博文, 由 李兆龙 创作),由 李兆龙 确认,转载请注明版权. 回顾历史 自1970年 Codd ...
- 云原生数据库如荼如火,未来可期
文章目录 一.云原生数据库解读 1.1 什么是云原生 1.2 什么是云数据库 1.3 云数据库VS传统数据库 二.云数据库技术 2.1 容器化技术 2.2 存算分离 2.2.1 关于存算分离的划分 2 ...
- 阿里云自研云数据库POLARDB_未来企业的数字化答案
点击有惊喜 在2017年的杭州云栖大会上,阿里云总裁胡晓明做了题为"智能计算,为未来而生"的主题演讲,在众多内容中,阿里云的自研数据 库产品POLARDB,引发了广泛关注. 从上个 ...
最新文章
- 数学史上的哲学绝唱——无穷观与数学基础的争论
- Maven实践:版本管理 SNAPSHOT
- Mac OS X上的Java安装位置在哪里?
- 住酒店套房的注意事项
- Spring AOP and AspectJ AOP 有什么区别
- vcenter6.0+EXSI6.0 部署虚拟机win10,安装vmtools后不能显示桌面
- 拓展编辑器(五)_监听事件
- 使用systemctl设置tomcat开机自启动
- c++语言表白超炫图形_C/C++图形界面编程打造——浪漫的表白程序!
- 自动点击器如何设置最快_微视APP如何设置自动播放视频-微视APP设置自动播放视频的方法...
- 5G对于数据中心的影响有哪些
- java零基础Ⅲ-- 8.算法优化体验课-骑士周游问题
- MATLAB-阶乘运算
- MAtlab求函数最大值以及对应自变量
- 中国石油行业并购重组趋势与投资战略规划建议报告2022~2028年
- unitoy机器人怎么联网_UniToy智能app
- js禁止鼠标滑轮_JS实现禁止用户使用Ctrl+鼠标滚轮缩放网页的方法
- Tair分布式锁 实践经验(160805更新)
- 2022河海大学物联网工程学院电子信息(计算机与软件方向)890上岸经验帖(毕业2年后,双非三跨211成功)
- 【学习记录】基于python爬取Flickr图片及元数据