2021年11月,百易传媒(DOIT)推出“傲腾观察室-请回答2021”线上直播活动,旨在通过两位数据存储产业的长期观察者——DOIT总编宋家雨与DOIT主编朱朋博从第三方视角梳理分析傲腾技术如何助力不同行业的应用创新,洞察未来存储发展轨迹,期间现场连线云计算、金融等不同行业傲腾用户进行细致解读。

第一期观察室从突破冯诺依曼架构的局限性入手,以DRAM+傲腾持久内存构建大内存的方式弥补冯诺依曼架构当前亟待解决的问题,第二期着重了解傲腾在云环境中的价值点。

1月12日下午,“傲腾观察室”观察者们聚焦金融行业用户针对外部环境需求变化作出的技术应对,连线了建设银行“龙趺MPP DB”产品负责人陈晓新和建设银行建信金科基础技术中心首席存储专家徐宁,进一步了解傲腾技术对银行应用创新过程起到的推进作用。

2021年,行业数字化转型进入快车道,对金融行业而言,数字化,分布式、智能化成为自身发展的着力点,金融机构需要依托创新技术不断完善系统架构,优化业务流程,丰富场景应用为客户提供优质金融产品和服务。其中,不能不提承载行业关键业务应用的数据库技术趋势变化。

数据库技术演进与变化

数据库从应用角度可分为OLTP(联机事务处理)和OLAP(联机分析处理)。OLTP是关系型数据库的主要应用,用于如银行交易等日常交易处理。OLAP是数据仓库系统的主要应用,用于数据分析和辅助决策。

从前,数据分析以结构化数据为主,通过各种BI工具、报表来呈现,相对而言,我们并未将OLAP视为金融行业的关键业务应用。近年随着数据量爆发式增长,互联网行业积极推动应用技术创新,从非结构化数据分析中获取价值。而面对互联网应用的冲击,金融机构也在作出反应与调整,OLAP也升级为金融行业的一大关键应用,整体走向是单一架构结合OLTP和OLAP两种能力应对海量数据存取访问和分析处理,取得简化应用开发、加快即时查询、降低成本等效益。

那么具体金融行业用户如何积极应对互联网应用?以中国建设银行为例,2020年3月,中国建设银行就上线了龙趺MPP DB的数据库服务。

建行新一代MPP数据库的构建与技术探索

传统MPP数据库要在不同计算集群之间复制规模化数据来保持数据的一致性,对系统的效率和性能产生极大影响,同时数据复制也会造成数据冗余,拉高存储成本。

龙趺MPP DB产品负责人陈晓新介绍称,龙趺MPP DB是建行金科联合HashData和金山云开发的新一代云原生数据仓库产品,采用元数据,计算,存储三层分离架构,确保高性能计算能力的同时还具备高并发性,高扩展性,资源动态调度以及故障自愈能力。

截止到2021年5月,龙趺MPP DB规模已达到12000台服务器,结构化数据压缩后数据量达到9PB,表数量达到百万级,并且每天运行的作业数也达到百万级,SQL数据库约有千万级别数据量。

其中,元数据层主要负责元数据的存取访问服务以及事务控制。共享存储(对象存储)层负责用户数据持久存储,中间计算层为无状态的计算服务。

当然,龙趺集群规模不断增大,其在数据存储和使用中也会面临一些挑战。大量应用接入数据库,龙趺共享存储中的文件数超过20亿,而读取访问小文件对缓存影响极大,因此在高并发需求下规模化应用如何提升本地缓存系统使用效率是一个挑战。

服务器数量不断增加,故障也随之增多,资源动态调配和故障自愈能力这些操作也会带来缓存部分失效,如何实现节点间缓存的共享,以此最大限度减少缓存加载对应用的影响也是挑战。

以傲腾为代表的SCM助力分布式数据库应对存储挑战

建设银行建信金科基础技术中心首席存储专家徐宁表示这两个问题可以从三个方向进行优化——数据分布,单机性能以及格式性能。其中,存储介质、缓存分层、文件系统和缓存粒度和缓存格式是基于SCM的进一步优化。

以傲腾为代表的SCM出现带来了高级数据服务能力,且具备实际价值。混合按需使用DRAM和SCM,将存储层的高级数据服务移植到内存层,如高性能备份和恢复等。SCM应用可以简化系统设计,SCM的内存特性简化软件栈,更易于定制化实现需求。

比如,在做MPP计算时不需要一个文件中所有数据,而是把文件里部分数据按照范围加载到当时的计算集群缓存部分,比如上图里的Block 1和Block 2,然后加载到具体计算机群节点上,变成两个小文件,这是对象局部缓存的设计。

在这个前提下进行单机优化首要考虑的是应用的SCM介质。龙趺MPP DB采用英特尔® 傲腾™持久内存作为SCM介质替代了一部分DRAM带来性能提高和长寿命的优势。

DOIT总编宋家雨指出,内存储器如DRAM一旦出现故障,系统需要跨内存储器直接访问外存储器,消耗大量的网络和存储资源的同时导致性能大幅降低,而通过以傲腾为主的SCM+存储分层是将热数据缓存到新介质上,冷数据则自动存储到经济型介质上,以此找到性能,容量和成本结合点,最大限度减少缓存加载对应用的影响。

另一方面,针对海量小文件带来的访问性能下降,建行采用了很多办法,比如用RocksDB取代本地文件系统,优化后对16KB以下的小文件取得了较大的性能提高。但是RocksDB也会带来新问题——LSM Tree带来的写放大,LSM Tree分层级,每次先写journal(日志),再写memory table(内存表),然后并到leve1,leve2……重复写入和数据逐级下沉造成了严重的写放大问题。

因此,建设银行在软件方面采用了英特尔持久内存开发工具包PMDK(Persistent Memory Development Kit),用pmemobj库存放较大的值,然后用户oid直接做索引,很好地解决写放大的问题。

以libpmem库为例,作为PMDK中的底层库支持用内存映射方式访问持久内存,一方面可将持久内存上的文件映射到应用的虚拟内存空间进行操作。通过规避内核参与和上下文切换带来的开销,直接为上层应用提供助力。

DOIT主编朱朋博表示,中国有句古话:勿以善小而不为。用傲腾部分替代DRAM,鉴于傲腾在容量密度和价格方面的优势,聚沙成塔,当服务器用量动辄上万时,其所带来的容量优势不能低估。

傲腾持久内存的技术展望

从建设银行的数据库案例来看,傲腾技术的引入帮助其完善了MPP数据库的功能,为海量数据访问和处理提供了强有力的支撑。未来,SCM解决方案除了作为缓存层,随着傲腾技术不断发展,容量与性能的扩展,以及我们对内存规模需求的不断增加,是否会成为数据存储的核心呢,毕竟技术新旧更迭是市场的运行规则,接下来,傲腾观察室将投入更多的时间和精力来观察傲腾技术的新用例和新变化,敬请期待!

下方扫码观看完整节目

欢迎进入【傲腾观察室】

【傲腾观察室】英特尔® 傲腾™技术,助力金融行业数据库价值迸发!相关推荐

  1. 英特尔David Tuhy:英特尔®傲腾技术成功的原因

    2022分布式存储线上峰会上,英特尔数据中心与人工智能事业部副总裁,英特尔傲腾事业部总经理David Tuhy表示,"75%的顶级公有云和私有云服务提供商都在使用傲腾,英特尔®傲腾™持久内存 ...

  2. 英特尔David Tuhy - 这就是英特尔傲腾技术成功的原因

    2022分布式存储线上峰会上,英特尔数据中心与人工智能事业部副总裁,英特尔傲腾事业部总经理David Tuhy表示,"75%的顶级公有云和私有云服务提供商都在使用傲腾,英特尔®傲腾™持久内存 ...

  3. 【傲腾观察室】英特尔® 傲腾™技术如何助力金融行业关键业务应用?

    关注云报 洞察深一度 2021年11月,百易传媒(DOIT)推出"傲腾观察室-请回答2021"线上直播活动,旨在通过两位数据存储产业的长期观察者--DOIT总编宋家雨与DOIT主编 ...

  4. 【傲腾观察室】英特尔® 傲腾™ 技术如何提升云服务竞争力?

    在如今的IT技术市场上,有这样一类技术创新势力,它们有很多数据中心基础设施资源,它们有大量在线业务,有的做电商,有的做游戏,有的做视频网站,还有的做搜索引擎,它们有一个共同点,就是有很强的技术储备,强 ...

  5. 云平台结合英特尔®傲腾™技术发挥更强效能!

    在如今的IT技术市场上,有这样一类技术创新势力,它们有很多数据中心基础设施资源,它们有大量在线业务,有的做电商,有的做游戏,有的做视频网站,还有的做搜索引擎,它们有一个共同点,就是有很强的技术储备,强 ...

  6. 英特尔®傲腾™持久内存+MemVerge软硬结合发挥极致性能

    IDC曾发出预测,预计到2025年,全球数据量将达到175ZB,当数据量加速增长,当企业对数据价值挖掘的需求越来越高,人们对于存储和计算效率也提出了更高要求,当有越来越多的数据无法被利用,越来越多的技 ...

  7. 云端新“势力”,英特尔® 傲腾™技术 再突破!

    一文读懂傲腾新技术在云计算以及互联网公司的典型应用. 在如今的IT技术市场上,有这样一类技术创新势力,它们有很多数据中心基础设施资源,它们有大量在线业务,有的做电商,有的做游戏,有的做视频网站,还有的 ...

  8. 内存外存合二为一,解密基于英特尔®傲腾™的大内存技术!

    IDC曾发出预测,预计到2025年,全球数据量将达到175ZB,当数据量加速增长,当企业对数据价值挖掘的需求越来越高,人们对于存储和计算效率也提出了更高要求,当有越来越多的数据无法被利用,越来越多的技 ...

  9. 深度整合英特尔傲腾,SmartX首发100us级超低延迟超融合解决方案

    6 月 17 日,致力于超融合中高端市场的SmartX公司正式发布基于核心软件 SMTX OS 与英特尔® 傲腾™ 持久内存的高性能.低延迟超融合解决方案与SmartX Halo P系列一体机. Sm ...

最新文章

  1. java 不包含 字母和数字_Java String - 查看字符串是否仅包含数字而不包含字母
  2. 跟恶意插件的较量:手工清除Orzhz广告程序
  3. pbr 多出口_结合BFD基于PBR的多出口流量转发的控制与备份
  4. 大型网络架构变迁和知识图谱
  5. BasKet Note Pads-利用软件作条记
  6. C++基础::自制异常定位器
  7. 液晶手写板原理拆解_汽车抬头显示HUD的拆解
  8. 拓端tecdat|在RapidMiner中建立决策树模型
  9. Rsync 实现远程同步
  10. Mybatis 中事务提交方式
  11. ArcGIS JS之 identify接口之 exceededTransferLimit属性
  12. 《科学之路》| 图灵奖得主杨立昆人工智能十问:AI会统治人类吗?
  13. 保密单位 计算机维修保密协议,计算机维修保密协议.doc
  14. 在这个大数据时代,如何保护好自己的隐私?
  15. AQS是什么?都是怎么用的?
  16. 表单中的label标签
  17. input 限制输入2位小数
  18. 在word中使用MathType
  19. 江苏大学2021年第一届程序设计大赛(UJSCPC)题面
  20. 阿里云ECS 云服务器和轻量应用服务器之间的区别

热门文章

  1. 今日头条一个身份证可以注册几个头条号
  2. 微商截图管家 v1.0.0
  3. 充分必要条件与C语言,充分条件与必要条件知识点总结,高中数学充分条件与必要条件知识点总结...
  4. 如何批量删除PDF文件中的页面
  5. SSL 1231 容易的网络游戏
  6. 《计算机存储与外设》----2.3 DRAM
  7. 大数据时代下 数据安全运营面临严峻待解决问题有哪些
  8. Python个人常见语法问题
  9. 打卡第四天 学习python读取mat和xslx文件+敢死队+XPOWER
  10. SQL AUTO INCREMENT