巨杉,一种杉科、巨杉属大乔木,形如其名,可生长至100米高,胸径可达10米。巨杉种子需要两年才能长成,一旦出芽,幼苗便能快速生长,树龄可以达到百年甚至数百年。

巨杉数据库亦是如此,在迎来成立10周年之际,21经济网对巨杉数据库进行专题采访,以下为详细内容,原稿来自于21经济网。

经过十年历练,以巨杉为名,以“培育数据沃土,提升数据价值”为使命的巨杉数据库从零开始,打造原生金融级分布式数据库产品,目前正服务超过100家大型银行及金融机构的生产业务规模上线应用,运行时间最长的集群长达7年,单集群数据量超过1万2000亿行。作为一只资本青睐的“潜力股”,2020年完成D轮融资后,巨杉数据库成为基础软件领域的“独角兽企业”。

在刚刚过去的2021CNBC全球科技大会上,巨杉数据库与各行业的科技领袖齐聚广州南沙,共商共议科技领域的前沿发展与未来趋势。南财记者专访巨杉数据库联合创始人、研发高级副总监许建辉与巨杉数据库产品运营资深总监萧少聪并了解到,巨杉数据库总部目前已落户南沙,将在南沙这片培育科技创新企业的沃土上,开启下一个十年的挑战。

破土:3000+个日夜,打造自研数据库引擎

巨杉数据库核心研发团队来自于北美的IBM DB2 Lab,是DB2的核心研发的归国团队。团队于2011年写下了第一行代码,并于2012年正式创立巨杉数据库。回国后,巨杉更吸引了包括华为、阿里在内的一批数据库技术专家加入。

数据库是基础软件界的一颗明珠。在数字经济中,数据如同燃油和电力一样为不同组织注入源源不断的能源。数据库作为企业级基础软件,是我国数智化转型和国产化进程中的重要一环。许建辉介绍,数据库作为硬核基础软件,在近60年的发展中经历了层次型、集中式、分布式三代产品。目前主流应用最广的是以Oracle及MySQL为代表的第二代集中式数据库。2012年,可以说是第三代分布式数据库商业落地的元年,海外的Snowflake、Databricks以及中国的巨杉数据库均在这一年成立。

(巨杉数据库)

回到2012年,除了互联网厂商自行探索以外,国内几乎没有任何独立数据库厂商愿意在分布式领域进行大量投入。巨杉为何要坚持分布式数据库的研发?许建辉解释:“10年前,几乎所有业务都是依靠集中式数据库解决的。随着互联网和移动业务的发展,我们预见交易流水数据将呈海量增长,这蕴含着无限的数据价值。集中式数据库无法适应数据的海量扩展,如何存储,如何处理,如何释放数据的潜在价值?这就是巨杉团队需要解决的问题。”

怎样开发?是重复造轮子,在集中式数据库已经占有优势的场景中争夺生存空间?还是利用开源代码二次研发,再包装出一个数据库产品?许建辉表示:“巨杉选择自研内核,而并非简单地参照业界的论文,或者拷贝开源产品。我们通过不断与客户沟通交流,聚焦于分布式数据库架构的优势场景打造产品,形成自己特有的产品竞争力。”

“通过自主技术研发分布式数据库产品并不容易,但自研会让产品更有生命力。”萧少聪一语道破自研的初衷,“与其在开源代码上魔改,不如专注于自研。如果数据库内核技术有天花板的话,那天花板一定是我们自己。”

2011年,巨杉团队写下了第一行代码,并确立了自研分布式数据库内核的发展路径。在成立的最初两年,团队将精力都投入到技术输出上。当时,Google去中心化分布式系统论文三件套(Percolator、Spanner、F1)还未发表,分布式一致性协议Raft协议也还未提出,对团队而言,没有现成的成熟方案可供参考学习。如何做分布式架构、如何设置框架、怎样选型、如何解决数据一致性问题……面对巨大的工作量和技术难点,团队成员没有别的捷径,只有讨论方案,测试代码,耐住寂寞,埋头苦干。

“如今回头看,那个时候沉淀下来的一系列方案和技术对现在还有很多启发。”许建辉回忆道。2013年至2014年,巨杉瞄准对数据库产品准入门槛最高的金融行业,用了两年时间推出SequoiaDB v1.0,将技术产品化并正式商用。“只有在最高标准的行业中打磨产品,才有可能真正达到业界顶尖水平。”萧少聪表示。此后,在其全自研底层引擎的基础上,巨杉根据金融行业对不同系统有不同的数据库应用场景的实际需求,逐步提供SQL、JSON及S3的接口,让客户的接入变得更便捷。

成长:聚焦“人效”与“能效”,5次迭代实现换道超车

“传统的业务模型已经很稳定了,我们不去挑战Oracle的行业核心地位,而是挖掘能够成为未来发展趋势的新的业务场景,去开拓一块新的市场。”萧少聪表示。

在与客户的磨合中,巨杉数据库也找到了产品研发的突破口——集中式数据库适用于要求高性能、低延迟的场景,但难以横向扩展,无法支持海量数据的处理。而传统基于Hadoop的分布式大数据产品,虽然可以处理并分析更大量的数据,但其并发能力却远远达不到客户的要求。客户在两种数据库之间来回选择,市场上没有可平衡的方案,巨杉正好在这两个矛盾点之间找到了“换道超车”的机会。

“一方面,分布式数据库可存储的数据量可以与大数据相媲美,另一方面,我们在保障数据一致性的前提下,提供能够进行高并发的实时查询的联机能力。”许建辉介绍,产品9年间历经5次布局迭代,在2020年10月22日正式发布的SequoiaDB 5.0版本基于引擎级多模技术,采用了充分结合数据湖和数据仓库优势的“湖仓一体”数据管理架构,有效帮助企业增强数据复用能力,在盘活数据资产价值的同时,提供更高时效、高并发的访问,能够全方位提升管理的“人效”及开发的“能效”。

(巨杉数据库参与2021DTCC大会)

国际数据公司IDC发布的《2020年下半年中国关系型数据库软件市场数据跟踪报告》显示,分布式架构已成为支撑高性能场景和解决传统数据库瓶颈的主要选择。目前,巨杉数据库基于“湖仓一体”架构发布了完整的产品线,已在超过100家大型银行及金融机构的生产业务规模上线应用,应用范围包括联机业务、数据中台、实时数据服务、内容管理等,已广泛应用于证券、保险、电信、政府、互联网、交通等领域,在得到上千企业用户认可的同时,巨杉也收获了广泛的行业肯定。

2017年起,巨杉数据库连续三年入选Gartner数据库榜单。2020年,巨杉数据库获得中国电子学会科学技术三等奖、广东省科技进步二等奖,并入选信创产业独角兽100强。2020年和2021年,巨杉数据库连续两年登上广州未来独角兽榜单。在今年6月的信创产业技术与应用大会上,巨杉数据库获评信息技术应用创新优秀产品;同月,产品通过中国信通院第十二批“大数据产品能力评测”;11月更入选2021福布斯中国企业科技50强。

资本的青睐也接踵而至。2020年底,巨杉数据库完成D轮融资,本轮融资由央企中金资本领投,元禾重元与越秀产业跟投。在此之前,巨杉数据库已获得由嘉实投资、DCM、启明创投在内的多家国内外主流投资机构的投融资,成为基础软件领域的“独角兽企业”。

成熟:落户科创福地南沙,用技术服务大湾区建设发展

科技创新离不开人才的支撑。目前,南沙正在开展营智环境建设试点,加快创建国际化人才特区,五年来已聚集高层次和骨干人才1.2万人。一批瞄准新兴产业的创业者看中了这里的资源集聚优势,巨杉便是其中之一。

数据库是人才密集型行业,许建辉介绍,公司自成立之初便立足广州,团队分布在深圳、北京、广州等地,最终将企业新总部落户南沙的重要因素,便是看中了南沙优质的科技产业规划及人才政策。“让人才稳定下来,安居乐业”既是巨杉对人才的承诺,也是南沙留住人才的砝码。“南沙舒适的生活环境和宜居的生活成本,让员工更有幸福感,更愿意留在南沙。”萧少聪告诉南财记者,多位在多伦多实验室的同事也已经回到南沙总部,未来将会有更多的海内外人才选择南沙,扎根南沙。

“南沙是培育科技创新企业的沃土。作为一个新兴区域,南沙在科技产业方面的规划更聚焦、更有方向性。”许建辉表示,南沙正加速打造粤港澳全面合作示范区,不仅拥有成熟的产业底蕴和配套资源,与港澳接轨还能为企业乃至行业输送优秀的国际人才。

许建辉相信,南沙必将成为科技公司的创新福地,并希望能乘南沙加快构建现代产业体系的东风,依托人工智能、生物医药等新兴产业和跨境金融、航运金融、飞机船舶租赁、科技金融等为重点的特色金融,为分布式数据库构建丰富的上下游产业链。

目前,巨杉数据库在拥有200多名研发人员和40余项自主知识产权的基础上,同时发力技术社区,构建分布式数据库技术社区“巨杉学”,提供线上线下的培训考试和认证,共同促进技术生态发展。

“在技术社区,已有超过一万人通过巨杉数据库工程师认证。而对于公司,未来三年我们计划让研发人员每年会以翻倍的速度增长。我们也将设立巨杉奖学金,为粤港澳大湾区培育人才,为我们的自身发展培养人才,为我们的产业培养具备行业知识同时具备高端数据能力的数字化复合型创新人才。”许建辉表示,巨杉已经与华南理工大学建立了奖学金合作,未来希望能与湾区包括香港科技大学、中山大学等共同开展产学研的合作,推动打造人才数据库,服务湾区经济发展。

(巨杉数据库)

IDC预计,2025年中国55%以上的大数据IT支出将来自于政府、通讯、制造及银行四个行业。在对话中,萧少聪透露,巨杉下一步的业务布局与此如出一辙。

2021年11月,巨杉数据库与东华发思特完成产品兼容互认证明,将结合双方优势,联合打造新型智慧城市。萧少聪表示,巨杉数据库将深度参与粤港澳大湾区的信息化建设,结合各地产业优势,加速产业与信息化融合,用技术驱动地方新基建的创新增长。

未来,无论是服务于银行业还是政府,萧少聪表示,巨杉的初心始终不变——依然是聚焦行业痛点,找到优势场景,用技术解决实际问题,让技术实现商业价值。

“数据库产品发展是一场长跑,生命周期长,发展空间大,需要数据库企业的长期投入与积累,也需要政府、企业、客户一起聚焦数据库的新兴业务,打造数据库行业生态,一起发展才能站稳脚跟。”许建辉表示,在打造成为国内领先的金融级分布式数据库厂商的同时,巨杉数据库正紧盯国际金融业务,致力于发展成为全球分布式数据库领域的领导者。

“我们积累的十年,在数据库行业也只是刚刚起步,未来期待与更多有志之士一同培育数据沃土,提升数据价值。”许建辉说道。

21经济网专访 | 巨杉下一个十年:扎根科创福地,打造数据库行业生态相关推荐

  1. 6位图灵奖获得者、10多位院士在线“教学”,这套关于“人工智能下一个十年”的课程免费提供给你...

    2020 年 6 月 21-24 日,第二届北京智源大会将以线上直播形式盛大召开,本届大会邀请了包括 6 位图灵奖获得者.10 多位院士在内的上百位人工智能领域的顶级专家学者,围绕技术.应用.基础设施 ...

  2. 后弹幕时代,bilibili能否走好下一个十年?

    过去十年,B站从一个个人网站逐渐成长为一家上市公司.十年间,B站用户数量增长迅速,目前月活量已经突破1亿人次,日活用户也突破3000万.十年间B站发生了哪些变化,它还是以前那个B站吗? 在内容上,B站 ...

  3. AI:2020北京智源大会与五位图灵奖得主和100多位专家《共同探讨人工智能的下一个十年》——6月21日~6月24日的日程安排(实时更新,建议收藏)

    AI:2020北京智源大会与五位图灵奖得主和100多位专家<共同探讨人工智能的下一个十年>--6月21日~6月24日的日程安排(实时更新,建议收藏) 导读:2020年,是一个十年的结束,也 ...

  4. 数字经济浪潮澎湃,怎样赢得下一个十年?

    数据智能产业创新服务媒体 --聚焦数智 · 改变商业 新一轮科技和产业变革正席卷全球,"数字中国"的建设从量的增长向质的提升转变趋势也愈加明显. 2021年10月22日,在上海市经 ...

  5. 2020 北京智源大会“云上”开幕, 中外顶尖学者畅想AI的下一个十年

    6月21日,由北京智源人工智能研究院(以下简称智源研究院)主办的2020北京智源大会在线上成功开幕,会期四天.北京智源大会是智源研究院主办的年度国际性人工智能高端学术交流活动,2019年举办了首届大会 ...

  6. 论坛报名 | 智能体系架构与芯片的下一个十年

    与6位图灵奖得主和100多位专家 共同探讨人工智能的下一个十年 长按图片或点击阅读原文,内行盛会,首次免费注册 2020年6月21-24日,第二届北京智源大会(官网:https://2020.baai ...

  7. 6位图灵奖得主,10多位院士,19个分论坛:北京智源大会邀你共同探索AI下一个十年...

    长按上图或点击「阅读原文」免费注册参会 2020年,是一个十年的结束,也是下一个十年的开始. 过去十年,人工智能在深度学习算法.大规模算力和新型芯片.互联网收集的海量数据等因素的共同驱动下,经历了波澜 ...

  8. 张亚勤、韦乐平等综述论文:通信人工智能的下一个十年

    来源:专知 [摘 要]移动通信技术走过了37年的发展历程,人工智能技术也已走过了64年的发展历程.从早期的各自独立演进,到5G与人工智能开始深度融合发展,"5G与人工智能"已被业界 ...

  9. 和达摩院深度绑定,阿里云下一个十年,成为“云上的阿里巴巴”

    参加 2019 Python开发者日,请扫码咨询 ↑↑↑ 整理 | 非主流 出品 | AI科技大本营(ID:rgznai100) 2009 - 2019,阿里云已经走过了 10 年时光. 在此次的阿里 ...

  10. 下一个十年,AI将在这10大领域颠覆世界!

    来源:大数据DT 本文约4200字,建议阅读8分钟 我将带你遍览21世纪能够拥有并且将要拥有的各种不可思议的AI应用.我有一个关于AI如何改变世界的构想,这个构想围绕以下10个领域展开. 01 能源 ...

最新文章

  1. 【BZOJ5461】 【PKUWC2018】—Minimax(线段树合并优化dp)
  2. 运营总监训练营本周六开营,B612、神策数据等运营总监倾囊相授运营方法论
  3. mac os 开启redis_mac os 命令行安装 启动和停止 redis
  4. python元编程运用_Python 中的元编程
  5. window php composer,Window下安装php composer
  6. 2020-08-23 每日一句
  7. Python | 股票数据可视化
  8. 大数据在国外发展现状研究学习笔记
  9. 未来机器人背景的AI人工智能PPT模板
  10. 详细了解DAS、SAN和NAS三种存储方式
  11. hi3519多sensor设置说明
  12. 读《断舍离》山下英子
  13. 科大讯飞AIUI-应用集成6麦解决方案
  14. kafka-connect-jdbc 增加source报错:query may not be combined with whole-table copying settings
  15. 电脑没有html怎么办,笔记本电脑里没有无线网络连接的选项怎么办
  16. Swift MD5加密
  17. 拼多多崛起背后的电商新版图
  18. 处理tcga突变数据一点思考
  19. 等一等!看一看!缓一缓!
  20. 自如2020新产品发布:全面打造智能租住生活

热门文章

  1. 2014.07.30 Hosts更新
  2. VR乒乓球项目Unity3D 开发经验整理,1总纲
  3. GM(General MIDI)128种标准音色表
  4. Livy的CDH环境parcel和csd制作
  5. [proxy:0:0@WORKSTATION-DEV] HYDU_sock_write (utils/sock/sock.c:256): write error (Broken pipe)
  6. [转载]jbx 乱码问题的解决大全
  7. win10换win7系统步骤操作详解分享
  8. Python中scatter函数参数搞懂之新手上路
  9. [思考进阶]02 如何进行认知升级?
  10. 34604-52-9,Ms-PEG3-Ms甲磺酸基是良好的离去基,也可用作伯醇的保护基