引言

“前方事故多发地段,请注意保持车距...”

“您已疲劳驾驶,请注意休息...”

“前方经过泰山旅游景区,中国 5 A级景区,是第一批国家级风景名胜区...."

......

这是高德出行的导航场景,像这样暖心的语音提示,在春节期间的每天都会有上百亿次,以保障您的出行安全。然而这背后,任何系统抖动或者故障,都会影响到用户的出行安全,所以在节日期间整个团队会严阵以待并去现场值班,以保障系统的稳定性。

在过去的 2021 年,高德地图提出了新的品牌主张:在“高德地图,哪儿都熟”的背景下,高德出行 App 增添了更多的用户使用场景,随之而来业务系统也变得更为复杂。为了保障系统的稳定性,每一个节日大促期间,都会有同事去现场值班。

为了解决这一困境,我们对系统架构进行了更深的思考,并一致认同 Serverless 会是未来的技术趋势,所以在过去的一年中,我们对 Serverless 技术做了很多的探索,并实现了部分核心业务的 Serverless 化。利用 Serverless :低成本,免运维,高弹性等优势,达成了上述提及业务,节假日无需同事再去现场值班的目标,让团队成员可以在家过一个安心团圆年。

本文会分享过去的一年,高德地图在 Serverless 领域做过哪些探索?如何与业务相结合,实现了一个低成本,低代码,免运维的现代化的 Serverless 研发平台。

业务背景

自 2021 年 7 月,高德地图宣布品牌履新:整体向 “出门好生活开放服务平台”升级,同时提出了“高德地图,哪儿都熟”的新品牌主张。高德地图从导航工具升级为出行服务平台、生活信息服务入口; 为了更好地服务用户,拓展和出行相关的生活信息服务场景:高德地图主图、我的页面、行前行后场景以业务卡片的方式,透出了业务推荐信息。下图是高德 App 中出现的几个典型卡片推荐场景:

样式多变

高德地图的业务特点之一是:高频率的样式变化。节日气氛的衬托、假期旅游的引导、交通信息的提醒等等多变不同的需求下,亟需一种能够快速迭代的研发模式。而传统的研发模式是:每一个变化都是在 App 客户端上研发,然后随着 App 版本的发布进行样式再更新。(这种发版效率很慢,并且要考虑到稳定性;每月一个版本,如果仍使用这种研发模式,其实是很难满足业务需求的。)

策略多变

卡片业务背后的后端代码,会随着业务类型的不断增加,因此相应的业务策略越来越多,如果不及时与系统功能模块进行抽离,就像生命力顽强的爬山虎一样,系统代码不断无序增加,越来越臃肿,复杂性也越来越高。而多变的策略,会要求在系统架构上做出改变,达到策略的快速增加与删除,以及实时的生效。

客户端瘦身

过多的业务逻辑糅合到客户端,虽然可以一定程度上提高性能,但是如果客户端过大,也会导致用户不愿更新。其实动辄几百兆的更新,不仅会增加我们的带宽成本,也占用了用户的数据流量。此外因为代码多,相应的涉及业务也多,如果每一个业务都有快速迭代的要求,这就需要 App 客户端拥有能够快频率的更新的能力。

两者构成了恶性的循环,不利于 App 的长期发展,所以客户端瘦身势在必行。

早晚峰值

上班早高峰,下班晚高峰,相信大家都有过一致的体验:堵 !!同样地图导航类应用,早晚峰值时间段非常的明显,且峰值和低谷的波谷差距非常大,如果所有的机器资源按照峰值去准备,这成本无疑是非常高的,在低峰期,会造成极大的资源浪费。所以我们需要能够按需使用的弹性资源技术,去降低我们的机器资源成本。

技术选型

经过架构组的多轮讨论,最终我们并达成达成一致目标:全面拥抱 Serverless。 因为 Serverless 的优势特点,恰好解决了我们的业务痛点需求。我们也相信未来一定是属于 Serverless 的时代。

Serverless for frontend

不用多说,当下前端最热的技术趋势就是:云端一体化研发模式,它实际上是以 Serverless 技术作为技术底座去构建的现代化应用研发模式;不仅降低了“全栈开发工程师” 的技术门槛,还大幅提高了研发效率,阿里内部多个大型 App 都已全量使用,比如淘宝,天猫,飞猪等等。经过严格的数据统计,Serverless 在研发提效上能提高 38%,这也是我们选择 Serverless 最重要的数据依据。除此以外,基于 Serverless 实现的 CSR/SSR 首屏提速技术方案,目前也已经非常的成熟,几乎覆盖了阿里内部的 App 应用。

快速迭代

工程卓越一直是我们的追求目标,但是由于各大技术产品关注重点不同,所以对于“研发最后一公里”的相关事项并没有做太多关注,这就导致了技术产品的功能与用户体验出现割裂感,很多业务方放弃使用。

Serverless 的目标就是让你尽可能多的专注自己的业务逻辑,能够少关注或者忽略非业务核心的运维工作;加速开发时间,降低线上资源的冗余成本,所以 Serverless 无疑是扛得起降本提效的大旗的。

完全弹性

请求毫秒级的调度是 Serverless 的核心竞争力,相比传统的分钟级弹性扩容,Serverless 技术存在巨大的成本优势,扩容所耗费的时间越少,预留的机器资源就会更低,如果到了毫秒级别,就无需预留任何资源,这样成本能够大大的降低,资源利用率可以达到 100%。

低成本迁移利器 - Runtime/Container

做过程序员的同学都知道最痛苦的事情是“改别人的代码”,因此,虽然 Serverless 技术十分诱人,但是对于存量的应用如何迁移到 Serverless 架构上,也一直困扰着我们。

我们应如何以低代码的方式解决传统架构潮汐流量对资源使用不合理的问题,于是我们跟 Serverless 团队同和合作开发 Runtime。由于高德的服务均以 C++、Go、Rust 的语言设计,于是我们开发出 C++、Go、Rust 的 Runtime。Runtime 集成了集团内的中间件,使得 Serverless 架构可以满足我们之前服务的整个生命周期。让我们可以快速的切换服务到 Serverless 平台上。

但是随着我们使用量变大,业务场景比较复杂,一些对外的服务是无法使用内部 Runtime 的,这个严重的问题一直掣肘着我们,使原有的架构由简单又变得复杂起来。直到阿里云 Serverless 团队的同学,推出了 Custom Runimte/Container 功能,彻底解决了我们后顾之忧。我们只需改几行启动命令,就可以轻松迁移存量的应用。Serverless 团队也针对镜像的快速分发做了大量的创新优化工作,如使用四级缓存,P2P 技术,按需下载等方式,提供了秒级别下载 3G 大小镜像的能力。

得益于 Serverless 技术加持,无人值守的目标也就很容易达成,所有的运维操作,都通过 Serverless 的强大调度能力去解决,比如峰值高峰期,系统会自动毫秒级别进行扩容,低峰期同样也会 Graceful 的进行缩容,不涉及任何人为操作运维,所以这也解决了我们在节日大促期间过多人现场值班的困境。

Serverless 技术落地

架构设计

在系统设计上,我们引入了两层 FaaS (Function as a Serverles),端 FaaS 和业务 FaaS,其中:

  • 端 FaaS,也就是 SFF ( Serverless for frontend),基于 Node.js,实现了端云一体化开发,将原本客户端的逻辑移到 FaaS 服务端来。这里在传统的 Frontend 和 Backend 之间抽象出了 SFF ,用来实现数据和调用逻辑封装,快速开发、发布。
  • 在后端,引入业务 FaaS,基于 Java/Go 实现, 用来封装推荐策略逻辑和数据转换代码,可以提高策略迭代效率,同时减少策略迭代对主工程的影响。

从整体上看,将函数计算和容器化微服务整合在一起,综合利用函数计算的高效和传统微服务的灵活,是一种实用高效的架构设计思路。

快速迭代

作为核心的应用,需要一套完备的 CI/CD 流程去保障应用的质量,针对函数的质量,我们基于了 Serverless Devs 工具链同样实现了一套研发全流程方案:。不仅具备函数多环境,函数灰度切流,函数可观测等能力,而且通过这套 Serverless 研发体系,我们实现了 1 分钟开始进入开发,5 分钟完成上线的能力,同时默认具备异地多活的能力。

限流降级,异地多活

对于大流量应用的稳定性,限流保护,降级预案,异地多活是三大必备功能。特别是大促的时候,非预期的流量都可能引起系统雪崩,在我们的 Serverless 研发平台上,集成了阿里云函数计算的并发度流控,QPS 流控的能力,做到了函数粒度的流控。

另外一个亮点是,FaaS 的容灾方案与传统应用的容灾方案相比,有着巨大的优势。在传统应用的容灾方案中,异地多活需要在备机房中准备冗余的机器资源,这些资源也就是成本,但是在 Serverless 场景下的方案中,因为是快速弹性,秒级别就能完成资源的准备,所以无需进行资源冗余准备,这就大大节省了成本。虽然是三单元,但是成本仍然是一个单元的费用,目前所有核心的函数应用,我们都默认实现了三单元容灾。

冷启动优化

如果你的业务对于冷启动非常的敏感,比如 50 ~ 100毫秒的延迟增加,你都无法接受的话,不要担心,我们仍可以通过扩容策略进行弥补:预留资源来消减冷启动对业务的影响。

  • 预留实例,根据产品流量曲线,很容易得出固定流量是多少。这部分流量用“预留模式”,适合冷启动敏感的业务;
  • 按量扩容模式,按用户设置的并发度或者 CPU 利用率阈值进行扩容,扩容中的实例,不会立即接收流量,而是实例 Ready 后再进行服务。所以扩容中新增的流量会仍然派发到“正在服务中”的实例,并不会触发冷启动。

展望

在过去的 2021 年,高德在 Serverless 领域中,做了很多方向的探索,也实现了部分核心业务的 Serverless 化。单在 Serverless 的业务 QPS 峰值就已经超过 40W QPS, 然而这不是终点,只是刚刚开始,后续我们会全面转向 Serverless 化。比如,地图数据的处理,图片的栽剪,消息的消费等等这些离线的非在线应用,它们同样也是 Serverless 的最佳适用场景,我们期望今后有更多的场景去使用 Serverless,享受 Serverless 给我们带来的技术红利 !

原文链接

本文为阿里云原创内容,未经允许不得转载。

如虎添翼 高德地图+Serverless 护航你的假日出行相关推荐

  1. 如虎添翼|高德地图+Serverless 护航你的假日出行

    作者:刘金龙(福辰)  高德团队 引言 "前方事故多发地段,请注意保持车距-""您已疲劳驾驶,请注意休息-""前方经过泰山旅游景区,中国 5A 级景区 ...

  2. 高德地图+Serverless 护航你的假日出行

    ​ 引言 "前方事故多发地段,请注意保持车距-" "您已疲劳驾驶,请注意休息-" "前方经过泰山旅游景区,中国 5 A级景区,是第一批国家级风景名胜区 ...

  3. html百度地图取电,盯盯拍支持高德地图AR导航,升级智慧出行新体验

    很多用户在驾车时都会遇到一些认路的烦恼,即使开着地图导航,也容易在立交桥.匝道等复杂路段认错,甚至有些新手司机不知道该何时并线等情况,现在AR实景导航可以很好地解决这些问题,AR导航能够直接将导航指引 ...

  4. 高德地图发布上海迪士尼出行攻略 独家上线智慧景区解决方案

    本月16日,让国人翘首以盼的上海迪士尼乐园即将开园迎客,大量游客将从全国各地涌入上海迪士尼乐园.为了让全国各地游客在迪士尼都能玩得开心顺利,上海交警特别联合高德地图于近日发布<上海迪士尼开园首周 ...

  5. 函数计算助力高德地图平稳支撑亿级流量高峰

    简介:2020 年的"十一出行节"期间,高德地图创造了记录 --截止 2020 年 10 月 1 日 13 时 27 分 27 秒,高德地图当日活跃用户突破 1 亿,比 2019 ...

  6. 高德地图2016清明出行交通预测报告(完整版)

    高德地图2016清明出行交通预测报告(完整版) 声明:本文由入驻搜狐公众平台的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场. 全国 清明节易拥堵高速分布图 2016年的第一个小长假清 ...

  7. 高德地图上线高考出行专项服务

    2021年高考即将拉开帷幕,高德地图今日推出多项高考出行服务保障,对各地考场位置进行特殊标注,方便考生和家长查询,播报提醒车主考试期间不要鸣笛. 公开资料显示,参加今年高考的考生达到1078万,考生和 ...

  8. 地铁人多不多可在线查询了 高德地图率先在北京上线新功能

    2月12日,本周北京市正安全有序地复工复产,公共交通客流开始上升.高德地图今日紧急上线了地铁客流满载情况查询功能,即日起,北京市民使用最新版的高德地图,就可以实时了解地铁客流是否密集.乘坐是否舒适,有 ...

  9. 亿沃钛计算机科技有限公司怎么样,2017年8月联通沃指数发布:高德地图活跃用户2.17亿,排名行业第一...

    [每日科技网] 近日,中国联通发布了2017年8月<沃指数之移动应用APP排行榜>,榜单显示:在地图导航类别中,高德地图的活跃用户数达到2.1707亿,排在行业第一的位置.第二名为百度地图 ...

最新文章

  1. CocoaPods 安装与使用教程
  2. Strategy Pattern(策略模式)
  3. Arcgis for JS扩展GraphicLayer实现区域对象的聚类统计与展示
  4. Sql Server 邮件日志 操作
  5. leetcode 204. 计数质数
  6. C#中二进制和流之间的各种相互转换
  7. 对数正态分布_正态分布与幂律分布
  8. 正则表达式 以字符串开头_干货-Shell编程之正则表达式
  9. 轻薄于型 强悍于内 拯救者9000X 2021硬核发布
  10. C++ 对象间通信框架 V2.0 ××××××× 之(五)
  11. 三十功名尘与土,八千里路云和月
  12. app商城开发要多少钱_价格透明_讲讲行业收费套路_OctShop
  13. 初级程序员应该怎么选电脑?来自从业5年维修工程师的建议
  14. MySQL34道例题
  15. request与response的用法
  16. IRQF_ONESHOT
  17. window服务如何通过程序如何打开谷歌浏览器并登陆指定网站_亚马逊如何看listing销量,亚马逊如何看销量排名...
  18. 图像处理计算机考试,计算机图形图像处理试题(A)(含答案).doc
  19. 光耦w314的各引脚图_P184光耦电路作用,光电晶体管隔离24v输出电路
  20. 张一鸣:不甘平庸的年轻人 全都有同一个特质

热门文章

  1. 吃鸡用什么蓝牙耳机效果好?手游吃鸡公认最好的几款蓝牙耳机
  2. 计算机应用期刊查重嘛,关于期刊投稿,你所碰到的几件事
  3. 计算机控制系统课程设计ad转换,计算机a/d转换器与系统的连接及举例
  4. 传感器原理与检测技术复习笔记第四章-电感式传感器
  5. 安骑士主机日志实时分析功能
  6. linux中如何撤销上次命令,linux撤销cp命令的提示
  7. 表单、表格常用属性大全
  8. HyperMate Pro硬件钱包全体验
  9. 流式大数据实时处理技术、平台及应用
  10. 海康萤石NTP时间不同步问题思路X5C