作者 | 新胜 阿里云技术专家

导读:OpenYurt 开源两周以来,以非侵入式的架构设计融合云原生和边缘计算两大领域,引起了不少行业内同学的关注。阿里云推出开源项目 OpenYurt,一方面是把阿里云在云原生边缘计算领域的经验回馈给开源社区,另一方面也希望加速云计算向边缘延伸的进程,并和社区共同探讨未来云原生边缘计算架构的统一标准。为了更好地向社区和用户介绍 OpenYurt,我们特地推出【深度解读OpenYurt】系列文章,本文为系列文章的第二篇,详细介绍了 OpenYurt 的边缘自治能力的设计细节。

系列文章推荐:

  • OpenYurt 开箱测评 | 一键让原生 K8s 集群具备边缘计算能力

OpenYurt介绍

5 月 29 号 OpenYurt 正式开源了。OpenYurt 作为公共云服务 ACK@Edge 的核心框架,已经应用于 CDN、音视频直播、物联网、物流、工业大脑、城市大脑等实际应用场景中,并服务于阿里云 LinkEdge、盒马、优酷、视频云等多个业务或项目中。目前开源的能力包括:

  • 边缘自治能力
  • 原生 K8s 集群一键式转换为边缘集群

项目地址: OpenYurt, 欢迎大家一起来参与开源!

边缘自治特性

1. 特性介绍

将 Kubernetes 系统延展到边缘计算场景,边缘节点将通过公网和云端连接,从公网的不稳定性以及成本等因素考虑,边缘要求断网状态或者弱网状态下边缘业务可以持续运行。我们从 Gartner 的边缘计算报告中提到的边缘计算诉求中,边缘自治也是主要诉求之一:

而从 Kubernetes 系统架构来看,主要因为 Slave Agent(Kubelet) 中的容器信息保存在内存中,断网状态下因为无法从云端获取业务数据,如果节点或者 Kubelet 重启,将无法进行业务容器恢复。如下图:

2. 边缘自治需要解决的问题

因此边缘自治在 Kubernetes 系统里,需要解决下面的问题:

  • 问题 1: 节点异常或重启时,内存数据丢失,网络断连时业务容器无法恢复;
  • 问题 2: 网络长时间断连,云端控制器对业务容器进行驱逐;
  • 问题 3: 长时间断连后网络恢复时,边缘和云端数据的一致性保障。

1)问题 1 的解决方案

解决方案 1:

重构 kubelet 组件,复用或者参考 kubelet 的 checkpoint 功能,持久化容器业务数据到本地磁盘,网络断连状态下利用本地缓存数据实现业务恢复。

该方案经过重构 kubelet,成功解决边缘自治的需求,具备如下优点:

  1. 通过重构 kubelet,方便在 kubelet 中集成对端设备的管理能力;
  2. 通过重构 kubelet,可以对 kubelet 进行轻量化改造。此优点但是也意味着原生 kubelet 功能缺失的问题。

但是也有如下不足:

  1. 可维护性差: 侵入式修改 kubelet core,跟随社区版本升级非常困难,熟悉kubelet的同学都会有同感,kubelet 组件由于直接负责跟计算,存储,网络交互,所以其代码结构和逻辑异常复杂。因此持续维护一个深度修改过的 kubelet 的工作量可想而知;
  2. 可扩展性差: 因为自治能力直接做到重构的 kubelet 组件中,这样边缘节点如果其他组件(如网络组件)想复用边缘自治能力将面临重复造轮子的境地;
  3. 场景耦合更深: 例如在 kubelet 重构中增加了 IOT 设备管理,将可能使 kubelet 和 IOT 场景深度耦合。

解决方案 2 (OpenYurt使用方案):

在边缘节点上增加 web 缓存及请求代理 hub(取名为 YurtHub,商业产品中名为 edge-hub),边缘侧组件(kubelet)和云端通信将经由该组件。YurtHub 相当于带有数据缓存功能的”透明网关“,和云端网络断连状态下,如果节点或者 kubelet 重启,将从 YurtHub 中获取到业务容器相关数据,有效解决边缘自治的问题。

相比解决方案 1,有如下优势:

  • kubelet 零修改,意味原生 kubelet 能力天然具备,同时跟随 Kubernetes 版本升级零负担;
  • 可扩展性强,节点其他组件轻松复用 YurtHub;
  • 与 Kubernetes 设计理念契合,YurtHub 非常容易扩展出更多的能力。

当然 OpenYurt 的解决方案,也会面临如下的问题:原生 kubelet 比较 high-weight,在资源紧张场景下应用会比较挑战。目前商业产品中节点规格推荐 2U4G 起步。

2)问题 2 和 3 的解决方案

问题 2 和问题 3 的解决方案相比比较简单,因此不展开做过多的方案说明和比较。

  • 问题 2:原生云端组件 kube-controller-manager 对 Pod 驱逐解决

该问题正是通过开源组件 yurt-controller-manager 中的 Node Controller 来解决的。如 github 主页介绍所示:

  • 问题 3: 网络恢复时,边缘和云端网络一致性

Kubernetes 系统中,用户是通过云端对边缘进行管控的(如应用部署,升级,扩缩容等),因此当边缘和云端网络断联时,边缘节点将不会从云端同步用户对节点的管控操作,因此断网期间,只要 YurtHub 保持本地缓存数据和断网时刻一致(即断网期间边缘缓存数据不更新),而网络恢复时,再从云端同步最新数据即可。

后续展开

OpenYurt 刚刚开源,也意味这块工作刚刚开始,相信我们更贴近云原生的架构设计,会支持 OpenYurt 走的更远。同时 OpenYurt 设计理念: Extending your native Kubernetes to edge,相信也会让云原生爱好者更为接受。

参考链接

  1. gartner 报告链接

OpenYurt 项目地址:https://github.com/alibaba/openyurt,欢迎大家参与共建!有疑问可加入钉钉交流群:31993519

课程推荐

为了更多开发者能够享受到 Serverless 带来的红利,这一次,我们集结了 10+ 位阿里巴巴 Serverless 领域技术专家,打造出最适合开发者入门的 Serverless 公开课,让你即学即用,轻松拥抱云计算的新范式——Serverless。

点击即可免费观看课程:https://developer.aliyun.com/learning/roadmap/serverless

“阿里巴巴云原生关注微服务、Serverless、容器、Service Mesh 等技术领域、聚焦云原生流行技术趋势、云原生大规模的落地实践,做最懂云原生开发者的公众号。”

深度解读 OpenYurt :边缘自治能力设计解析相关推荐

  1. 深度解读 OpenYurt:从边缘自治看 YurtHub 的扩展能力

    作者 | 新胜  阿里云技术专家 **导读:OpenYurt 开源两周以来,以非侵入式的架构设计融合云原生和边缘计算两大领域,引起了不少行业内同学的关注.阿里云推出开源项目 OpenYurt,一方面是 ...

  2. 深度解读OpenYurt:从边缘自治看YurtHub的扩展能力

    作者 | 新胜  阿里云技术专家 导读:OpenYurt 开源两周以来,以非侵入式的架构设计融合云原生和边缘计算两大领域,引起了不少行业内同学的关注.阿里云推出开源项目 OpenYurt,一方面是把阿 ...

  3. 支持 gRPC 长链接,深度解读 Nacos 2.0 架构设计及新模型

    点击上方蓝色"方志朋",选择"设为星标" 回复"666"获取独家整理的学习资料! 作者 | 杨翊(席翁)  Nacos PMC Nacos ...

  4. OpenYurt 深度解读|开启边缘设备的云原生管理能力

    作者|贾燚星(VMware), 何淋波(阿里云) 北京时间 9 月 27 号,OpenYurt 发布 v0.5.0 版本.新发布版本中首次提出 kubernetes-native非侵入.可扩展的边缘设 ...

  5. OpenYurt 深度解读:如何构建 Kubernetes 原生云边高效协同网络?

    作者 | 郑超 导读:OpenYurt 是阿里巴巴开源的云边协同一体化架构,与同类开源方案相比,OpenYurt 拥有可实现边缘计算全场景覆盖的能力.在之前的一篇文章中,我们介绍了 OpenYurt ...

  6. 管理节点连接不上sql节点_华为云IEF智能边缘平台十万边缘节点管理技术深度解读学习笔记...

    华为云智能边缘平台IEF首席架构师张琦在3月27-28日举办的华为开发者大会2020(Cloud)上,深度解读了十万边缘节点的管理技术,以及如何通过云原生技术和边缘计算结合,构建边缘计算实战场景中所需 ...

  7. 深度解读谷歌开源的最精确自然语言解析器SyntaxNet

    深度解读谷歌开源的最精确自然语言解析器SyntaxNet 谷歌开源了SyntaxNet,也发布了针对英语的预训练解析程序 Parsey McParseface.除了让更多人使用到最先进的分析技术之外, ...

  8. 工业互联网|从边缘智能迈向边缘自治

    文章版权所有,未经授权请勿转载或使用 - 工业互联网得到全球主要国家重视,主要目标均指向先进制造业,发展战略上均体现出国家产业政策引领的特点,行动路径上强调平台和标准化并发展上体现出一定的曲折性,产业 ...

  9. NBA赛事直播超清画质背后:阿里云视频云「窄带高清2.0」技术深度解读

    在半月前结束的NBA总决赛中,百视TV作为全网唯一采用"主播陪你看NBA"模式的直播平台,以"陪看型"赛事解说来面对内容差异化竞争.与此同时,百视TV还运用了& ...

最新文章

  1. WLA-云鹰计划加速千家创新创业企业成为独角兽
  2. 关于mysql的一些问题_关于mysql的一些细节问题
  3. ubuntu18.04下利用deepin-wine-wechat安装微信显示问题
  4. java(5)——数据类型中的字符型和布尔类型
  5. 那些年,我们见过的Java服务端乱象
  6. rename table table1 to table2;
  7. python机器学习库sklearn——线性回归
  8. 西安交大传热学大作业matlab,西安交通大学传热学大作业二维温度场热电比拟实验.doc...
  9. 六、CISSP 官方学习指南(OSG)第 7 版术语对照表
  10. GO WBE学习笔记
  11. 风控建模一、初步认识风控
  12. setprecision、setw、fixed详解
  13. MATLAB 2016b--神经网络工具箱中图形用户界面的使用
  14. Unity3D接入移动MM支付SDK(强联网)的问题
  15. 【双足轮机器人】Ascento技术详解--(5)实验--(7)总结【翻译】
  16. 提前还清房贷的感觉真好
  17. hp服务器通过ilo5安装系统,HPE ProLiant Gen10 通过iLO 5(v1.15) web界面多种方式更新服务器固件,包含升级系统恢复集方法...
  18. “斜杠青年”多巴胺,这次把手伸进了梦里
  19. spark sql 之 collect_set collect_list 后WrappedArray 取值
  20. CardView属性简介

热门文章

  1. Windows APC学习笔记(一)—— APC的本质备用APC队列
  2. 003 通过内存关系找万能按键call
  3. Python3 定向爬虫之“抓取糗事百科图片”
  4. 18、INSERT:插入数据(添加数据)
  5. PAT乙级全套超详细题解【建议收藏】
  6. 计算机基本水平测试内容,浙江师范大学计算机基础水平测试大纲(2018级新生使用)...
  7. page 怎么把list 分页_自定义分页器的实现
  8. 软件项目实施方案_进度、预算、人员和合同变更——科研项目管理精义与实操(十五)...
  9. 【程序人生】不想一辈子做底层码农?快来看看这十条箴言
  10. Docker + Intellij IDEA,提升 10 倍生产力!