随着Nacos 0.9版本的发布,Nacos 离正式生产版本(GA)又近了一步,其实已经有不少企业已经上了生产,例如虎牙直播。

本周三(今天),晚上 19:00~21:00 将会在 Nacos 钉钉群直播 Nacos 1.0.0 所有发布特性的预览以及升级和使用上的指导。

Nacos环境隔离

通常,企业研发的流程是这样的:先在测试环境开发和测试功能,然后灰度,最后发布到生产环境。并且,为了生产环境的稳定,需要将测试环境和生产环境进行隔离,此时,必然会遇到问题是多环境问题,即:

  • 多个环境的数据如何隔离?
  • 如何优雅的隔离?(不需要用户做任何改动)

本文将就 Nacos 环境隔离,向大家介绍阿里在这方面的实践经验。

什么是环境?

说到环境隔离,首先应该定义好什么是环境。

环境这个词目前还没有一个比较统一的定义,有些公司叫环境,在阿里云上叫 region,在 Kubernetes 架构中叫 namespace。本文认为,环境是逻辑上或物理上独立的一整套系统,这套系统中包含了处理用户请求的全部组件,例如网关、服务框架、微服务注册中心、配置中心、消息系统、缓存、数据库等,可以处理指定类别的请求。

举个例子,很多网站都会有用户 ID 的概念,可以按照用户 ID 划分,用户 ID 以偶数结尾的请求全部由一套系统处理,而奇数结尾的请求由另一套系统处理。如下图所示。 我们这里说的环境隔离是指物理隔离,即不同环境是指不同的机器集群。

环境隔离有什么用

上一节定义了环境的概念,即一套包含了处理用户请求全部必要组件的系统,用来处理指定类别的请求。本节跟大家讨论一下环境隔离有哪些好处。从概念的定义可以看出,环境隔离至少有三个方面的好处:故障隔离、故障恢复、灰度测试;

故障隔离

首先,因为环境是能够处理用户请求的独立组件单元,也就是说用户请求的处理链路有多长,都不会跳出指定的机器集群。即使这部分机器故障了,也只是会影响部分用户,从而把故障隔离在指定的范围内。如果我们按照用户id把全部机器分为十个环境,那么一个环境出问题,对用户的影响会降低为十分之一,大大提高系统可用性。

故障恢复

环境隔离的另一个重要优势是可以快速恢复故障。当某个环境的服务出现问题之后,可以快速通过下发配置,改变用户请求的路由方向,把请求路由到另一套环境,实现秒级故障恢复。当然,这需要一个强大的分布式系统支持,尤其是一个强大的配置中心(如Nacos),需要快速把路由规则配置数据推送到全网的应用进程。

灰度测试

灰度测试是研发流程中不可或缺的一个环节。传统的研发流程中,测试和灰度环节,需要测试同学做各种各样的配置,如绑定host、配置jvm参数、环境变量等等,比较麻烦。经过多年的实践,阿里巴巴内部的测试和灰度对开发和测试非常友好,通过环境隔离功能来保证请求在指定的机器集群处理,开发和测试不需要做任何做任何配置,大大提高了研发效率。

Nacos如何做环境隔离

前两节讲到了环境的概念和环境隔离的作用,本节介绍如何基于 Nacos,实现环境的隔离。

Nacos 脱胎于阿里巴巴中间件部门的软负载小组,在环境隔离的实践过程中,我们是基于 Nacos 去隔离多个物理集群的,同时,在 Nacos 客户端不需要做任何代码改动的情况下,就可以实现环境的自动路由。

开始前,我们先做一些约束:

  • 一台机器上部署的应用都在一个环境内;
  • 一个应用进程内默认情况下只连一个环境的 Nacos;
  • 通过某种手段可以拿到客户端所在机器 IP;
  • 用户对机器的网段有规划;

基本原理是:

  • 网络中 32 位的 IPV4 可以划分为很多网段,如192.168.1.0/24,并且一般中大型的企业都会有网段规划,按照一定的用途划分网段。我们可以利用这个原理做环境隔离,即不同网段的 IP 属于不同的环境,如192.168.1.0/24属于环境A, 192.168.2.0/24属于环境B等。
  • Nacos 有两种方式初始化客户端实例,一种是直接告诉客户端 Nacos 服务端的IP;另一种是告诉客户端一个 Endpoint,客户端通过 HTTP 请求到 Endpoint,查询 Nacos 服务端的 IP 列表。这里,我们利用第二种方式进行初始化。
  • 增强 Endpoint 的功能。在 Endpoint 端配置网段和环境的映射关系,Endpoint 在接收到客户端的请求后,根据客户端的来源 IP 所属网段,计算出该客户端的所属环境,然后找到对应环境的 IP 列表返回给客户端。如下图

一个环境隔离server的示例

上面讲了基于IP段做环境隔离的约束和基本原理,那么如何实现一个地址服务器呢。最简单的方法是基于nginx实现,利用nginx的geo模块,做IP端和环境的映射,然后利用nginx返回静态文件内容。

  • 安装nginx http://nginx.org/en/docs/install.html
  • 在nginx-proxy.conf中配置geo映射,参考这里

    geo $env {default        "";192.168.1.0/24 -env-a;192.168.2.0/24 -env-b;
    }
  • 配置nginx根路径及转发规则,这里只需要简单的返回静态文件的内容;

    # 在http模块中配置根路径
    root                    /tmp/htdocs;# 在server模块中配置
    location / {rewrite ^(.*)$  /$1$env break;
    }
  • 配置Nacos服务端IP列表配置文件,在/tmp/hotdocs/nacos目录下配置以环境名结尾的文件,文件内容为IP,一行一个

    $ll /tmp/hotdocs/nacos/
    total 0
    -rw-r--r-- 1 user1 users 0 Mar  5 08:53 serverlist
    -rw-r--r-- 1 user1 users 0 Mar  5 08:53 serverlist-env-a
    -rw-r--r-- 1 user1 users 0 Mar  5 08:53 serverlist-env-b$cat /tmp/hotdocs/nacos/serverlist
    192.168.1.2
    192.168.1.3
  • 验证
curl 'localhost:8080/nacos/serverlist'
192.168.1.2
192.168.1.3

至此, 一个简单的根据IP网段做环境隔离的示例已经可以工作了,不同网段的nacos客户端会自动获取到不同的Nacos服务端IP列表,实现环境隔离。这种方法的好处是用户不需要配置任何参数,各个环境的代码和配置是一样的,但需要提供底层服务的同学做好网络规划和相关配置。

总结

本文简单介绍了环境隔离的概念,环境隔离的三个好处以及 Nacos 如何基于网段做环境隔离。最后,给出了一个基于 Nginx 做 Endpoint 服务端的环境隔离配置示例。需要注意的是,本文只是列出了一种可行的方法,不排除有更优雅的实现方法,如果大家有更好的方法,欢迎到Nacos 社区或官网贡献方案。

原文链接
本文为云栖社区原创内容,未经允许不得转载。

阿里巴巴基于 Nacos 实现环境隔离的实践相关推荐

  1. 为什么我们要把服务注册发现改为阿里巴巴的Nacos而不用 ZooKeeper?

    站在未来的路口,回望历史的迷途,常常会很有意思,因为我们会不经意地兴起疯狂的念头,例如如果当年某事提前发生了,而另外一件事又没有发生会怎样?一如当年的奥匈帝国皇位继承人斐迪南大公夫妇如果没有被塞尔维亚 ...

  2. Nacos系列:基于Nacos的注册中心

    前言 所谓注册中心,其实是分布式架构演进过程中的产物,在系统中充当一个协调者的角色.但是,为什么需要这样一个协调者的角色呢?我们先来看一个例子,以便理解为什么分布式架构中需要有注册中心. 案例 小明和 ...

  3. 魅族容器云平台基于Kubernetes自动化运维实践

    作者简介: 曾彬 阿里巴巴 高级技术专家 互联网老兵,十多年的基础架构经验,曾在支付宝.爱立信.魅族等担任系统架构师,从事过 Linux 内核开发,Java 中间件.SOA 应用框架的设计实现.云平台 ...

  4. 分享实录 | 阿里巴巴代码缺陷检测探索与实践

    简介: 3月3日,阿里巴巴算法工程师别象在云效DevOps交流群中分享了<阿里巴巴代码缺陷检测探索与实践>.从阿里巴巴代码平台在探索缺陷检测和补丁推荐问题时遇到的挑战入手,介绍了目前业界和 ...

  5. 基于Nacos和Sentinel实现灰度路由和流量防护一体化

    基于 Nacos 和 Sentinel ,实现灰度路由和流量防护一体化的解决方案,发布在最新的 Nepxion Discovery 5.4.0 版本,具体参考: 源码主页,请访问 :源码主页 指南主页 ...

  6. Spring Cloud Alibaba 配置中心:基于 Nacos 集中管理应用配置

    上一讲我们讲解 Sentinel 中熔断与限流的处理方式,了解了 Sentinel 对系统实施保护的原理. 本讲咱们对原有主线内容做一个扩展,先来讲解基于 Nacos 如何集中管理应用配置,实现微服务 ...

  7. mysql分布式数据库实践论文_新浪微博基于MySQL的分布式数据库实践

    提起微博,相信大家都是很了解的.但是有谁知道微博的数据库架构是怎样的呢?在今天举行的2011数据库技术大会上,新浪首席DBA杨海潮为我们详细解读了新浪微博的数据库架构--基于MySQL的分布式数据库实 ...

  8. Facebook基于数据中心的机器学习实践

    周圣盛   文 张怀政 校正 引言 "赋予人们建立社区的力量,让世界更紧密地联系在一起"是Facebook的使命.为了完成这样的目标,Facebook连接了全球两亿的用户(2017 ...

  9. 基于 MaxCompute 的实时数据处理实践

    简介: MaxCompute 通过流式数据高性能写入和秒级别查询能力(查询加速),提供EB级云原生数仓近实时分析能力:高效的实现对变化中的数据进行快速分析及决策辅助.当前Demo基于近实时交互式BI分 ...

最新文章

  1. Docker运行PostgreSQL
  2. ios android rsa加密解密,IOS RSA加密解密
  3. VIT pytorch源码
  4. MFC消息响应函数OnPaint
  5. python基础常用语句-Python-基础-常用术语对照表
  6. BZOJ 1631: [Usaco2007 Feb]Cow Party【最短路】
  7. FreeMarker标签与使用
  8. 怎么设置分组变量_GraphPad Prism 绘图教程 | 手把手教你绘制Grouped(分组)散点图...
  9. 台达b3伺服参数设置方法_2020东莞清溪台达自动化配件回收厂家直购
  10. ShardingSphere-Proxy 主从读写 入门使用
  11. 方维出现 Fatal error: Class 'Session' not found
  12. 拓端tecdat|TensorFlow 2.0 keras开发深度学习模型实例:多层感知器(MLP),卷积神经网络(CNN)和递归神经网络(RNN)
  13. optaplanner学习笔记(六)使用Solver求解器
  14. 【CUDA学习笔记】4.锁页内存(pinned memory or page locked memory)
  15. 基于博客系统的访客日志记录
  16. CANopen COB-ID 使能PDO功能
  17. 非标资产与标准资产_资产商店行动新闻– 2011年6月
  18. JSP学生考勤管理系统考勤管理系统jsp学生迟到早退考勤查询系统(考勤管理系统源码)
  19. 量子运算-比算子描述更广泛的一类刻画量子态在客观世界演化的数学工具
  20. 11.0_[Java 继承]-继承/重写/抽象类/抽象方法/ final 修饰符

热门文章

  1. 为何控件删除不了_过不好又离不了的婚姻,不如这样去处理
  2. 参数 携带 跳转_微信小程序:页面跳转及参数传递
  3. php改名下载,PHP如何给上传的文件改名
  4. python selenium iframe怎么定位_python+selenium 切换iframe
  5. php 强制刷新,web端实现后退强制刷新功能代码
  6. gdb 调试_GDB调试指南-源码查看
  7. 震撼!7月12日山东滨州,中科院向起电的雷暴云发射拖带金属导线专用火箭人工引雷!...
  8. 才27岁,北大博士不幸离世
  9. 【文末有福利】算法博弈论
  10. 趣文:有趣的 Linux 命令