当我们在看Loki的架构文档时,社区都会宣称Loki是一个可以支持多租户模式下运行的日志系统,但我们再想进一步了解时,它却含蓄的表示Loki开启多租户只需要满足两个条件:

  • 配置文件中添加 auth_enabled: true

  • 请求头内带上租户信息X-Scope-OrgID

这一切似乎都在告诉你,"快来用我吧,这很简单",事实上当我们真的要在kubernetes中构建一个多租户的日志系统时,我们需要考虑的远不止于此。

通常当我们在面对一个多租户的日志系统架构时,出于对日志存储的考虑,我们一般会有两种模式来影响系统的架构。

1. 日志集中存储(后文以方案A代称)

和Loki原生一样,在日志进入到集群内,经过一系列校验和索引后集中的将日志统一写入后端存储上。

2. 日志分区存储(后文以方案B代称)

反中心存储架构,每个租户或项目都可以拥有独立的日志服务和存储区块来保存日志。

从直觉上来看,日志分区带来的整体结构会更为复杂,除了需要自己开发控制器来管理loki服务的生命周期外,它还需要为网关提供正确的路由策略。不过,不管多租户的系统选择何种方案,在本文我们也需从日志的整个流程来阐述不同方案的实现。

第一关:Loki划分

Loki是最终承载日志存储和查询的服务,在多租户的模式下,不管是大集群还是小服务,Loki本身也存在一些配置空间需要架构者去适配。其中特别是在面对大集群场景下,保证每个租户的日志写入和查询所占资源的合理分配调度就显得尤为重要。

在原生配置中,大部分关于租户的调整可以在下面两个配置区块中完成:

  • query_frontend_config

  • limits_config

query_frontend_config

query_frontend是Loki分布式集群模式下的日志查询最前端,它承担着用户日志查询请求的分解和聚合工作。那么显然,query_frontend对于请求的处理资源应避免被单个用户过分抢占。

每个frontend处理的租户

[max_outstanding_per_tenant: <int> | default = 100]

limits_config

limits_config基本控制了Loki全局的一些流控参数和局部的租户资源分配,这里面可以通过Loki的-runtime-config启动参数来让服务动态定期的加载租户限制。这部分可以通过runtime_config.go中的runtimeConfigValues结构体内看到

type runtimeConfigValues struct {TenantLimits map[string]*validation.Limits `yaml:"overrides"`Multi kv.MultiRuntimeConfig `yaml:"multi_kv_config"`
}

可以看到对于TenantLimits内的限制配置是直接继承limits_config的,那么这部分的结构应该就是下面这样:

overrides:tenantA:ingestion_rate_mb: 10max_streams_per_user: 100000max_chunks_per_query: 100000tenantB:max_streams_per_user: 1000000max_chunks_per_query: 1000000

当我们在选择采用方案A的日志架构时,关于租户部分的限制逻辑就应该要根据租户内的日志规模灵活的配置。如果选择方案B,由于每个租户占有完整的Loki资源,所以这部分逻辑就直接由原生的limits_config控制。

第二关:日志客户端

在Kubernetes环境下,最重要是让日志客户端知道被采集的容器所属的租户信息。这部分实现可以是通过日志Operator或者是解析kubernetes元数据来实现。虽然这两个实现方式不同,不过最终目的都是让客户端在采集日之后,在日志流的请求上添加租户信息头。下面我分别以logging-operator和fluentbit/fluentd这两种实现方式来描述他们的实现逻辑

Logging Operator

Logging Operator是BanzaiCloud下开源的一个云原生场景下的日志采集方案。它可以通过创建NameSpace级别的CRD资源flow和output来控制日志的解析和输出。

通过Operator的方式可以精细的控制租户内的日志需要被采集的容器,以及控制它们的流向。以输出到loki举例,通常在只需在租户的命名空间内创建如下资源就能满足需求。

  • output.yaml,在创建资源时带入租户相关的信息

apiVersion: logging.banzaicloud.io/v1beta1
kind: Output
metadata:name: loki-outputnamespace: <tenantA-namespace>
spec:loki:url: http://loki:3100username: <tenantA>password: <tenantA>tenant: <tenantA>
...
  • flow.yaml,在创建资源时关联租户需要被采集日志的容器,以及指定输出

apiVersion: logging.banzaicloud.io/v1beta1
kind: Flowmetadata:name: flownamespace:  <tenantA-namespace>spec:localOutputRefs:- loki-outputmatch:- select:labels:app: nginxfilters:- parser:remove_key_name_field: truereserve_data: truekey_name: "log"

可以看到通过operator来管理多租户的日志是一个非常简单且优雅的方式,同时通过CRD的方式创建资源对开发者集成到项目也十分友好。这也是我比较推荐的日志客户端方案。

FluentBit/FluentD

FluentBit和FluentD的Loki插件同样支持对多租户的配置。对于它们而言最重要的是让其感知到日志的租户信息。与Operator在CRD中直接声明租户信息不同,直接采用客户端方案就需要通过Kubernetes Metadata的方式来主动抓取租户信息。对租户信息的定义,我们会声明在资源的label中。不过对于不同的客户端,label定义的路径还是比较有讲究的。它们总体处理流程如下:

  • FluentD

fluentd的kubernetes-metadata-filter可以抓取到namespaces_label,所以我比较推荐将租户信息定义在命名空间内。

apiVersion: v1
kind: Namespace
metadata:labels:tenant: <tenantA>name: <taenant-namespace>

这样在就可以loki的插件中直接提取namespace中的租户标签内容,实现逻辑如下

<match loki.**>@type loki@id loki.outputurl "http://loki:3100"# 直接提取命名空间内的租户信息tenant ${$.kubernetes.namespace_labels.tenant}username <username>password <password><label>tenant ${$.kubernetes.namespace_labels.tenant}</label>
  • FluentBit

fluentbit的metadata是从pod中抓取,那么我们就需要将租户信息定义在workload的template.metadata.labels当中,如下:

apiVersion: apps/v1
kind: Deployment
metadata:labels:app:  nginx
spec:template:metadata:labels:app: nginxtenant: <tanant-A>

之后就需要利用rewrite_tag将容器的租户信息提取出来进行日志管道切分。并在output阶段针对不同日志管道进行输出。它的实现逻辑如下:

[FILTER]Name           kubernetesMatch          kube.*Kube_URL       https://kubernetes.default.svc:443Merge_Log      On
[FILTER]Name           rewrite_tagMatch          kube.*#提取pod中的租户信息,并进行日志管道切分Rule           $kubernetes['labels']['tenant'] ^(.*)$ tenant.$kubernetes['labels']['tenant'].$TAG falseEmitter_Name   re_emitted
[Output]Name           grafana-lokiMatch          tenant.tenantA.*Url            http://loki:3100/api/prom/pushTenantID       "tenantA"
[Output]Name           grafana-lokiMatch          tenant.tenantB.*Url            http://loki:3100/api/prom/pushTenantID       "tenantB"

可以看到不管是用FluentBit还是Fluentd的方式进行多租户的配置,它们不但对标签有一定的要求,对日志的输出路径配置也不是非常灵活。所以fluentd它比较做适合方案A的日志客户端,而fluentbit比较适合做方案B的日志客户端

第三层:日志网关

日志网关准确的说是Loki服务的网关,对于方案A来说,一个大Loki集群前面的网关,只需要简单满足能够横向扩展即可,租户的头信息直接传递给后方的Loki服务处理。这类方案相对简单,并无特别说明。只需注意针对查询接口的配置需调试优化,例如网关服务与upstream之间的连接超时时间网关服务response数据包大小等。

本文想说明的日志网关是针对方案B场景下,解决针对不同租户的日志路由问题。从上文可以看到,在方案B中,我们引入了一个控制器来解决租户Loki实例的管理问题。但是这样就带来一个新的问题需要解决,那就是Loki的服务需要注册到网关,并实现路由规则的生成。这部分可以由集群的控制器CRD资源作为网关的upsteam源配置。控制器的逻辑如下:

网关服务在处理租户头信息时,路由部分的逻辑为判断Header中X-Scope-OrgID带租户信息的日志请求,并将其转发到对应的Loki服务。我们以nginx作为网关举个例,它的核心逻辑如下:

#upstream内地址由sidecar从CRD中获取loki实例后渲染生成upstream tenantA {server x.x.x.x:3100;
}
upstream tenantB {server y.y.y.y:3100;
}
server {location / {set tenant $http_x_scope_orgid;proxy_pass http://$tenant;include proxy_params;

总结

本文介绍了基于Loki在多租户模式下的两种日志架构,分别为日志集中存储日志分区存储。他们分别具备如下的特点:

方案 Loki架构 客户端架构 网关架构 开发难度 运维难度 自动化程度
日志集中存储 集群、复杂 fluentd / fluentbit 简单 简单 中等
日志分区存储 简单 Logging Opeator 较复杂 较复杂(控制器部分) 中等

对于团队内具备kubernetes operator相关开发经验的同学可以采用日志分区存储方案,如果团队内偏向运维方向,可以选择日志集中存储方案。

日志多租户架构下的Loki方案相关推荐

  1. 基于Mybatis-Plus的多租户架构下的数据隔离解决方案

    目录 一.多租户架构 方案1:数据分区隔离(Partitioned (discriminator) data) 方案2:数据库实例隔离(Separate database) 方案3:Schema隔离( ...

  2. 【转】微服务架构下分布式事务方案

    1 微服务的发展 微服务倡导将复杂的单体应用拆分为若干个功能简单.松耦合的服务,这样可以降低开发难度.增强扩展性.便于敏捷开发.当前被越来越多的开发者推崇,很多互联网行业巨头.开源社区等都开始了微服务 ...

  3. Spring Boot集成Mybatis-Plus多租户架构实战

    目前公司产品就是对外企业服务,入职后了解到SaaS模式和私有部署,当我第一次听到SaaS时,我不是很理解.经过查阅资料,以及在后续研发功能时,不断的加深了对多租户的理解. 那么接下来让我们问自己几个问 ...

  4. 云原生架构下日志服务数据预处理

    简介:本篇实践将以某家国际教育机构为例,为大家详细介绍云原生架构下日志服务数据预处理以及对应的解决方案和最佳实践操作手册,方便用户快速对号入座,解决云原生架构下的常见日志难题. 直达最佳实践:[htt ...

  5. 分布式架构下,Session 共享有什么方案?

    来自:会点代码的大叔 分布式架构下的 Session 共享,也称作分布式 Session 一致性:分布式架构下 Session 共享有哪些问题,又有哪些解决方案,让我们一起看一下. 01 Sessio ...

  6. 一篇读懂分布式架构下的负载均衡技术:分类、原理、算法、常见方案等

    1.引言 关于"负载均衡"的解释,百度词条里:负载均衡,英文叫Load Balance,意思就是将请求或者数据分摊到多个操作单元上进行执行,共同完成工作任务. 负载均衡(Load ...

  7. 用友云微服务架构下配置文件管理利器:配置中心

    微服务架构是这几年IT领域的一个高频词汇,越来越多的项目和应用正在以微服务的思想进行重构.相比于单体应用和SOA架构,微服务优势也逐渐凸显,被广大架构师和技术人员引入和推崇.当然,单体应用.SOA.微 ...

  8. MybatisPlus 多租户架构(Multi-tenancy)实现

    在进行多租户架构(Multi-tenancy)实现之前,先了解一下相关的定义吧: 什么是多租户 多租户技术或称多重租赁技术,简称SaaS,是一种软件架构技术,是实现如何在多用户环境下(此处的多用户一般 ...

  9. java multi tenancy_MybatisPlus 多租户架构(Multi-tenancy)实现详解

    在进行多租户架构(Multi-tenancy)实现之前,先了解一下相关的定义吧: 什么是多租户 多租户技术或称多重租赁技术,简称SaaS,是一种软件架构技术,是实现如何在多用户环境下(此处的多用户一般 ...

最新文章

  1. 在XMPP的JAVA开源实现Openfire中,增加LBS 附近的人功能
  2. Linux 增加对外开放的端口
  3. 国产化之路-统信UOS /Nginx /Asp.Net Core+ EF Core 3.1/达梦DM8实现简单增删改查操作
  4. 类型“unknown”上不存在属性“foreach”_JavaScript红宝书第四版精简解析系列--映射Map数据类型...
  5. ASP.NET MVC 多语言开发简单案例
  6. 爬虫-14-利用代理爬取数据
  7. java标准i o重定向_Java I/O(二)其他常用的输入输出流PrintStream等、标准流重定向...
  8. 阶分差数 matlab,matlab中aicbic确定阶数的太小
  9. dhcp snooping华为_使用DHCP snooping 功能防止DHCP Server仿冒者攻击(华为交换机)
  10. wince 内存释放_【转载】让我生不如死的WINCE内存泄漏
  11. Code UI Automation脱离VS黑盒自动化测试工具编写
  12. 合肥二手房房价分析(多元线性回归)
  13. 文明与征服新套路,北条点火队
  14. 清华大学NLP实验室刘知远教授组与华为合作招聘博士后
  15. 动态等待转圈效果(HTML、CSS、JS)
  16. 《MATLAB 神经网络43个案例分析》:第25章 基于MIV的神经网络变量筛选----基于BP神经网络的变量筛选
  17. Windows 11快捷键功能大全 28个Windows 11快捷键功能介绍
  18. 自动锁定计算机软件,教你电脑锁屏怎么设置,让电脑自动锁屏
  19. 为什么 1KB 等于 1024 B
  20. 马来西亚引入中国人工智能 ,阿里云ET城市大脑为吉隆坡治堵

热门文章

  1. oracle连接查询详解
  2. JavaScript初学者编程题(11)
  3. 泉州中考分数如何计算机,2019年泉州中考总分多少分,泉州中考各个科目多少分...
  4. 最小环算法求解(Dijkstra算法+Floyd算法)
  5. Food HDU - 4292 网络流
  6. 点分治问题 ----------- P3727 曼哈顿计划E[点分治+博弈SG函数打表找规律]
  7. HDU2196[树形dp+二次扫描]java和c++版本题解
  8. 有关计算机辅助教学方面的问题,浅析高校计算机辅助教学应用的有关问题
  9. c语言信号灯作用,交通信号灯对交通领域的作用与影响
  10. N - Tram POJ - 1847