MLOps 技术栈架构

MLOps stack architecture

MLOps stack architecture

MLOps

  • 全球的MLOps和ML工具概览
  • 聊聊MLOps是什么,它对算法工程师带来了什么
  • 可重复可复现的机器学习在生产中的12个要素
  • 软件工程大师 Martin Fowler 谈机器学习持续交付
  • 谷歌大佬谈 MLOps :机器学习中的持续交付和自动化流水线
  • 如何测试你的机器学习流水线?
  • 浅述MLOps的价值
  • AI 产业三大发展趋势(AutoML/MLOps/XAI)将加速企业 AI 应用落地
  • Algorithmia 首席执行官 Diego 谈从研发到人工智能的投资回报率
  • 机器学习模型在生产中表现不佳的5个原因

    • 为什么您的机器学习模型可能表现不佳(现实的变化-概念漂移(真实世界)、工程与数据科学迷失在转化中(应用接口)、应用程序更新(应用接口)、特征处理 Bug(内部数据流水线)、数据 Schema 变化(内部数据流水线))、使用指示器来检测模型的常见问题(字段删除、类型不匹配、默认值更改、值超出范围、分布漂移、性能指标下降)
  • 如何将 MLOps 用于物联网和边缘设备(Valohai)
  • 降低模型输出风险的三种方法(Valohai)
  • Arize AI 对顶级 ML 团队调查得出的 3 个结论

    • 解决模型问题仍然太痛苦和缓慢(建议:评估并实现一个 ML 可观测性平台,帮助暴露和消除AI盲点。)、ML 团队需要与业务主管更好地沟通(建议:提高内部可见性、提高 ML 读写能力并将模型指标与业务结果联系起来)、可解释性很重要,但它不是一切(建议:不要仅仅依靠可解释性;采取积极主动的方法进行模型性能管理。)
  • 识别人工智能用户场景---一种规格并不适用于所有场景(Noogata)
  • 如何规模化企业人工智能(Noogata)

无代码与以数据为中心的 AI 平台

  • 无代码 AI 和 MLOps:无代码 AI 仅用于不会代码的终端用户(Valohai)
  • 以数据为中心的人工智能应该如何实施(Valohai)
  • 数据优先的人工智能会是下一个颠覆性的大事件吗?(Continual)
  • 无代码 AI 概览(Levity)
  • 无代码人工智能:它是什么,它为什么重要?(Noogata)
  • 我们为什么创建无代码 AI 平台 Noogata
  • 无代码人工智能平台:成功的基石(Noogata)
  • 无代码 AI 工具的类型(NoCode.ai)
  • 无代码平台如何为中小型企业带来人工智能
  • DLOps:用于深度学习的 MLOps(Valohai)

数据版本管理

捕获数据版本以重现、跟踪和记录您的 ML 模型血缘。

  • 用于 MLOps 的最佳数据版本控制工具(Aporia)
  • 数据科学家 Emily Gorcenski 谈数据版本控制(CD4ML)

DVC

  • DVC 官网教程-中文版

特征存储

  • 现代数据团队的特征工程(Continual)
  • 现代数据栈的未来(Continual)
  • 特征平台(Feature Store):您需要知道的关于特征平台的一切信息(Continuous)
  • 用于 MLOps 的最佳特征平台(Aporia)

AutoML

NNI

  • 浅析自动机器学习(AutoML)工具NNI

模型实验跟踪

跟踪有关实验的重要信息,如参数、指标和模型。

MLflow

  • 浅谈机器学习生命周期平台MLflow
  • MLflow 快速入门

机器学习流水线(Pipeline)

自动化ML实验的步骤。调度流水线运行,以根据新数据重新训练模型。

  • 开源机器学习流水线工具调研(MLOps)
  • 正向数据工程和逆向数据工程(Prefect工作流)
  • 开源机器学习工作流Ploomber
  • 五分钟快速了解Airflow工作流
  • 浅析数据工作流Prefect
  • 浅析机器学习工作流Kubflow Pipelines
  • 如何将 Apache Airflow 用于机器学习工作流
  • Kubeflow 和 Argo 的综合比较
  • 用于 MLOps 的最佳训练编排工具(Aporia)

模型可视化

  • 如何将模型可视化工具Netron改造为通用的WEB服务(Flask)?
  • 机器学习模型可视化类型和工具
  • 可视化机器学习实验指标和超参数的最佳工具(Neptune)
  • 机器学习模型可视化:指南和工具(Neptune)
  • 机器学习模型可视化的最佳工具(Neptune)

模型服务

创建API端点并使用模型进行预测。

  • 浅析云原生模型推理服务框架KServe
  • 在线推理是否会导致您的白发?

BentoML

  • 快速入门统一模型部署(Model Serving)框架 BentoML
  • BentoML核心概念(一):服务定义
  • BentoML核心概念(二):API 和 IO 描述符
  • BentoML核心概念(三):构建Bentos
  • BentoML核心概念(四):模型和 Bento 管理

Seldon

  • 使用 Seldon Core 服务模型

    • 什么是模型服务(通过 API 与您的模型交互、将模型部署到云端或边缘设备、轻松扩展模型以满足用户需求)、Seldon Core简介、Seldon Core 安装、Seldon 如何为模型服务、使用自定义 Docker 镜像服务、Seldon 适合你吗
  • 使用 Seldon Alibi 进行模型监控

    • 模型监控如何工作(数据漂移、异常值、偏见)、Alibi Detect 简介、监控模型(部署图像分类器、部署漂移检测器)、从 Alibi 中获取指标、Alibi 适合你吗?

可解释机器学习

  • Umang 谈部署可解释机器学习面临的挑战
  • 机器学习模型可解释性实践指南(Aporia)
  • ML 模型解释工具:模型解释是什么、为什么需要模型解释以及如何解释模型

模型监控

  • 机器学习可观察性 VS 机器学习监控(Aporia)
  • 如何理解机器学习中的偏见和公平(Aporia)
  • 如何监控你的 ML 流水线
  • 特定领域的机器学习监控
  • 机器学习模型监控的 9 个技巧
  • 监控模型在生产环境的性能(Arize)
  • 可解释的监控:停止盲目行动并监控您的 AI
  • 评估ML监控解决方案时要避免的常见陷阱(mona)
  • ML 模型再训练无法解决的问题(mona)
  • 监控生产环境中的机器学习模型

模型监控概述

  • 什么是模型监控?(Valohai)

    • 为什么要监控模型、机器学习模型监控清单(数据分布变化、性能改变、健康指标/运营指标、数据完整性、分段性能、偏见/公平)、在 Valohai 中如何监控模型(存储指标、在 UI 中可视化指标)
  • 机器学习模型监控清单

    • 服务健康、数据质量和完整性、数据和目标漂移、模型性能、分段性能表现、偏见/公平、异常值
  • 模型监控:定义、重要性和最佳实践(AI Multiple)

    • 什么是模型监控、为什么模型监控很重要、ML 模型随时间退化的原因(不断变化的环境、更改业务数据)、模型监控变量(真实值与预测值检查、数据分布变化、无错误数据、公平、运行指标)
  • 机器学习模型监控(Aporia)

    • 机器学习模型监控(什么是模型监控、如何监控机器学习(数据漂移检测、数据完整性检测、概念漂移检测、数据偏差、异常))、模型中的漂移检测(模型漂移、数据漂移(KS检验、PSI、Z-score)、概念漂移)、机器学习性能监控(如何监控机器学习性能、如何提高模型性能)、机器学习模型管理、模型可解释性、机器学习实验跟踪、机器学习模型注册表
  • MLOps:模型监控

    • 模型监控背景、模型监控动机、模型监控指标(稳定性指标、性能表现指标、运营指标)
  • 监控生产中的ML系统,您应该跟踪哪些指标?

    • 为什么需要ML监控、ML监控动机、模型监控金字塔(软件后端、数据、ML模型、业务或产品KPI)、模型监控指标(ML系统健康监测、ML数据质量监控、ML模型质量监控、业务指标和KPI)、模型监控利益相关者、模型监控难点

模型漂移

  • 机器学习中的概念漂移(Aporia)

    • 机器学习中的漂移类型(概念漂移、预测漂移、标签漂移、特征漂移)、概念漂移可以以不同的方式出现(突然漂移、逐渐漂移、递增的漂移、重复出现的概念)、概念漂移的两种类型(虚拟的漂移、真正的漂移)、现实生活中的概念漂移、概念漂移的难点
  • 机器学习概念漂移检测方法(Aporia)

    • 统计方法(JS散度、KL散度、KS检验)、统计过程控制方法(DDM/EDDM、CUMSUM及其变体PH)、时间窗口分布方法(ADWIN、Paired Learners)、上下文方法(树特征)、漂移检测实现工具
  • 如何检测和克服MLOps中的模型漂移

    • 模型漂移的类型(概念漂移、数据漂移)、解决模型漂移、创建可持续的机器学习模型
  • 数据漂移、概念漂移以及如何监控它们(mona)

    • 什么是数据漂移、什么是概念漂移、数据漂移和概念漂移的区别、什么时候应该关注概念漂移、监控数据漂移和概念漂移的建议

模型监控数据类型

  • 如何检测文本(NLP)和图像(计算机视觉)数据漂移

    • 四种不同类型的实时监测技术来检测和减少模型漂移(数据质量、模型质量、模型偏差、模型可解释性)、NLP 数据漂移(协变量漂移、标签漂移、概念漂移、模型监控方法)、图像数据漂移(模型监控方法
  • 使用 Arize 监控非结构化数据(Arize)

    • 为什么要 Embeddings、Arize 发布 Embeddings 的支持、使用 Arize 的示例工作流程
  • 数据漂移检测(一):使用表格数据的多变量漂移(Arthur)

    • 单变量漂移检测(测量现在通过模型的数据训练集之间的分布相似性)、多变量漂移检测(我们必须考虑数据的高维联合分布,将多维辅助模型拟合到训练集的完整联合分布
  • 数据漂移检测(二):NLP 和 CV 中的非结构化数据(Arthur)

    • 非结构化数据漂移检测方法、概述(向量表示、密度模型、评分)、评估

模型监控工具

  • ML 模型监控最佳工具

    • 如何比较 ML 模型监控工具(易于集成、灵活性和表现力、开销、监控功能、警报)、ML 模型监控工具(Neptune、Arize、WhyLabs、Grafana+Prometheus、Evidently(开源)、Qualdo、Fiddler、Amazon SageMaker Model Monitor、Seldon Alibi Detect(开源)、Censius)
  • 一个精选的模型监控工具列表

    • Aporia、Deepchecks(开源)、MLRun、Evidently(开源)、WhyLabs
  • 机器学习模型监控工具:Evidently 与 Seldon Alibi 对比

    • 比较标准(兼容性、集成、能力) 、Evidently(离线分析、实时监控)、Seldon Alibi Detect(离线分析、实时监控

Evidently

  • 如何检测、评估和可视化数据中的历史漂移(Evidently)
  • 如何在 20 天内损坏一个模型? 一个生产环境模型分析教程(Evidently)
  • 你的模型隐藏了什么? 一个评估 ML 模型的教程(Evidently)

Seldon Alibi Detect

  • 在 IMDB 电影评论数据集上进行文本数据漂移检测(Seldon Alibi Detect)

    • 加载数据集/Tokenizer、预处理、KS检验MMD(TensorFlow/PyTorch)、从头开始训练的模型中的 embeddings(TensorFlow)
  • 在 CIFAR-10 数据集上使用最大均值差异(MMD)漂移检测器(Seldon Alibi Detect)
  • 在 CIFAR-10 数据集上使用 Kolmogorov Smirnov 数据漂移检测器(Seldon Alibi Detect)

人工智能系统(AI System)

  • 人工智能系统(一):概述
  • 人工智能系统(二):技术栈

向量数据库

  • 云原生向量数据库Milvus(一)-简述、系统架构及应用场景
  • 云原生向量数据库Milvus(二)-数据与索引的处理流程、索引类型及Schema

MLOps专栏文章汇总相关推荐

  1. Diffusion Models专栏文章汇总:入门与实战

    最新最全Diffusion Models论文.代码汇总 1.Diffusion Models扩散模型与深度学习(数学原理和代码解读) 这篇文章适合小白入门看,能快速了解diffusion models ...

  2. \(^_^)/ ITeye 优秀专栏文章汇总

    转自:http://www.iteye.com/magazines/130 博客是记录学习历程.分享经验的最佳平台,多年以来,各路技术大牛在ITeye网站上产生了大量优质的技术文章,并将系列文章集结成 ...

  3. Java线程专栏文章汇总(转)

    原文:http://blog.csdn.net/ghsau/article/details/17609747 JDK5.0之前传统线程        Java线程(一):线程安全与不安全 Java线程 ...

  4. 手把手写C++服务器(0):专栏文章-汇总导航【持续更新】

    手把手写C++服务器(1):网络编程常见误区 手把手写C++服务器(2):C/C++编译链接模型.函数重载隐患.头文件使用规范 手把手写C++服务器(3):C++编译常见问题.编译优化方法.C++库发 ...

  5. 【移动安全】专栏文章汇总

    Android基础知识 移动安全–1–开发基础常识 移动安全–2–四大组件之活动(Activity) 移动安全–3–四大组件之服务 (Service) 移动安全–4–四大组件之广播(Broadcast ...

  6. 【web渗透】专栏文章汇总

    一.基础部分 web渗透–1–写在开始 web渗透–2–web安全原则(上) web渗透–3–web安全原则(下) web渗透–4–web渗透测试清单 web渗透–5–自动化漏洞扫描 web渗透–6– ...

  7. 我爱机器学习网机器学习类别文章汇总

    机器学习领域的几种主要学习方式 From Stumps to Trees to Forests KDD-2014 – The Biggest, Best, and Booming Data Scien ...

  8. 2017年7月历史文章汇总

    2017年7月历史文章汇总 2017-08-01 机器学习研究会 机器学习研究会 2017年1月历史文章汇总 2017年2月历史文章汇总 2017年3月历史文章汇总 2017年4月历史文章汇总 201 ...

  9. 2017年1月历史文章汇总

    2017年1月历史文章汇总 原创 2017-02-01 机器学习研究会 机器学习研究会 2017年1月1日 [推荐]Pandas数据处置速查表 [学习]决策树在商品购买能力预测案例中的算法实现 [学习 ...

最新文章

  1. 国立华侨大学校长写给2010届毕业生的话:人生的二和三
  2. 以太坊开发实战:通过truffle-contract与智能合约交互
  3. 2019牛客暑期多校训练营(第五场)C generator 2 (BSGS)
  4. 计算机专业技能高考试题素材,计算机技能高考模拟试题
  5. 关闭mysql服务的方法有哪些_MySQL--启动和关闭MySQL服务
  6. android的opencv调试,Android opencv 2.3.1 调试及应用(第一篇)
  7. 十三届蓝桥杯国赛 内存空间 python 满分答案
  8. 几种常见的图像模糊处理
  9. OCP认证培训学校哪家比较好?您知道怎么选OCP培训机构吗
  10. 3d打开无法下载star.php,下载的3dmax模型打开失败的原因及解决方法
  11. Android camera2 框架学习记录
  12. Tampermonkey扩展下载
  13. 一些基于新闻表示和用户表示的新闻推荐模型总结:NPA/ NAML/ LSTUR/ NRMS
  14. mip-NeRF代码debug
  15. 【栈】 括 号 匹 配 (LeetCode)
  16. 出于对Java入门学习的考虑从Java基础出发
  17. 视频流快速处理技术之二——基于数据量波动特性的视频静止画面检测
  18. webrtc代码走读二十一(InterArrival::ComputeDeltas)
  19. webpack之打包library
  20. 稳恒(有人透传云)NBIOT模块使用指南(1)

热门文章

  1. Eclipse 中从SVN下载的项目如何解除关联上传到另一SVN路径下
  2. 微信小程序 |做一款跟ChatGPT下五指棋的小程序
  3. 在arcmap和arcgispro中添加在线地图服务
  4. input类型为 file 的相关知识点总结和使用
  5. 【算法】随机数生成器
  6. 《王者荣耀》与BMW宝马跨界合作
  7. Vue2.js:前端在浏览器中网页表格打印的实现方案:window.print、print-js、iframe
  8. 学摄影:五步入门黑白摄影
  9. 手机上的照片批量传到电脑里
  10. 阿里云ECS建站超详细全套完整图文教程