快速实现工程化部署,亚马逊云科技为AIGC产品化提供可靠基础
本文将以Stable Diffusion Quick Kit在亚马逊云科技Amazon SageMaker上的部署来介绍Stable Diffusion模型基础知识,HuggingFace Diffusers接口,以及如何使用Quick Kit在SageMaker Endpoint上快速部署推理服务。
Stable Diffusion模型
2022年由StabilityAI、Runway、慕尼黑大学CompVis团队联合发布了Stable Diffusion模型,模型的代码和权重已经开源,目前主流的版本为v1.5(runwayml/stable-diffusion-v1-5)、v2、v2.1(stabilityai/stable-diffusion-2,stabilityai/stable-diffusion-2-1)。Stable Diffusion模型支持通过使用提示词来产生新的图像,描述要包含或省略的元素,以及重新绘制现有的图像,其中包含提示词中描述的新元素,该模型还允许通过提示词在现有的图中进行内补绘制和外补绘制来部分更改。
Stable Diffusion是一个基于Latent Diffusion Models(潜在扩散模型,LDMs)的文图生成(text-to-image)模型。Stable Diffusion由3个部分组成:变分自编码器(Variational Auto Encoder,VAE)、U-Net和一个文本编码器。Stable Diffusion在LAION-5B的一个子集上训练了一个Latent Diffusion Models,该模型专门用于文图生成。模型通过在一个潜在表示空间中迭代“去噪”数据来生成图像,然后将表示结果解码为完整的图像,能够在GPU上不超过10秒时间完成图片生成,大大降低了落地门槛,也带来了文图生成领域的大火。
Stable Diffusion模型
常见格式和存储方式
目前社区里的各类Stable Diffusion衍生模型有不同的文件格式和存储方式,这些不同的文件格式和存储方式需要用户使用不同的代码来进行加载、推理。Stable Diffusion模型的主流文件格式主要有2种,分别是ckpt和safetensors;存储方式上可以区分为单个文件和diffusers结构。
Stable Diffusion模型常见推理方式
Stable Diffusion模型常见的使用方式:
- 原生pytorch代码,CompVis在Stable Diffusion stable-diffusion-v1-4提供了txt2img.py和img2img.py,是通过pytorch进行模型加载完成图片生成的。
- GUI,包括Stable-Diffusion-WebUI、InvokAI、ComfyUI通常这些工具都是UI和推理服务一起工作,在本地显卡进行部署。
- HuggingFace Diffusers接口,通过StableDiffusionPipeline,StableDiffusionImg2ImgPipeline可以快速加载第三方模型或者本地模型,Stable Diffusion Quick Kit正是采用Diffusers方式进行调用。
在推理过程中可以选择对应的采样器(Sampler,Diffusers中称为Scheduler),常见的采样器有Euler Discrete、Euler Ancestral Discrete、DDIM、KDPM2 Discrete、LMSD等。
使用Quick Kit在SageMaker上
快速部署Stable Diffusion推理服务
由亚马逊云架构师团队专为在云上部署Stable Diffusion模型的推理、训练而打造的工程化代码,通过sagemaker-stablediffusion-quick-kit可以快速的将diffusers目录结构的模型部署到SageMaker中,并生成Http协议的API接口和前后端分离的界面。以便于亚马逊云科技用户可以快速将Stable Diffusion运用到业务和产品中。
结论
综上所述,Stable Diffusion的推理是一个相对比较耗时的服务,在面向用户端提供服务时,必须要考虑到多并发请求下服务的可用性和扩展性,然而相对于普通的应用服务,AI推理需要用到成本比较高的GPU资源,保障服务可靠前提下如何有效控制成本也是亚马逊云科技需要考虑的重要因素。
SageMaker的异步推理可以轻松地达成以上目标,其内部队列可以将前端请求和后端推理进行解耦合,在流量高峰时可以实现缓冲,保障服务的可用性,通过SageMaker异步推理的AutoScaling,可以自动的扩展推理节点,在流量低峰期实现资源回收,节省成本。相对于v100专用显卡和3090等民用显卡,利用SageMaker提供的ml.g4dn和ml.g5等更具性价比的机型实现推理,在保障性能的前提下可以进一步控制资源成本。SageMaker和Stable Diffusion Quick Kit的结合可以帮助快速完成扩散模型在亚马逊云上的工程化部署,为用户的AIGC产品化上提供了坚实可靠的基础。
快速实现工程化部署,亚马逊云科技为AIGC产品化提供可靠基础相关推荐
- 不止大模型,亚马逊云科技布局AIGC底座能力
"大模型只是客户需求的其中一个部分,但远远不是所有,客户还需要更广泛的基础能力.亚马逊云科技推出自研芯片.生成式AI服务Bedrock以及大模型Titan,都在致力于推动AIGC技术的普惠化 ...
- TP-Link基于亚马逊云科技部署面向运营商的IoT云管平台
很多出海企业经常面临着加速多线布局谋求更快发展与既有架构难以支撑的两难之境,此时寻求业务伙伴的支持成为了一个普遍选择,亚马逊云科技对TP-Link的助力即是一个"好风凭借力,送我上青云&qu ...
- 云计算的未来,就是“打车模式” | CCF C³@亚马逊云科技
金磊 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 企业"无云"将会非常罕见,就像"无网络"一样窘迫. 早在2016年,知名研究机构Gartner ...
- 亚马逊云科技入门资源中心,从0到1轻松上云
一.亚马逊云科技介绍 概念:Amazon Web Servies, 亚马逊云科技 - 云计算平台 . 背景介绍: 早在十几年前 ,云计算的概念被提出,当时还没有一个清晰的定义或者描述.基本思想是替代现 ...
- 亚马逊云科技在中国市场火了?真相令人想不到
众所周知,亚马逊公司是全球公有云的肇始者.15年前的3月14日,亚马逊公司上线了Amazon S3服务,由此拉开了全球公有云产业的大幕.15年后,亚马逊公司是全球第一大互联网公司以及全球第一大公有云服 ...
- 世界技能大赛夺冠背后,亚马逊云科技如何培养云计算技能人才?
云计算相关专业的就业前景如何? 人社部数据显示,到2025年我国云计算人才缺口将高达近150万.另一方面,根据艾瑞咨询<中国云计算行业洞察与人才分析>报告,2019年云计算领域人才月均薪酬 ...
- 对话西门子Mendix:低代码与亚马逊云科技Serverless的底层融合,助力企业提效降本...
数据智能产业创新服务媒体 --聚焦数智 · 改变商业 3月30日 亚马逊云科技举办了主题为"全面拥抱Serverless时代"的创新大会,分享了亚马逊云科技17年引领Server ...
- 亚马逊云科技与格雷西司,助力卡洛哈应对全球运营挑战
在经济全球化发展的大趋势之下,企业纷纷开启了国际化发展之旅,寻求更多的发展机遇.然而面对陌生的市场,企业该如何快速布局全球业务发展?如何快速触达不同市场区域,与客户建立联系?如何在以上要求的基础上控制 ...
- 可持续发展的“孤勇者”,亚马逊云科技并不孤单
关注云报 洞察深一度 如果您的企业已经踏上了云之旅,那么恭喜您,因为您已经在可持续发展的漫漫征途上迈出了成功且重要的一步! 实现可持续发展 需要一双"慧眼" 当前,加快发展方式绿色 ...
最新文章
- 转-android图片降低图片大小保持图片清晰的方法
- Golang的日志记录器
- 【CyberSecurityLearning 74】DC系列之DC-5渗透测试
- 从List分组后重新组织数据
- Linux学习笔记之Linux添加/删除用户和用户组
- 企业网站前端制作实战教程 JQuery CSS JS HTML 登录表单验证
- Java并发编程-synchronized锁优化
- 爬虫项目之爬取页面并按界面样式导入excel表格
- 如何利用华为交换机配置SSH登录
- 关机重启注销慢? 头疼? 提高速度的好办法!
- Msfconsole爆破ssh
- 重庆—java互联网架构软件工程师学习记录—Day11(API 1)
- 《编程的原则:改善代码质量的101个方法》读书笔记
- [转]AndroidTolls国内镜像
- Python学习笔记——变量(图灵学院)
- ai修复照片软件是哪个软件_最近大火的AI修复照片是什么软件做出来的 其实可能就是这个小程序而已...
- [附源码]计算机毕业设计JAVA逸尘房屋销售管理系统
- Springboot 热部署----热部署插件的使用
- uni-app 项目怎么运行到手机
- 作为一个iOS开发者,应该继续钻研SwiftUI还是尝试接触Flutter了呢?
热门文章
- ubuntu20.04 [ERROR] [1639391205.206712135]: Failed to build tree: parent link [base_link] of joint
- 无监督学习:生成模型
- 优秀的孩子是怎样培养的
- 2005年日语一级听力原文
- Matrix Derivative
- 稳定性/放射性同位素的化学合成
- 实例讲解如何绕过 Office 文档的反分析技术
- 百度之星资格赛 1003 度度熊与邪恶大魔王(二维dp)
- Java实现微信每天定时发送消息2.0 -- 柚子真好吃
- (Murphy) Linux 动态库机制概要小结(持续更新ing)