AI 绘画新手魔导士在刚开始玩 Stable Diffusion 时总会遇到各种新的概念,让人困惑,其中就包括各种模型和他们之间的关系。

魔法师入门得先认识各种法师装备(各种模型),让我们遇到问题知道使用何种装备来协助自己发挥更大的效果。

safetensors

在了解各种模型之前,有必须先了解下 safetensors,玩过的应该都认识,就是很多模型的后缀。然而各种模型的后缀五花八门,但是总是能看到 safetensors 的影子,让人有些缭乱。

其实主要是因为 safetensors 支持各种 AI 模型,而在 safetensors 出现前,各种 AI 模型都有着自己独特的后缀。这就导致每种模型既可以使用 safetensors 又可以使用自己原有的后缀,所以入门的时候就会让人有点分不清。

其实 safetensors 是由 huggingface 研发的一种开源的模型格式,它有几种优势:

  • 足够安全,可以防止 DOS 攻击
  • 加载迅速
  • 支持懒加载
  • 通用性强

所以现在大部分的开源模型都会提供 safetensors 格式。

开源地址: https://github.com/huggingface/safetensors

模型分类

说完了 safetensors 我们进入正题,聊一聊在 Stable Diffusion 中常见的各种模型。

Checkpoint | Stable Diffusion

Checkpoint 是 Stable Diffusion 中最重要的模型,也是主模型,几乎所有的操作都要依托于主模型进行。而所有的主模型都是基于 Stable Diffusion 模型训练而来,所以有时会被称为 Stable Diffusion 模型。

主模型后缀一般为 .ckpt 或者 .safetensors,并且体积比较庞大,一般在 2G - 7G 之间。而要管理模型我们需要进入 WebUI 目录下的 models/Stable-diffusion 目录下。

在使用 WebUI 时左上角切换的就是主模型了。

LoRA 和 LyCORIS

LoRA 是除了主模型外最常用的模型。LoRA 和 LyCORIS 都属于微调模型,一般用于控制画风、控制生成的角色、控制角色的姿势等等。

LoRA 和 LyCORIS 的后缀均为 .safetensors,体积较主模型要小得多,一般在 4M - 300M 之间。一般使用 LoRA 模型较多,而 LyCORIS 与 LoRA 相比可调节范围更大,但是需要额外的扩展才可使用。需要管理模型时我们可以进入 WebUI 目录下的 models/LoRA 目录下。

在 WebUI 中使用时,可通过点击左侧的小红灯,然后在 LoRA 菜单中点击使用。也可以直接使用 Prompt 调用。

Textual Inversion

Textual Inversion 是文本编码器模型,用于改变文字向量。可以将其理解为一组 Prompt。

Textual Inversion 后缀为 .pt 或者 .safetensors,体积非常小,一般只有几 kb。模型所在的目录不在 models 下,而是在 WebUI 中的 embeddings 目录下。

在使用时同样可以使用小红灯中的 Textual Inversion,也可以使用 Prompt 调用。

Hypernetworks

Hypernetworks 模型用于调整模型神经网络权重,进行风格的微调。

Hypernetworks 的后缀为 .pt 或者 .safetensors,体积一般在 20M - 200M 之间。模型的目录为 WebUI 下的 models/hypernetworks

在使用时同样可以使用小红灯中的 Hypernetworks。

ControlNet

ControlNet 是一个及其强大的控制模型,它可以做到画面控制、动作控制、色深控制、色彩控制等等。使用时需要安装相应的扩展才可。

ControlNet 类模型的后缀为 .safetensors。模型的目录为 models/ControlNet

使用时我们需要先去 Extensions 页面搜索 ControlNet 扩展,然后 Install 并 Reload UI。然后便可以在 txt2img 和 img2img 菜单下找到:

ControlNet 功能非常强大,还解决 AI 画手的噩梦问题。

VAE

VAE 模型一般用于图片亮度和饱和度的修正、画面较正和以及补光等。一般在绘图时如果出现图片亮度过低、发灰等问题时就需要用到。

VAE 模型的后缀为 .pt 或 .safetensors,体积一般为 335M 或 823M。模型的目录为 models/VAE

使用时需要到 Settings 页面找到 SD VAE 菜单切换。

但是这样使用过于繁琐,所以如果使用到建议在 Quicksettings list 配置中添加 sd_vae。

这样就可以在 WebUI 的顶部进行切换。

CodeFormer

CodeFormer 模型一般用于图片的修复,比如提高图片的分辨率、将黑白照片修改成彩色照片、人脸修复等等。

CodeFormer 是一个开源项目,在 WebUI 中已经默认被整合,可以在 Extras 菜单中使用。如果需要修改 CodeFormer 版本可以将模型放到 models/codeformer

一览表

模型名称 作用 后缀名 大小 在 WebUI 中的文件夹
Checkpoint 主模型 .ckpt 或 .safetensors 2G - 7G models/Stable-diffusion
LoRA 和 LyCORIS 微调模型,一般用于控制画风、控制生成的角色、控制角色的姿势等等 .safetensors 2G - 7G models/Stable-diffusion
Textual Inversion 文本编码器模型 .pt 或 .safetensors KB 级别 embeddings
Hypernetworks 调整模型神经网络权重,进行风格的微调 .pt 或 .safetensors 20M - 200M models/hypernetworks
ControlNet 强大的控制模型,可以进行画面控制、动作控制、色深控制、色彩控制等等 .safetensors KB 级别 models/ControlNet
VAE 图片亮度和饱和度的修正、画面较正和以及补光等 .pt 或 .safetensors 335M 或 823M models/VAE
CodeFormer 修复模型,修复人脸、提高分辨率等 - - models/codeformer

最后

上面几种模型就是 Stable Diffusion 中最常用的几种,通过 Checkpoint 控制图片的主要风格;通过 VAE 给图片补光、调亮;通过 LoRA | LyCORIS 对模型进行风格、角色控制;通过 Textual Inversion 简化 Prompt;通过 ControlNet 进行姿势、色彩控制,修复手部。

不过这并不是 Stable Diffusion 中所有的模型,其它的一些模型如果有空再整理下。

AI 绘画基础 - 细数 Stable Diffusion 中的各种常用模型 【 魔导士装备图鉴】相关推荐

  1. AI绘画:快速上手stable diffusion

    点击↑上方↑蓝色"编了个程"关注我~ 这是Yasin的第 89 篇原创文章 mj vs sd 最近随着Chat GPT的大火,AI绘画也火了起来.尤其是midjourney(以下简 ...

  2. 【AI绘画】Midjourney和Stable Diffusion教程

    之前我向大家介绍了这两个AI绘画网站: Stable Diffusion介绍: https://mp.csdn.net/mp_blog/creation/editor/130059509 Midjou ...

  3. 《ai绘画》最全stable diffusion安装教程 所有软件+所有指令

    安装cuda,win键搜索nvidia Control Panel,打开软件 点击软件左下角系统信息 查看自己的cuda版本 打开网站,根据自己的版本选择cuda下载 网站 https://devel ...

  4. Stable Diffusion 个人推荐的各种模型及设置参数、扩展应用等合集(不断更新中)

    本文主要是把平时使用的模型及其参数进行推荐和整理,相关 安装及其问题解决参考:<Windows安装Stable Diffusion WebUI及问题解决记录>: 运行使用时问题<Wi ...

  5. ajax on ture,细数Ajax请求中的async:false和async:true的差异

    实例如下: function test(){ var temp="00"; $.ajax({ async: false, type : "GET", url : ...

  6. AI绘画天花板软件数画迎来重大更新,二次元虚拟头像一键生成

    2022年11月18日,Ai绘画领域的天花板级软件"数画"迎来重大更新,发布了最新的元宇宙虚拟头像模型.二次元模型.就在发布几天后,抖音和快手平台"二次元裂逢已打开&qu ...

  7. 手表频率测试软件,细数智能手表中的16个传感器

    原标题:细数智能手表中的16个传感器 健身追踪器和智能手表正逐渐成为一种必不可少的生活方式设备,可帮助我们跟踪自己的活跃程度以及基本的健康参数.事实上,为了帮助人们衡量活动水平和心脏健康,戴在手腕上的 ...

  8. AI绘画能力的起源:通俗理解VAE、扩散模型DDPM、DETR、ViT/Swin transformer

    前言 2018年我写过一篇博客,叫:<一文读懂目标检测:R-CNN.Fast R-CNN.Faster R-CNN.YOLO.SSD>,该文相当于梳理了2019年之前CV领域的典型视觉模型 ...

  9. GPT-3、Stable Diffusion一起助攻,让模型听懂甲方修图需求

    来源:机器之心 AI 可以完全按照甲方意愿修图?GPT-3.Stable Diffusion 一起助攻,让模型秒变 PS 高手,改图随心所欲. 扩散模型大火之后,很多人将注意力放到了如何利用更有效的 ...

最新文章

  1. 数据库及页面乱码问题
  2. javascript window和document
  3. 互联网内容平台到底要用到多少AI技术?
  4. 视频监控 封装[PlayCtrl.dll]的API (1)
  5. Linux下修改TomcatJVM内存大小
  6. Windows核心编程_PE文件格式详细介绍
  7. html弄多个按钮_html - 一个表单中的两个提交按钮
  8. JSON 解析之 FastJson
  9. 在中标麒麟上基于源码安装第二个gcc编译器
  10. 1000+ 电力系统,电力电子,电机一些仿真程序
  11. 程序员自学编程的6种方法,高效学习
  12. RadarNet: Efficient Gesture Recognition Technique Utilizing a Miniaturized Radar Sensor
  13. 电脑开启wifi热点
  14. 两个微信号绑定一个服务器ip,一个手机号能绑定几个微信账号(一个手机号注册多个微信号的方法)...
  15. Dummy Sample
  16. 你可知用FlexGrid做开发,轻松处理百万级表格数据
  17. bios密码解锁软件_你知道自己的电脑还有这么一个BIOS程序吗
  18. ipad与macbook设置随行(ipad做笔记本副屏)
  19. php视频直播系统源码Android 修改状态栏颜色 白色、透明色
  20. 用CSS 实现水波扩散的特效

热门文章

  1. Eclipse安装记录
  2. 为什么18岁以下的人不用facebook了,是不是国外又有新型的社交媒体了?
  3. rabbitlearning下载_RabbitMQ-learning
  4. 乐观锁实现接口幂等性_什么是幂等性,如何实现,以及乐观锁在项目中的实际用法...
  5. 宠物食品,从小众圈跻身中上层
  6. 关于助学货款:名牌大学的学生不良信用率是否比普通高校的要高?不是。
  7. 世界上最美的25种硬币
  8. 关于performSelector看我就够了
  9. THOMAS MASON--英国顶级衬衫面料品牌
  10. CF1634E Fair Share