提示词原理#

图像生成器#

information creator 完全在图像信息空间(或潜伏空间)中工作。这一特性使它比以前在像素空间工作的扩散模型更快。在技术上,这个组件是由一个 UNet 神经网络和一个调度算法组成的。

Text Encoder#

提示词的解析由 Text Encoder/CLIP 处理 (token embedding),这里是提示词转译给 AI 的关键一步。

ClipText 用于文本编码。

输入文本,输出 77 个标记嵌入向量,每个都有 768 个维度。

information creator#

UNet + Scheduler 在信息(潜在)空间中逐步处理/分散信息。

它输入文本嵌入和一个由噪声组成的起始多维数组(结构化的数字列表,也叫张量),输出一个经过处理的信息阵列。

Image Decoder#

Text Decoder 根据从 information creator 那里获得的信息绘制一幅图画。 它只在过程结束时运行一次以生成最终图像。

Autoencoder Decoder 使用处理过的信息阵列绘制最终图像的解码器。输入处理过的信息阵列 (dimensions: (4,64,64)),输出结果图像 (dimensions: (3, 512, 512),即 (red/green/blue, width, height)。

CLIP 的工作#

CLIP 训练图 from CLIP:多模态领域革命者-云社区-华为云

Stable Diffusion 中使用的自动编码器的缩减系数为 8。这意味着一张 (4, 512, 512) 的图像在潜在空间中是 (4, 64, 64)。

在使用稳定扩散推理一张 512 x 512 的图片的过程中,模型用一个种子和一个文本提示作为输入。潜在种子生成大小 64 × 64 的随机潜在图像,而 prompt 进入 Text Encoder 通过 CLIP 的文本编码器转化为大小为 77 × 768 的文本嵌入。

U-Net 在以文本嵌入为条件的同时迭代地对随机高斯噪声表示进行去噪。U-Net 通过 采样算法 计算去噪的潜在图像表示,输出噪声残差。这个步骤重复许多次后,潜在表示由 Image Decoder 的 auto encoder 的解码器解码输出。

扩展阅读:

  • 什么是扩散模型?
  • illustrated-stable-diffusion
  • 稳定扩散
  • 稳定扩散入门
  • Stable Diffusion From Wikipedia

WebUI 的实现#

WebUI 的 prompt_parser 通过本地 WebUI 实现了渐变等功能。

WebUI prompt 语法会转换为相应时间的 prompt,然后通过 embedding 交给 Ai 处理。

关于权重的实现:权重增加通常会占一个提示词位。

关于渐变的实现:到了指定 Step,WebUI 程序会替换对应提示词,达到渐变效果。

其他以此类推。

整个看下来,原理流程如图

By RcINS

你可以在 illustrated-stable-diffusion 看到全面的介绍。本节部分内容也是由此翻译。

良好参数(风格趋向插画)#

an extremely delicate and beautiful
  • 绘画媒介全分类
  • 动漫人物/艺术家/风格化列表/Pt 文件
  • 风格化:人偶教室
  • 风格化,日语 Wiki
  • 风格化: 32 种
  • 艺术家列表/SD1.4
  • 艺术家列表/SD1.4/1,833 位艺术家
  • 艺术家博物馆

草图风格#

描述
sketch 可以让图片看起来像随手画的草稿
lineart 可以让线条变得很粗
posing sketch, monochrome 黑白草图
rough sketch 上了颜色的草图
monochrome+lineart 情况下一般只会让眼睛上色,强调发色后头发也可以上色
monochrome, gray scale, pencil sketch lines 做出的铅笔速写的感觉

利用 sketch,pastel color,lineart 的 tag 模拟一张图的绘画过程

艺术风格#

描述
chibi 可以画出低头身比的效果(二头身, 三头身)
watercolor pencil 可以生成彩铅画
faux traditional media 可以做出签绘的风格
anime screeshot, 可以让画面变成动画风格
retro artstyle 赛璐璐风
photorealistic, painting, realistic, sketch, oil painting 厚涂
pastel color 和 sketch 搭配会有速涂的质感

杂志/设定集 风格#

描述
official art 变得更加官方一点
three views from front, back and side 和 costume setup materials 可以用来生成设定图
multiple views 会出现类似设定图
character sheet 会出现设定图
magazine cover 会把背景换成杂志封面, 配合 office art 更像真实杂志(虽然字没法看)
magazine scan 类似杂志内页的风格
posing 会强调有一个动作, 不至于出现混乱的动作(露出有六个手指头的手)
caustics 画面向主题聚焦, 类似海报

常用参数: SFW#

人物数量 描述
数量 one boy / one girl / two boy / two girl (one_boy_one_girl 是错误的)
人物画风 描述
质量提升参数 masterpiece, best quality
原神 Genshin Impact
萝莉 female child , loli (画风差)
人物样貌 描述
头发 hair
长发 longhair
短发 shorthair
眼睛 eyes
渐变颜色长发 gradient pink longhair
渐变颜色眼睛 gradient pink eyes
粗眉毛 thick eyebrows
猫尾巴 cat tail
猫耳朵 cat ears
动物耳朵 animal ears
毛茸茸的动物耳朵 animal ear fluff
刘海 bangs
两眼之间的头发 hair between eyes
眉毛后面的头发 eyebrows behind hair
锁骨 collarbone
斗篷(要在很前面才有效) cape
乳房尺寸 small breasts
出汗 sweating
颜色丝袜(和长丝袜冲突) white stockings , black stockings
长丝袜 thighhighs
女仆 maid
发带 ribbon
爱心眼 heart-shaped pupils
御姐/JK/辣妹? gyaru
肌肉发达 muscular
天使翅膀(要是形容人的第一个才正常) angel wings
颜色内裤(赠内衣) pink underpants
肚脐 navel
颈部颜色项圈 white collar
黑色皮肤 dark skin
撕裂的衣服 torn clothes
撕裂的裤子 torn legwear
开襟夹克(配合叉开腿特色) open jacket
异色瞳 heterochromia_blue_red
吊袜带(会和内衣冲突) garter straps
靴子 boots
眼罩 blindfold
流泪 tears
项链 necklace
眼镜 glasses
比基尼 bikini
湿衣服 wet clothes
透明衣物 transparent raincoat , transparent jacket , transparent tshirt
唾液(自动伸舌头) saliva
流口水(和唾液冲突) drooling
水手服 sailor dress
环境样式 描述
在床上 on bed
光线反射 reflection light
赛博朋克 cyberpunk, city, kowloon, rain
在地毯上 on carpet
在瑜伽垫上(它分不清什么是瑜伽垫,只知道色块比较大,所以要配合 one girl 用) on_yoga_mats
人物视角 描述
正面视角 from viewer
从上到下视角 from below
全身 full body
人物状态 描述
叉开腿 spread leg
露出腋下 armpits
举起手 hands up, arms up
爪子手 paw pose
站立 standing
行走 walking
吐舌头 tongue out
抬起腿 legs up
手放背后 arms behind back, hidden hands
衬衫 shirt
长袖 long sleeves
连帽衫 hoodie
褶边 frills
喇叭裤 bloomers
白色连衣裙 white dress
捆绑 bondage , bondage body , bondage foot , bondage hand
蹲下 crouch , squatting
真画风 photorealistic
跪下 kneel down
湿身 wet body

提示词速查#

  • 手抄本法术书
  • Danbooru 全部 Tag 列表
  • 参数法术全典
  • Tag 在线协作
  • NSFWTag
  • AI 艺术家文档
  • Novelai 关键词组合器

调参工程师#

  • emphasis 测试
  • 面向 NAI 的测试
  • GitHub - Maks-s/sd-akashic: A compendium of informations regarding Stable Diffusion (SD)
  • GitHub - willwulfken/MidJourney-Styles-and-Keywords-Reference: A reference containing Styles and Keywords that you can use with MidJourney AI. There are also pages showing resolution comparison, image weights, and much more!

转发自AiDraw | AiDraw

stable diffusion(杂谈)相关推荐

  1. stable diffusion制作韩国版AI女友关键词

    问题 怎么样使用stable diffusion简单制作韩国版AI女友?这里假设已经安装好stable diffusion webui版.这里主要记录一下韩国版AI女友sd配置参数 Stable Di ...

  2. Stable Diffusion 抠图工具使用小记

          用stable diffusion有段时间了,最近使用了它的抠图工具 (Remove background).这里是我对该工具的使用和记录.希望可以帮其他人了解相关内容.文末附100个Lo ...

  3. AI 作画:Stable Diffusion 模型原理与实践

    前言 本文首先简单介绍 Stable Diffusion 模型结构 Latent Diffusion 的论文和博客,然后介绍模型的训练和推理技术细节(不含数学推导),接着介绍几个 prompt 搜索引 ...

  4. 基于 Stable Diffusion 一键 AI 作画:什么“小镇做题家”?人人都是艺术家

    文章目录 前言 一.西方艺术简史 1.1.古典艺术时期 1.2.现代艺术时期 1.3.后现代艺术时期 二.数字艺术的诞生和发展 2.1.数字艺术的诞生 2.2.数字艺术下的行业细分 2.3.数字作品的 ...

  5. 在 Amazon SageMaker 上玩转 Stable Diffusion: 基于 Dreambooth 的模型微调

    本文将以 Stable Diffusion Quick Kit 为例,详细讲解如何利用 Dreambooth 对 Stable Diffusion 模型进行微调,包括基础的 Stable Diffus ...

  6. 带你从零开始入门AI绘画神器Stable Diffusion

    一.本地部署 Stable diffusion 1. 前言 目前市面上比较权威,并能用于工作中的 AI 绘画软件其实就两款.一个叫 Midjourney(简称 MJ),另一个叫 Stable-Diff ...

  7. Stable Diffusion Prompt用法

    Stable Diffusion可以根据你输入的提示词(prompt)来绘制出想象中的画面. 1.正向提示词(Prompt): 提高图像质量的prompt: prompt 用途 HDR, UHD, 6 ...

  8. 1秒出图,全球最快的开源Stable Diffusion出炉

    视学算法发布 机器之心编辑部 OneFlow 将 Stable Diffusion 的推理性能推向了一个全新的 SOTA. 第一辆汽车诞生之初,时速只有 16 公里,甚至不如马车跑得快,很长一段时间, ...

  9. Stable Diffusion 2.0来了,皮卡智能AI早已“抢先”优化升级

    就在昨日,Stability AI发布了Stable Diffusion 2.0 版本上线,玩家惊呼V1还没整明白,V2版本就来了.其实在Stable Diffusion 1.0开源后,皮卡智能AI许 ...

最新文章

  1. Java项目:新闻发布系统(java+Springboot+ssm+mysql+maven)
  2. 利用matlab对rosbag数据,通过matlab提取rosbag数据
  3. ubuntu 运行c++_06_Linux下VSCode简单编程(远程开发WSL_Ubuntu_18.04) | C语言入门
  4. Kitten编程猫 里的一步积木设计原理
  5. df、du和fdisk命令的区别
  6. oracle存储过程写法(一)
  7. servlet中的数据存储
  8. linux直接用iso文件装服务,linux系统安装iso文件方法
  9. Ubuntu中安装python3
  10. 【推荐】 女人愁嫁时代终于来临
  11. ip和nmcli命令的的使用方法
  12. Mycat分库分表的简单实践 / 用Mycat,学会数据库读写分离、分表分库
  13. 西电捷通IWN2410(V600)WAPI鉴别服务器生成的PEM(X.509)证书文件样式
  14. ue5-预计算可视性体积(PVS)
  15. 网易互娱 实习生招聘 内推
  16. Windows Server 2008 简体中文 正式版 下载
  17. hdu3265(好题翻译)
  18. [UE4]Set Skeletal Mesh,在蓝图中设置骨骼模型
  19. 单精度浮点数和双精度浮点数_浮点数和双精度数之间的区别
  20. MOSS SDK学习(3)

热门文章

  1. deepmind_lab相关的解答
  2. GitHub创建项目的流程
  3. 豆瓣列表 + 详情 VUE 2.X 初使用 H5 手机预览
  4. VUE实现点击头像出现遮罩层的功能的两种方式
  5. N皇后问题递归求解(内附详细代码)
  6. 我市智慧城市建设迈入快车道
  7. mysql 使用order by存在的问题与优化思考
  8. 计算机代表男女,女性PC今日亮相 电脑营销男女有别
  9. 温州人力资源网隐私政策
  10. 前端工具批量生成NFT图片头像并下载