体验在线 AI 画图服务

Midjourney

Midjourney 是一个由同名研究实验室开发的人工智能程序,可根据文本生成图像,于2022年7月12日进入公开测试阶段,用户可透过 Discord 的机器人指令进行操作。该研究实验室由 Leap Motion 的创办人大卫·霍尔兹负责领导。—— Wikipedia

可以加入 Beta 计划从 Discord 群中向机器人提交作图指令。官网服务也提供付费订阅。

Microsoft Bing Image Creator

微软借助 OpenAI 的 DALL-E 图像生成 AI ,提供了这个在线图片生成服务。用户输入一段文本提示,仅需数秒即可获得一组 AI 生成的与之匹配的图像。

Preview 阶段,每位普通用户媒体可以快速生成 25 次,超过次数需要排队等待。

搭建自己的 AI 作图环境

在线服务效果好,但是有使用次数限制。如果你需要更多的自由度,那么可以考虑自己搭建一套 AI 做图环境。

准备

Stable Diffusion GUI

AI 绘图已经火出圈,自然开源社区里也有许多 Stable Diffusion 的图形界面,方便用户上手体验。
有专门提供给 MacOS 桌面端的 DiffusionBee,还有跨平台的 Stable Diffusion UI v2 。

而本文我们着重介绍可以部署在云端的 Web UI 。
AUTOMATIC1111(简称 A1111)Stable Diffusion Web UI 是为高级用户提供的 Stable Diffusion GUI。
多亏了活跃的开源社区,大多数新功能都会先支持上这个免费的 Stable Diffusion GUI 。
但要使用它并不容易。文档不够详尽,以及提供的茫茫功能列表都会让新手迷茫。

购买一台云主机

初次体验,先试试最便宜的 GPU 主机。
P.S 最低配的也完全够用,生成图片很快!

我开通的云主机的配置如下:

  • 系统: Ubuntu22.04
  • 显卡: 1 * NVIDIA T4
  • CPU/内存: 4 核 32 G
  • 系统盘: 200GB
  • 带宽: 10Mbps

顺畅的网络环境

略,自己想办法

安装

机器开通后,可以直接从 Web 端一键登录:

也可以使用 ssh 登录,在 “更多操作” 下拉菜单中选择重制密码,即可重新设定一个 root 账号的登录密码,然后云主机会重启。

具体的你可以参考文档产品文档。

登录云主机后,可以先检查一下显卡型号:

$ lspci | grep -i nvidia00:06.0 3D controller: NVIDIA Corporation TU104GL [Tesla T4] (rev a1)

货真价实,没有问题,那么开始搭建吧!

安装一些必要的依赖软件

# 更新软件包索引
sudo apt-get -y update# 必要软件
sudo apt-get -y install wget git python3 python3-venv python3-pip
sudo apt-get -y install aria2 screen# 安装 cuda 软件包,让显卡发挥超能力
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.0-1_all.deb
sudo dpkg -i cuda-keyring_1.0-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda# 清理 deb 安装包
rm *.deb# 安装 cuda 之后,需要重启生效
sudo reboot

验证 cuda 是否安装成功:

$ nvidia-smi+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 530.30.02              Driver Version: 530.30.02    CUDA Version: 12.1     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                  Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf            Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla T4                        On | 00000000:00:06.0 Off |                    0 |
| N/A   38C    P0               26W /  70W|   2279MiB / 15360MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------++---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|    0   N/A  N/A    103851      C   python3                                    2274MiB |
+---------------------------------------------------------------------------------------+

写在前面的一点建议

建议你在使用 ssh 登录云主机时,使用 screen 命令进入一个虚拟终端会话,这可以避免因为网络不稳定而中断了正在执行的命令。因为接下来的一些命令需要下载大文件而耗时比较长。

screen 命令速记:

# 新建一个 screen 会话,我的会话取名为 workspace
screen -R workspace# 退出 screen 会话
## 先按组合键 Ctrl+A
## 然后按字母 D# 当需要重新进入 screen 会话
screen -r -d workspace

详细的命令使用说明,参考 How To Use Linux Screen 。

部署 Web UI

你可以直接 clone 项目 AUTOMATIC1111/stable-diffusion-webui (又称 A1111 ) 的最新代码,然后按照 README 中的说明安装即可。

而我参考了另一个项目:

如果你想快速开始体验,就跟我一样脚本一把梭,免得耗费时间找各种插件/模型;
如果你很在意这些命令在干什么,我简单添加了一些注释;
看不懂?没关系,这个系列以后会有文章深入这些细节。

#!/usr/bin/env bash# A1111 项目没有打 tag 的习惯,你拉取到的最新版本代码可能无法复现本文的内容,
# 而这个项目 Fork 自 A1111 ,还贴心地打上了 tag ,建议你和我一样使用这份源码
git clone -b v2.2 https://github.com/camenduru/stable-diffusion-webui# 指定之后操作的根目录
base_dir="$(pwd)/stable-diffusion-webui"
# 简化 ariac2 下载命令
download="aria2c --console-log-level=error -c -x 16 -s 16 -k 1M"# Extra network / Textual Inversion
# 负面词,功能说明 https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Negative-prompt
git clone https://huggingface.co/embed/negative ${base_dir}/embeddings/negative# Extra network / Lora
# 支持把 Lora 模型作为关键词
git clone https://huggingface.co/embed/lora ${base_dir}/models/Lora/positive# 4x-UltraSharp ,一个通用模型,可以提高图片的分辨率。
# 原始模型发布在 MEGA 网盘,为了下载方便使用 huggingface 上的备份。
${download} https://huggingface.co/embed/upscale/resolve/main/4x-UltraSharp.pth -d ${base_dir}/models/ESRGAN -o 4x-UltraSharp.pth# 一些方便的插件,可以去他们的 Github 主页查看功能介绍
## 方便从 Web 端下载 civitai 市场的模型
git clone -b v2.0 https://github.com/camenduru/sd-civitai-browser ${base_dir}/extensions/sd-civitai-browser
## 方便从 Web 端下载 huggingface 市场的模型
git clone https://github.com/camenduru/stable-diffusion-webui-huggingface ${base_dir}/extensions/stable-diffusion-webui-huggingface
## 一个图片浏览器,方便浏览保存过的图片
git clone https://github.com/AlUlkesh/stable-diffusion-webui-images-browser ${base_dir}/extensions/stable-diffusion-webui-images-browser# 主模型
models="${base_dir}/models"
## Stable Diffuison v1.5,SD1.5 的模型 (可选)
${download} https://huggingface.co/runwayml/stable-diffusion-v1-5/resolve/main/v1-5-pruned-emaonly.safetensors -d ${models}/Stable-diffusion -o v1-5-pruned-emaonly.safetensors
## 国风3 https://huggingface.co/xiaolxl/GuoFeng3
${download} https://huggingface.co/xiaolxl/GuoFeng3/resolve/main/GuoFeng3.2.safetensors -d ${models}/Stable-diffusion -o GuoFeng3.2.safetensors# LoRA 模型
mkdir -p ${models}/Lora
## 墨心 MoXin https://civitai.com/models/12597/moxin
${download} https://civitai.com/api/download/models/14856 -d ${models}/Lora -o MoXin_v10.safetensors

最后我们启动 Web UI

直接通过 launch.py 启动,而不是 webui.sh ,这样可以加载额外安装的插件。
一些 Python 依赖包会在初次运行时安装。

cd stable-diffusion-webui## 初始化并启用新的 python venv 环境
python3 -m venv .venv
source .venv/bin/activate## 安装支持 cuda 11.8 的 pytorch, xformer
pip install torch torchvision torchaudio torchtext torchdata --extra-index-url https://download.pytorch.org/whl/cu118 -U
pip install xformers==0.0.18 triton==2.0.0 -U## 在 10000 端口上启动 Web 服务
python3 launch.py --listen --xformers --enable-insecure-extension-access --gradio-queue --port 10000

浏览器打开 http://${host_ip}:10000 就可以看到 Stable Diffusion Web 页面了。

把 ${host_ip} 换成你的云主机 ip 地址。
P.S 安装脚本中省略了部分本文用不到的插件,所以 Web 截图会略有不同。

使用自建的 AI 作图环境

选择一个基础模型(主模型)在 Stable Diffusion checkpoint 下拉菜单中,选择 GuoFeng3.2.safetensors 。

GuoFeng3 这是一个中国华丽古风风格模型,也可以说是一个古风游戏角色模型,具有2.5D的质感。来自: https://huggingface.co/xiaolxl/GuoFeng3

点击 Generate 下面的 Show/hide extra networks 图标,可以看到已经安装的模型。

切换选项卡,可以看到我们已经安装的所有 LoRA 模型。

Q: 什么是 LoRA 模型?
A: 根据特定概念更改现有 Stable Diffusion 模型结果的文件。这可以是一种艺术风格、一个角色、一个现实中的人、一个物体或一个主题。一些著名的例子:Arcane Style LoRA(奥术风格 LoRA) ,Makima from Chainsaw Man LoRA(来自动漫《电锯人》中的玛奇玛)。(来自:https://aituts.com/stable-diffusion-lora/ )

image.png

点击一个 LoRA 模型,可以看到在 Prompts 输入框中,自动填写上了模型名称:

image.png

我选择 Moxin_10 这个模型。

墨心 MoXin 1.0
昔涓子《琴心》,王孙《巧心》,心哉美矣,故用之焉。
来自: https://civitai.com/models/12597/moxin
(非常适合与国风3 搭配使用的 LoRA 模型,可以生成水墨画风格的图片。)

从最简单的开始

准备创作,首先要有个想法:
假如我想画一只熊。

在关键词 (Prompt) 输入框中添加一句描述:
a bear

提示词目前只支持英语。
如果你有更复杂的描述,但是表达不出来?翻译软件一大把。

然后点击 Generate 进行生成,大概花了 10s,图片就生成好了。

说实话,这虎头虎脑的黑熊,效果还挺萌!顿时对我们的 AI 绘画之旅,充满信心了有木有?

如果要再次生成,就继续点击 Generate ;如果要一次生成多张图片,可以调整 Batch count 。
显卡有多还可以调整 Batch size 进行并发生成

【附教程】亲身体验AI绘画的艺术之旅——EP0相关推荐

  1. AI绘画是艺术还是技术?AI绘画会让插画师集体失业?

    今年以来,AI绘画的讨论热潮此起彼伏,过一段时间就会引起争议和恐慌. 就在近日,日本推出一款名为mimic的AI绘画软件,被日本绘画圈集体声讨,许多画师公开禁止AI绘画:恰巧最近美国艺术圈里关于AI绘 ...

  2. PhotoShop Beta(爱国版)安装教程-内置AI绘画功能

    PS beta版安装教程 Window和Mac版都有,里面内置AI绘画功能 ps Beta版真的太爽了,今天来和大家分享下安装教程. 很多人拿这资料卖5块 9.9 19.9,球友们直接用,建议赶紧装, ...

  3. iTerm 2 Oh My Zsh【DIY教程——亲身体验过程】

    一年前,在搞终端的时候偶然一次机会,让我看到了各种强大的DIY界面,这让我很想去自己搞一个.于是在网上不断的寻找资源,也请教了大多数朋友.最终以失败告终.最近,本人又突然想起当时这件事,于是,决定边做 ...

  4. ai绘画生成古风场景怎么弄?告诉你怎么ai绘画

    随着人工智能技术的不断发展,ai绘画已经成为一个令人着迷的领域.一些软件利用深度学习算法和生成对抗网络等技术,能够帮助艺术家和爱好者创造出令人惊叹的艺术作品.今天我就来跟大家分享一下如何一键ai绘画, ...

  5. 飞链云版图安全食用指南 AI绘画超详细保姆级新手教程

    非常感谢Jacky为飞链云版图编写的第一篇用户新手教程--飞链云官方! 前言: 在接触飞链云版图(以下简称飞链云AI)之前,笔者曾使用过 sd(stable diffusion)各版本. wAIfu ...

  6. Midjourney:一步一步教你如何使用 AI 绘画 MJ

    一步一步如何使用 Midjourney 教程:教学怎么用 MJ? 一.Midjourney(MJ)是什么? Midjourney是一款使用文字描述来生成高质量图像的AI绘画工具.这篇文章主要介绍了Mi ...

  7. AI绘画Stable Diffusion关键字技巧分享

    大家使用Stable Diffusion通过关键字描述的时候,总觉得画不出想要的图形:在这里,飞链云教大家一个小技巧:那就是使用某种特定的顺序,让AI更好的理解你想要什么: 欢迎大家体验AI绘画,正在 ...

  8. 一切正常,天涯社区辟谣;扎克伯格炮轰苹果;日增 65 万用户,AI 绘画爆火 | EA周报...

    EA周报 2022年12月2日 每个星期1分钟,元宝带你喝一杯IT人的浓缩咖啡,了解天下事.掌握IT核心技术. 周报看点 1.小鹏每卖一辆车平均亏超8万 2.台积电分红曝光 菜鸟入职 8 个月狂领 4 ...

  9. 小狐狸ChatGPT付费创作系统1.92独立版 + H5端 + 小程序前端+新增AI绘画功能 系统源码体验安装教程

    小狐狸GPT付费体验系统最新版系统是一款基于ThinkPHP框架开发的AI问答小程序,是基于国外很火的ChatGPT进行开发的Ai智能问答小程序.播播资源网针对源码整体测试下来非常完美,可以说小狐狸G ...

最新文章

  1. 性能全面超数据库专家,腾讯提基于机器学习的性能优化系统 | SIGMOD 2019
  2. .net环境故障处理
  3. windows复制文件路径_如何在Windows 10上复制文件的完整路径
  4. 计算机组成 交换的目的,计算机组成原理试卷.docx
  5. python树结构实现小顶堆_数据结构和算法入门之小顶堆和大顶堆Python实现
  6. 国军标GJB150三防试验(霉菌+盐雾+湿热)
  7. java导航网站_java导航网站
  8. python兔子_python 实现兔子生兔子示例
  9. 【Mysql】1366 - Incorrect string value: ‘\xE9\x92\xB1\xE7\x94\xB5‘
  10. gyp ERR! stack Error: EACCES: permission denied, mkdir
  11. 关于android 电池的一些实用性探讨
  12. 计算机文档软件,电脑文档软件
  13. jQuery 清除div内容
  14. 励志名言---002
  15. 用接口实现计算每个立方体的体积并输出结果的程序(接口及多态性及匿名方法的结合使用)
  16. jeecgboot使用例子
  17. linux仿真电路指令,使用geda进行电路仿真举例
  18. R语言实现主成分分析与典型相关分析
  19. PS里我的为什么创建剪贴蒙板后图片不见了?(包好用)
  20. (转)哈佛学生的4年大学生活

热门文章

  1. 中国物流金融行业未来发展建议与运营风险评估报告2022版
  2. SoilingNet: Soiling Detection on Automotive Surround-View Cameras 论文精读
  3. Excel弱爆了!这个工具30分钟完成了我一天的工作量!超实用!
  4. 这么多都变了,洛谷4还会远吗?
  5. 打造狼性团队的12条团队铁规
  6. SpringCloud(1):SpringCloud介绍
  7. 带有表情符号的文本情感分类实验
  8. jupyter lab在浏览器打开时空白
  9. canvas截图中图片空白(跨域 导致)
  10. python输出汉字怎么对齐_Python的print输出中文对齐问题