AIGC 的存在,大大提高了创作者的生产效率,目前,市面上也出现了许多快速生成图像的 AI 图像模型。

近日,谷歌的 Muse AI 系统亮相,使用 AI 生成图片又多了一个选择工具!

Google Muse AI 

图源:Muse 官网

Google Muse AI是早期文本到图像转换器模型(如 Imagen 和 DALL-E 2 )的改进版本,可实现最先进的图像生成性能,同时比扩散或自回归模型效率高得多。

Muse声称优于 Imagen 和 DALL-E 2 等像素空间扩散模型,因为它使用了离散令牌和较小的样本量要求。该模型根据文本提示迭代重采样图片标记,生成免费的零镜头、无遮罩编辑。

Google Muse AI的优势

- Muse 采用并行解码,这是Parti和其他自回归模型中所缺少的。

- 使用已经训练过的LLM,可以在粒度级别上掌握语言,这反过来又转化为产生高质量的图像并识别视觉概念,如物体,它们的空间关系,立场,基数等。

- Muse 允许进行修复、外画和无遮罩编辑,而无需翻转或翻转模型。

Google Muse AI 可提供哪些功能?

- 文本到图像生成

Google Muse AI 根据文本输入快速生成高质量图像(TPUv4 上 512×512 分辨率为 1.3 秒,256×256 分辨率为 0.5 秒)。

图源:Muse 官网

- 零镜头、无遮罩编辑

由于基于文本提示对图片标记进行迭代重采样,Google Muse AI 模型提供了免费的零镜头、无遮罩编辑。

图源:Muse 官网

- 可操作多个对象

更改图像时,无遮罩编辑允许使用简单的文本提示操作多个对象。

图源:Muse 官网

- 零镜头内涂/外涂

基于蒙版的编辑(内画/外画)免费包含在谷歌缪斯人工智能中。使用蒙版时,编辑与生成相同。

图源:Muse 官网

目前市面上有许多 AI 图像生成软件,主流AI图像生成系统包括 Stable Diffusion、OpenAI 的 DALL-E 2 等等,生成一副 512X512 级别的画像,Stable Diffusion1.4 需要 3.7 秒, Muse 仅需 1.3 秒。

因此,在图片生成的速度上, 与竞品相比,Muse 有着更大的速度优势。

文本到图像模型,如何快速生成高质量图片? #Google Muse AI相关推荐

  1. 文本深度表示模型Word2Vec 简介 Word2vec 是 Google 在 2013 年年中开源的一款将词表征为实数值向量的高效工具, 其利用深度学习的思想,可以通过训练,把对文本内容的处理简

    文本深度表示模型Word2Vec 简介 Word2vec 是 Google 在 2013 年年中开源的一款将词表征为实数值向量的高效工具, 其利用深度学习的思想,可以通过训练,把对文本内容的处理简化为 ...

  2. 易模3D建模教程 |手机也能编辑3D模型,快速生成人头像!

    ​在之前的易模建模教程中,我们已经教会大家为小器物.人脸.人像.场景以及不可移动的大摆件建模,很多朋友学会操作并成功得到模型之后,觉得自己制作的模型不像案例模型那样精致,除了清晰度的情况,自己拍摄制作 ...

  3. Text to image论文精读GR-GAN:逐步细化文本到图像生成 GRADUAL REFINEMENT TEXT-TO-IMAGE GENERATION

    目录 一.原文摘要 二.为什么提出GR-GAN 三.GR-GAN 3.1.整体框架 3.2.逐步求精生成器:GRG 3.2.1.图像初始化阶段 3.2.2.句子级细化阶段 3.2.3.单词级细化阶段 ...

  4. AI艺术的背后:详解文本生成图像模型【基于 Diffusion Model】

    系列文章链接: AI艺术的背后:详解文本生成图像模型[基于 VQ-VAE] AI艺术的背后:详解文本生成图像模型[基于GAN] AI艺术的背后:详解文本生成图像模型[基于Diffusion Model ...

  5. AI艺术的背后:详解文本生成图像模型【基于GAN】

    系列文章链接: AI艺术的背后:详解文本生成图像模型[基于 VQ-VAE] AI艺术的背后:详解文本生成图像模型[基于GAN] AI艺术的背后:详解文本生成图像模型[基于Diffusion Model ...

  6. AI艺术的背后:详解文本生成图像模型【基于 VQ-VAE】

    系列文章链接: AI艺术的背后:详解文本生成图像模型[基于 VQ-VAE] AI艺术的背后:详解文本生成图像模型[基于GAN] AI艺术的背后:详解文本生成图像模型[基于Diffusion Model ...

  7. 文本生成视频Make-A-Video,根据一句话就能一键生成视频 Meta新AI模型

    Meta公司(原Facebook)在今年9月29日首次推出一款人工智能系统模型:Make-A-Video,可以从给定的文字提示生成短视频. Make-A-Video研究基于文本到图像生成技术的最新进展 ...

  8. AIGC:Stable Diffusion(一项普通人就能实现的AI前沿科技)的简介、Stable Diffusion2.0的改进、安装、使用方法(文本到图像/图像修改/超分辨率/图像修复)之详细攻略

    AIGC:Stable Diffusion(一项普通人就能实现的AI前沿科技)的简介.Stable Diffusion2.0的改进.安装.使用方法(文本到图像/图像修改/超分辨率/图像修复)之详细攻略 ...

  9. CVPR 2023 | 微软提出RODIN:首个3D扩散模型高质量生成效果,换装改形象一句话搞定!...

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 点击进入->[扩散模型]微信技术交流群 转载自:微软亚洲研究院 编者按:近日,由微软亚洲研究院提出的 ...

最新文章

  1. python中约瑟夫环程序_Python实现约瑟夫环问题的方法
  2. 【VBA】点击工作簿中的每个单元格,整行整列变色
  3. Java中BigInteger的各种方法详解
  4. 工作296:el-table使用
  5. 计算机十进制例子,verilog给你举个最简单的例子:以十进制计算为例:14
  6. 重新leetcode第1天——二叉树遍历算法讲解合集
  7. PLC的模糊PID控制
  8. 各协议的协议号和端口号
  9. C语言打印输出图形(初版)
  10. ros运行cpp文件
  11. 数据库查询数据去除重复
  12. 安卓平板usb变显示器_三星DeX—安卓生产力之巅
  13. 永中office linux卸载,永中office2012forLinux的安装卸载
  14. elementUi上传视频组件
  15. linux uwsgi 非root,只能以root身份运行uwsgi
  16. tf-serving部署之踩坑记录
  17. 基于STM32使用TTP223点动触摸传感器模块
  18. AppCrash explorer问题(解决方法)
  19. 高德地图 AMap.Driving
  20. 【计算机网络】—— HTTP升级为WebSokect

热门文章

  1. [转]浅析360的危害 我为什么推荐卸载360
  2. 骑士CMS模版注入+文件包含getshell复现
  3. 工业互联网时代下橙色云CDS的商机直通车服务
  4. CentOS Firefox播放视频--安装Flash插件
  5. windows Server 2012修复(CVE-2016-2183)(CVE-2013-2566)(CVE-2015-2808)
  6. 看steam教育之风带来创新与变革
  7. 基于jsp的网上作业批改系统
  8. 基于matlab的Hough变换图像直线检测算法仿真
  9. 快手挂小黄车和快手小店有什么区别?如何开通快手小店?
  10. c语言编程大体思路,C语言:程序的设计思路跟特点