2021年1月,OpenAI 推出 DALL-E。这是 GPT 模型在图像生成方面的人工智能应用。其名称来源于著名画家、艺术家萨尔瓦多 • 达利(Dalí)和机器人总动员(Wall-E)。DALL-E 图像生成器,能够直接根据文本描述生成多种艺术风格的高质量图像,让机器也能拥有顶级画家、设计师的创造力。本期 Azure OpenAI 官方指南,为您详解 DALL-E 的图像生成功能、安全过滤机制与常见应用场景

DALL-E的图像生成功能 ╱ 01

DALL-E的安全过滤机制 ╱ 02

DALL-E的常见应用场景 ╱ 03

DALL-E的图像生成功能

DALL-E 是一个高级人工智能应用,能够根据简单的自然语言描述创建极其逼真和清晰的图像。DALL-E 精通各种艺术风格,甚至可以根据季节、光线、环境、时间的不同,绘制相应的光影。

新推出的 DALL-E 2 版本,能够以比 DALL-E 高4倍的分辨率,生成更真实、更准确的图像,尤其在字幕匹配和照片真实性方面优于 DALL-E。此外,DALL-E 2 还具有更快的生成速度和更低的计算成本

人们可以尽情展开想象力,DALL-E 2 可以短时间内将各种有趣的想法转化成图像。例如,当您描述 “可以通向另一个世界的一碗汤”,并指定图片风格分别为:数字艺术、巴斯奎特涂鸦风格以及洞穴壁画时,DALL-E 2 将生成如下画作:

⦿ 数字艺术风格

⦿ 巴斯奎特涂鸦风格

⦿ 洞穴壁画风格

除了画作外,DALL-E 2 还可以生成照片级的真实图像,如:宇航员闲适地呆在太空中的热带度假胜地。

此外,DALL-E 2 还有很多强大的拓展功能:

拓展功能 1

可以基于原始图像,在原始画布之外生成新图像,创造新构图。

▲ 点我观看《戴珍珠耳环的少女》新构图

拓展功能 2

可以基于自然语言描述,添加和删除元素,同时呈现出真实的阴影、反射和纹理。

例如,以图1作为原始图片,在不同的位置分别放置火烈鸟时,图2、3、4分别呈现出了地板、水面、玻璃的多种反射和折射:

拓展功能 3

可以根据局部风格来调整成像,使画面整体更具真实性。

例如,图1是一张画展照片,在两幅画的位置和真实世界分别添加一只柯基,DALL-E 2 可以根据画面的局部风格,呈现出真实效果:

拓展功能 4

可以根据原始图像创建不同的变体

DALL-E的安全过滤机制

DALL-E 不仅能够理解图像,更能够理解图像和用于描述图像的文本之间的关系。基于此,我们能够理解AI是怎么看待这个世界的,并借此提升AI的生成能力和安全性。

为了确保使用者可以放心地使用 DALL-E,而不必担心生成的图像包含不适当的内容,DALL-E 通过模型训练构建了安全过滤机制,使模型从训练数据中获取明确的过滤内容。

DALL-E 2 预览版本中的安全过滤机制包括:

●  内容输入过滤器以及访问、使用等权限的相关策略。

●  风险导向调查和评估,包括偏见,虚假和错误信息,经济影响,涉及仇恨、骚扰和暴力的信息,版权等。

●  结合现有技术,思考进一步的风险和缓解措施。

DALL-E的常见应用场景

DALL-E 可以根据文字描述进行艺术创作,生成高质量的图像,并根据需要进行调整。因此,DALL-E 可以应用于广泛的领域和场景,例如广告、游戏、娱乐、教育等。

⦿ 广告娱乐:使用 DALL-E 生成极具吸引力的图像,以吸引更多客户。

⦿ 游戏:使用 DALL-E 生成游戏中的角色和场景,以增强游玩互动体验。

⦿ 教育:使用 DALL-E 生成教学图像,以帮助学生更好地理解课程内容。

⦿ 图形设计:使用 DALL-E 生成各种不同类型的图像,例如动画、漫画、矢量图等。

⦿ 汽车:使用 DALL-E 生成汽车设计图纸,以加速开发新车型。

⦿ 制造和零售:使用 DALL-E 生成产品图像,以优化产品销售体验。

此外,DALL-E 十分易用,可以通过 API 与其他系统集成,使开发人员可以轻松地将其集成到他们的应用程序中,获取更多功能。

微软已经宣布,将 DALL-E 集成到新版必应搜索引擎和 Designer 图形应用程序中,帮助设计师尽可能轻松地创建独特的图像和设计。设计师只需输入产品或公司名称,Designer 将帮助生成符合品牌形象的独特视觉效果。当添加新素材时,它还可以自动更新,确保与整体设计完美匹配。“有了 Designer,设计师就不需要从头开始创作,也无需耗时在数千个预先制作的模板中搜索。只需注入想象,让人工智能接管创作!”

▲ 点我了解 DALL-E 的酷炫功能

企业级Azure OpenAI国际版官方指南

Vol.03 DALL-E 作者

钱祺斌微软云高级解决方案架构师

Azure OpenAI 官方指南03|DALL-E 的图像生成功能与安全过滤机制相关推荐

  1. Azure OpenAI 官方指南04|Codex的模型结构和应用场景

    Codex 是 OpenAI 公司推出的 GPT-3(Generative Pre-trained Transformer – 3)的多个派生模型之一.它是基于GPT语言模型,使用代码数据进行 Fin ...

  2. 无痕 PS、读得懂文字,OpenAI 的二代 DALL·E 惊艳亮相

    能无痕 ps,能将文字转为图像,新一代的 DALL·E 2 有着什么样的魔力? 作者 | 马超       责编 | 屠敏 出品 | CSDN(ID:CSDNnews) 去年 1 月,OpenAI 推 ...

  3. 【ChatGPT】《Azure OpenAI 服务 - 提示工程简介》- 知识点目录

    <Azure OpenAI 服务 - 提示工程简介> 1. 格式示例提示 第三个示例中仅仅给出了格式[要点:| •],模型可以按照"格式示例"给出相应格式的回答: 2. ...

  4. 使用 OpenAI 创建 AI 驱动的 React 图像生成器应用程序

    欢迎来到 AI 驱动的应用程序世界!在这篇博文中,我们将探索使用 React 和强大的 OpenAI 平台创建图像生成器应用程序的激动人心的机会. 无论您是初学者还是经验丰富的开发人员,您都将学习如何 ...

  5. 微软推出的Prompt高级玩法,包括小样本和任务分解等,简直不要太详细:Azure OpenAI 的提示工程技术

    搜索 打开App 微软推出的Prompt高级玩法,包括小样本和任务分解等,简直不要太详细:Azure OpenAI 的提示工程技术 8 小时前 ChatGPT云炬学长 ChatGPT云炬学长 ​关注 ...

  6. 基于扩散模型的文本引导图像生成算法

    ©作者 | 微风 单位 | 中山大学+IDEA研究院 研究方向 | 多模态表征学习.多模态生成 DALL·E 2 之所以能够生成十分惊艳的图像,扩散模型功不可没,相比 GAN,该模型可以生成更多样,更 ...

  7. 图像生成之扩散模型:靠加入类别条件,效果直达SOTA

    来源:AI蜗牛车 本文约1300字,建议阅读7分钟 比GAN更真实.还懂全景局部多角度构图. OpenAI去年年末推出的新作GLIDE,又让扩散模型小火了一把. 这个基于扩散模型的文本图像生成大模型参 ...

  8. 图像生成王者不是GAN?扩散模型最近有点火:靠加入类别条件,效果直达SOTA

    博雯 发自 凹非寺 量子位 报道 | 公众号 QbitAI OpenAI刚刚推出的年末新作GLIDE,又让扩散模型小火了一把. 这个基于扩散模型的文本图像生成大模型参数规模更小,但生成的图像质量却更高 ...

  9. ChatGPT使用案例之图像生成

    ChatGPT使用案例之图像生成 这里一节我们介绍一下ChatGPT的图像生成,这里我们使用代码来完成,也就是通过API 来完成,因为ChatGPT 本身是不能生成图片的,言外之意我们图片生成是Cha ...

最新文章

  1. electron 托盘图标闪烁_从零到一,用 Electron 开发桌面效率工具
  2. C语言中的关键字概览
  3. kali linux 设置固定IP地址步骤
  4. 30个让人兴奋的视差滚动(Parallax Scrolling)效果网站
  5. java web mysql视图_Javaweb项目-下拉列表显示后台数据库的数据
  6. 服务器加根网线用不用修改路由器,安装设置无线路由器需要用几根网线?
  7. LintCode 386. 最多有k个不同字符的最长子字符串(双指针)
  8. 数据库 数据库SQL语句一
  9. 深度学习笔记(16) 误差分析(一)
  10. 初探Thymeleaf模板引擎
  11. ZMQ模式详解——发布/订阅模式
  12. jquery.chosen.js实现模糊搜索
  13. sublime text3怎么运行python代码_sublime text3 怎么配置、运行python
  14. 老机器上安装了kubuntu先尝试安装Manjaro但是鼠标按键无法使用彻底解决办法
  15. 浅谈地铁视频监控的方法与技巧
  16. 科学计算机器上怎么算e的多少次方,在计算器上用字母e是代表什么
  17. HBase常用过滤器
  18. Google earth 生成研究区适量边界(研究区边界从哪来?)
  19. 0716 process finished with exit code 0 解决
  20. 关于安卓系统4.0/5.0/6.0获取单卡手机,双卡手机的imei1,imei2,meid(用反射来实现,史上最详细,最全面获取)--binbinyang

热门文章

  1. 为什么说Java不适合做游戏开发,劣势在哪里?
  2. java输出梯形_java怎么打印等腰梯形
  3. 【报告分享】2021美伊白皮书-阿里妈妈CBE(附下载)
  4. ensp-熟悉常用ip命令(第二天)
  5. 联发科将于今年晚些时候推出支持5G的7nm芯片组
  6. linux opencv打开图片路径,OpenCV读取图像_显示图像_保存图像
  7. jmeter代理录制APP
  8. html登录 页面连接数据库,连接数据库实现登录页面
  9. 哪个品牌云服务器性价比高,比较好用?
  10. android miui9.0改装条例,小米8青春版获得基于Android9.0定制的MIUI更新