OpenAI发布新人工智能系统:根据文字生成图像
来源:新浪科技
据报道,旧金山人工智能研究公司OpenAI已经开发了一种新系统,能根据短文本来生成图像。
OpenAI在官方博客中表示,这个新系统名为DALL-E,名称来源于艺术家萨尔瓦多·达利(Salvador Dali)和皮克斯的机器人英雄瓦力(WALL-E)的结合。新系统展示了“为一系列广泛的概念”创造图像的能力,创作的作品包括牛油果形状的扶手椅等。
通过神经网络去生成图像,这种技术并不新颖。此前,生成对抗网络(GAN)已被广泛用于创建真实的人、宠物、租赁房产和食物的照片。
不过,DALL-E的独特之处在于可以根据输入的文本来创作图像。该系统基于文字生成系统GPT-3的一个版本,该系统此前被用于撰写诗歌和新闻文章等。利用配对好的文本和图像数据集进行训练,DALL-E可以根据新的文字提示生成图像,此外还展示了创造多种风格图片的能力。
OpenAI还发布了图像识别系统Clip。Clip通用性比当前针对单个任务的系统更好,可以用网上公开的文字图像配对数据集来训练。
DALL-E还需要继续优化。OpenAI指出,DALL-E目前的可靠性还存在问题,对类似“glass”等有多个含义的名词常常会混淆,文字中不同的语法也可能会造成不同的结果。
此外还有更深层次的问题需要解决。OpenAI表示:“我们注意到,涉及生成模型的工作可能会产生重大而广泛的社会影响。”未来可能的举措包括研究对就业岗位的影响,生成结果的偏见,以及技术的长期道德挑战。
长期以来,公众一直担心人工智能生成的媒体内容被滥用,例如神经网络被用来制造虚假的音视频和图像,用于不道德的目的,例如政治上的假信息和欺诈活动等。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”
OpenAI发布新人工智能系统:根据文字生成图像相关推荐
- 2016~2022 文字生成图像 Text to image(T2I)论文整理 阅读路线和阅读指南
2016~2021 文字生成图像 Text to image(T2I)论文汇总 阅读路线和阅读指南 综述类 部分最新重要研究成果 发展与往年经典模型 综述类 1.Adversarial Text-to ...
- OpenAI发布新算法MuseNet,让甲壳虫乐队与LadyGaga一起演奏
大数据文摘出品 来源:technologyreview 编译:汤圆.夏雅薇 如果莫扎特现在还活着(而且感觉有点缺乏灵感),他可能会坐下来创作这样的音乐: 一段莫扎特风格的音乐,由MuseNet制作. ...
- AI版「女娲」来了!文字生成图像、视频,8类任务一个模型搞定
来源丨机器之心 作者丨陈萍.小舟 AI会是未来的「造物者」吗? 近来,视觉合成任务备受关注.几天前英伟达的 GauGAN 刚刚上新了 2.0 版本,现在一个新视觉合成模型 Nüwa(女娲)也火了. 相 ...
- 智源社区AI周刊No.99:OpenAI发布接近人类水平的语音识别系统Whisper;马毅:智能的计算和科学研究将融合...
汇聚每周AI观点.研究和各类资源,不错过真知灼见和重要资讯!欢迎扫码,关注并订阅智源社区AI周刊. 编辑精选 1. UC伯克利马毅:智能的计算和科学研究将能够很快融合 查看详情 近日,智源社区举行&q ...
- 引燃AI社区,不用跨界也能从文本生成图像,OpenAI新模型打破自然语言与视觉次元壁...
视学算法报道 作者:魔王.杜伟.蛋酱 艺术创作的事,以后人类只要动手打几个字,其他的交给 AI 就行了. 自然语言与视觉的次元壁正在被打破.这不,OpenAI 最近连发大招,提出两个连接文本与图像的神 ...
- Adobe发布AI智能生成图像新工具,助力Adobe国际认证再添就业利器
原标题:Adobe国际认证再添就业利器!Adobe加入AIGC战局:推出图片生成AI 版权优势成为大杀器 当这一切来临,就是这么的突然 虽然还没有准备好,但只能默默选择接受 ...... 3月22日早 ...
- 缩小规模,OpenAI文本生成图像新模型GLIDE用35亿参数媲美DALL-E
视学算法报道 编辑:陈萍.小舟 模型的参数规模并不需要那么大. 从年初 OpenAI 刷屏社区的 DALL-E 到英伟达生成逼真摄影的 GauGAN2,文本生成图像可谓是今年大火的一个研究方向.现在 ...
- 苹果发布 AI 生成模型 GAUDI,文字生成 3D 场景
整理 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 前有DALL.E文本生成图像,现有将文字变成 3D场景.近日,苹果 AI 团队发布最新 AI 模型 GAUDI,它是基于 3D ...
- 微信朋友圈新增仅最近一个月可见;OpenAI 发布音乐生成网络 MuseNet
(给技术最前线加星标,每天看技术热点) 转自:开源中国.solidot.cnBeta.腾讯科技.快科技等 [技术资讯] 0.OpenAI 发布音乐生成神经网络 MuseNet OpenAI 发布了深度 ...
最新文章
- 申请重新邮寄CCNA证书成功!!!!!(转)
- Linux通过XAMPP集成软件包搭建LAMPP环境
- 如何搭建安卓开发持续化集成环境(Ubuntu + Jenkins + SonarQube)
- 【渝粤教育】国家开放大学2018年春季 0062-22T港台文学专题讲座 参考试题
- C++的一般引用及其数组引用
- 2017.9.5 能量采集 思考记录
- python filter过滤器的使用_Python filter过滤器原理及实例应用
- 【报告分享】2020年中国企业直播服务市场研究报告.pdf(附下载链接)
- 第五十篇、OC中常用的第三插件
- DevOps使用教程 华为云(17)git 比较2个分支版本的差异 某个具体文件的差异
- 百度搜索开放平台,百度搜索api
- Cocos2d-x 是一个支持多平台的 2D 手机游戏引擎
- 微信营销软件 php下载,北牧微信营销系统CMS企业版 php版免费版_北牧微信营销系统CMS企业版 php版PC版下载-东乐软件网...
- PDR (Pedestrian Dead Reckoning)行人航位推算基本原理及实现
- 当YOLOv5遇见OpenVINO!
- 销 售 中 的 异 议
- vue 更改 element-ui 中 el-table 默认的暂无数据样式
- 【从0到1搭建LoRa物联网】7、国产LoRa终端ASR6505驱动段式LCD例程
- 触发器原理与使用方法
- 计算机发明者的电影,电脑发明的奠基人之一,你了解他的生平吗?这部电影带你走近天才...