前沿AI技术体验:从文字直接产生图片,结果真的震撼! 非常有意思!

背景

最近这段时间,大火的文本转图片的模型,不管是 Open AI 的 DALL·E 还是 Goggle 的 Imagen. 单从公布的效果来看,可以说是十分惊艳,让我大受震撼。

https://mp.weixin.qq.com/s/1eZHl6Rzao7SRLbyBsMXng

想要了解其中原理和细节,短时间对我来说可以很困难。 有没有什么办法能亲自体验一把这新奇技术呢?不知有多少朋友是和我一样的想法的。 好在有大佬已经开发出了网站。

网站体验

https://www.craiyon.com/

该网站背后基于 DALL·E mini, 由 Hugging Face公司的码农2022年6月公开。可以随便玩,输入英文描述,约1分钟就可以产出图片。

初体验

例如输入:a bird in the blue sky 网站便可返回如下图片.

结果还不错!

试试中国古诗

坊间传闻,老外很难能理解中国古诗中意境的美,那我来试试看 DALL·E 能不能“理解”。 以: 无边落木萧萧下,不尽长江滚滚来.为例。 拿古诗的前半句来试试。这里先将它翻译成下面的英文,输入到网址中:

The boundless forest sheds its leaves shower by shower in autumn

确实,部分图片确实有一种秋风萧瑟的凄凉的感觉

此外还多了几分阴森..

创意设计

既然,模型这么厉害,那么我让她为我的公众号设计一个 logo 看看:

同样,将知行并重 翻译成英文: 输入:logo of Knowledge and action should go hand in hand. 得到了如下结果: 说实话, 非常的 amazing!!! 结果超出了我的预期的: 不知大家觉得哪张 更好? 欢迎评论区投票,得票最高的我将其设定为 微信公众号的 头像。

其他想法

目前,在官网上,生成的图片清晰度十分有限,后面将会借助开源的模型,在本地部署,生成高清的图片。到时我也会再出文章,给大家介绍具体方法,敬请期待。

ps: 兴许以后文章的封面,就不用愁了,也不用考虑版权问题。封面自由指日可待~

本篇文章的封面,就是通过 "cover: interesting and breaking news“ 生成的。

更多玩法

大家,可以去感受下国外朋友的玩法 https://baijiahao.baidu.com/s?id=1735721418290089066&wfr。

总结

今天,通过体验了一把最新的深度学习技术,确实很有意思。下面谈谈几点我对这个技术的看法:

首先,不足方面:

  1. 网站生成的图片多数的时候并不会太完美,有时给出的结果甚至有些诡异
  2. 生成图片的清晰度很有限。 虽然作者建议: 在描述时,加上 "illustration", "photorealistic", "high definition" 这些关键词,但实际实验,并没有多少改善。

其次,价值方面:

  1. 在学术上 DALL·E 意义无疑是重大的。对于我们普通人来说,DALL·E 给出的结果,时常可以给我们带来惊喜。 它可以开阔我们的思路,拓展我们的想象力,尤其是对从事设计、创意的朋友而言。因此,在 DALL·E 的结果基础上进行二次创作也许是个不错的选择。

欢迎在评论区写下你的看法,一起交流。

参考文章

https://zhuanlan.zhihu.com/p/121638712


本文由 mdnice 多平台发布

前沿AI技术体验:从文字直接产生图片,结果真的震撼! 非常有意思!相关推荐

  1. 智源杯天文数据算法挑战赛开赛,前沿AI技术助力天文科学研究

    由北京智源人工智能研究院主办,国家天文台.数据评测平台biendata联合举办的天体分类数据竞赛于2020年1月开赛.本次比赛旨在鼓励大众参与到天文学的探索当中,利用最新的人工智能算法分析望远镜收集到 ...

  2. 人工智能前沿——AI技术在医疗领域的应用(二)

    >>>深度学习Tricks,第一时间送达<<< 目录 01 医疗管理 02 公共卫生 03 医学研究 04 医疗培训 05 医学专业支持 06 为患者提供直接帮助 ...

  3. 调用百度AI平台API进行文字识别和图片识别

    写在前面 这应该是本年度的最后一篇技术博客了,今年在CSDN上总共发表了20篇博客,除掉几篇LeetCode的博客,都是个人工作的总结,总体来说,收获不少,随手记录的习惯也养成了.希望来年持之以恒. ...

  4. 腾讯广告的多媒体AI技术实战

    01 引言 网络广告是腾讯公司重要的商业模式之一,在广告收入持续提高的同时,对广告基础技术也提出了新的要求.面对复杂的广告商业生态,保障广告安全.完善广告形态.提升用户体验.提高广告收入,成为所有腾讯 ...

  5. 微软语音AI技术与微软听听文档小程序实践 | AI ProCon 2019

    演讲嘉宾 | 赵晟.张鹏 整理 | 伍杏玲 来源 | CSDN(ID:CSDNnews) [导语]9 月 7 日,在CSDN主办的「AI ProCon 2019」上,微软(亚洲)互联网工程院人工智能语 ...

  6. 全球首部AI交响变奏曲问世,AI技术应用再拓边界

    郭一璞 发自 凹非寺 量子位 报道 | 公众号 QbitAI 人工智能技术,史上第一次升级到了复杂音乐的创作领域:交响曲. 全球首部AI交响变奏曲<我和我的祖国>,昨晚已由深圳交响乐团全球 ...

  7. 第二十九期:全球首部AI交响变奏曲问世,AI技术应用再拓边界

    人工智能技术,史上第一次升级到了复杂音乐的创作领域:交响曲. 全球首部 AI 交响变奏曲<我和我的祖国>,昨晚已由深圳交响乐团全球首演,它的出品方是中国平安人工智能研究院. 此前,你可能了 ...

  8. 微软语音 AI 技术与微软听听文档小程序实践 | AI ProCon 2019

    演讲者 | 赵晟.张鹏 整理 | 伍杏玲 出品 | CSDN(ID:CSDNnews) [CSDN 编者按]9 月 7 日,在CSDN主办的「AI ProCon 2019」上,微软(亚洲)互联网工程院 ...

  9. 百度AI实战营第二季:AI技术商业落地指南

    4月 20日,百度 AI开发者实战营第二季启动,再次召集全国各地技术管理者,在北京"整装待发",并将陆续登陆成都.杭州.深圳.在新一季的实战营中,百度 AI将与开发者.合作伙伴一起 ...

最新文章

  1. android 切换排列,在运行时重新排序android线性布局?
  2. Windows.form增删改查
  3. go channel 缓冲区最大限制_一起攻克面试难关:Go 面试每天一篇(第 40 天)
  4. 【转】DCMTK各模块说明!!!!!!!
  5. 单链表遍历_单链表及其遍历实现的基本操作
  6. 【Java从0到架构师】日志处理 - Log4j 1.x、JCL
  7. 代码编辑器横评:为什么 VS Code 能拔得头筹?| 程序员硬核评测
  8. RabbitMQ入门-Topic模式
  9. MFC 线程创建方式
  10. phpStorm 2017.3.1,WebStorm 2017.3.4 最新版本免费注册激活方法
  11. Linux内核编程02:Kbuild子系统
  12. 基于java的电子政务网的设计及开发
  13. 全栈式python工程师培训课程
  14. Spring3.2.1+Hibernate4.1.7 多数据源动态切换
  15. 迷你计算机笔记本,世界上最小的笔记本电脑,机身小巧仅有7英寸
  16. git提交到主干后,本地将主干代码更新到分支上
  17. 电脑开机蓝屏怎么解决?3个方法,快速解决电脑蓝屏
  18. java精尽面试题MySQL面试高频一百问(工程师方向)
  19. 引路蜂技术博客论坛开放
  20. 【英特尔杯记录】Python戴口罩人脸识别部分

热门文章

  1. 【方向盘】逐渐碎片化的Java生态圈:Oracle JDK、OpenJDK、阿里Dragonwell、华为毕昇
  2. ChatGPT中文在线官网-如何与chat GPT对话
  3. P1204 电池的寿命
  4. 图论方法在大脑网络中的应用
  5. SuperMap自然资源确权登记解决方案
  6. MYSQL通过索引进行优化
  7. 关于线上API聚合支付系统的功能介绍,为什么选择聚合支付?
  8. 内蒙古工业大学c语言设计考试卷,求助:大一c语言考试题型是啥啊?后天就考了。...
  9. 点击按钮给网页换皮肤简单js实现
  10. 华为账号怎么强制退出