做过10亿次设计的人工智能「鹿班」,原来是他负责的!
https://www.uisdc.com/responsible-for-the-design-of-luban
这期节目我们请到了阿里巴巴智能设计实验室的负责人乐乘。这个智能设计实验室有个最著名的项目叫鲁班(现更名为鹿班),大家可以简单的把鹿班理解为一个人工智能设计师,去年这个名叫鹿班的智能设计师在双11期间为阿里绘制了4.1亿张各不相同的个性化广告图,而今年鹿班甚至开始学会设计网页了。人工智能会对设计这个行业造成怎样的影响,它会判断美丑吗?鹿班会像 AlphaGo 超越人类围棋手一样,在未来超越人类设计师的水平吗?所有这些问题,我们会在这期节目里和乐乘一一讨论。
鹿班的整体架构有三个核心单元。
1.学习器
第一就是我们从过去海量的设计稿中利用深度学习提炼出设计经验。深度学习就是从很多高维的、海量的数据中提取隐含的特征。举例来说,一张广告设计图中,有一件碎花连衣裙、花朵和蓝天的背景。这张图片是含有很多维的信息,比如背景的纹理、字体的大小、色彩的搭配、还有设计元素之间的位置关系等等。通过深度学习,我们就能把这些高维的像素图片抽象为了一个蕴含这些多维信息的量化图。通俗来说,这张量化图就是这张设计图中蕴含的设计知识。当数据量足够大时,鹿班就能总结出一个通用的设计的知识模型。
2.行动器
当我们总结了许多设计知识后,面对一个设计需求,鹿班要怎么去根据量化图反向生成一张像素图片呢?
这就要说到第二个核心单元——行动器。举例来说,通过学习那张碎花连衣裙的广告图,再遇到类似的需求时,鹿班就会在这张设计的基础上,从一个海量的设计素材库里索引,匹配和替换其中的元素,然后经过大量的计算跟迭代,最后生成一张新的图片。这其实就是强化学习的过程,就是在一个受限的空间和范围内去不断尝试,通过内部或外部会提供的反馈,得出一个最优的结果。
3.评估器——规则约束+人工打分
第三个核心单元就是评估。因为鹿班会得到非常多的结果,需要一个评判的机制来鉴定这些结果是否符合设计的要求和标准。这个部分的进展没有前两个单元那么快,因为这是一个非常宏大的命题。我们也在和很多高校合作,研究如何让机器来评判美、丑,设计的好、坏。我们现在离让机器懂得审美这么高级的阶段还很远。我们能够做到的是制定一些规则约束。比如当一个设计明显不合理时,就可以作为一个约束条件放进去。另一方面,我们会人工给过去的设计成品进行打分,来让鹿班学习给任意一张图片打分。这个模块现在还在早期的阶段,还有很长的路要走。
鹿班能超过人类设计师吗?
提问:UX COFFEE: 评估这个模块很有意思。你们想让机器学会审美,但是听起来我们距离这一天还很遥远,因为目前大部分判断美、丑的工作还是有人工介入的。这和 Google AlphaGo 的机器学习就很不一样,因为下围棋有一个非常特定的条件,就是获胜。但是设计这件事情并没有获胜的概念,美丑的概念是相对的,甚至是非客观的。听起来鹿班这套系统并不会设计出人还没有设计出来的东西,就是不会超出人类设计师的水平,是这样吗?
设计的评估方法是非客观的,不确定性
乐乘:这个问题问得很好,我觉得不能用一个是或者不是来回答。我更想分享一下我对这个事情背后的想法。还是回到和 AlphaGo 的对比来看,正是因为围棋是一个规则评判标准非常清晰的游戏,它的量化的评估方式非常确定,所以 AlphaGo Zero 才能够脱离人的输入自己学习,甚至通过学习发现人下围棋的方式可能都错了。AlphaGo Zero 的成功是这个场景的特性决定的。但是人类社会里面有多少问题,能像围棋规则这么确定呢?其实大部分都不是。设计就是非常典型的,有着无穷无尽的计算空间,历史的进化的过程中有不同的趋势。它是个人文问题,也是个社会问题,而不是一个纯粹的数学问题。当我们做到比较深的一个阶段之后,这个命题背后的复杂度和对算法技术的挑战,远比我们早期想的要复杂得多。
现阶段鹿班确实不能生成超出人类能力太远的设计来。未来的几年我们还会继续深入这个命题。未来有一天,机器有可能真的会做出我们都没有见过的设计。
△ 人工智能学习设计 (图片来源:微信公众号「阿里巴巴UED」)
三、让商家有自己的小鹿班
UX COFFEE:在淘宝上卖货的很多品牌商家,他们对于自己的品牌形象、设计风格,应该也是有要求的,鹿班要如何去满足他们的要求呢?
乐乘:对于这个问题,我们的解决方案就是向品牌商家开放我们的训练体系。阿里作为平台方,我们只能知道这个品牌过去做过什么设计,却没法知道他们对未来的需求,所以我们决定开放鹿班这个平台,让企业主也都能使用自己的小鹿班来做设计。
UX COFFEE:那鹿班生成的这个设计的结果如何?会不会有设计程式化的、模板化的问题?
乐乘:其实这个模型里的多样性和确定性的参数问题。多样性高了,机器就会产生很多新的变化,但有可能结果就会过度发散。但如果把确定性做到极致,在算法里面就有一个过拟的问题,机器学出来东西跟原来一模一样,这就失去了学习的意义。所以我们尽量要在多样性和确定性之间有一个平衡。 设计出多样性 又 不过度发散的 好作品
下一步计划和目标
UX COFFEE:你们下一步的计划和目标是什么?
乐乘:除了刚刚提到的向商家开放平台,另一方面就是内容设计。因为广告图还只是一个单张图片的设计,但平面设计师还有很大一部分的工作是在做网页、易拉宝、宣传单,这种内容复杂度高于广告图的设计。这类的设计在技术原理上其实是相通的,只是我们会更侧重对复杂内容的表达。这样鹿班能够覆盖的平面设计的工作就更广了。
UX COFFEE:那国内的路边摊广告公司可能要感受到很大的威胁。因为我以前在大学的时候就会去做很多讲座的海报、易拉宝,确实都是很模板化的,我可以想见鹿班的这套人工智能系统会更快,甚至更好地完成这些工作。我也知道阿里是一家非常重运营的公司,你们几乎每天都有运营活动,如果运营活动的页面能够全都使用人工智能来做设计的话,对公司运营的规模化也能起到很大的帮助。
△ 阿里推出了驯鹿计划,让商家可以训练自己的鹿班
四、设计师们真的会失业吗?
UX COFFEE:如果人工智能可以做设计师的工作,那设计师以后的饭碗会不会受到威胁。你会不会思考做这件事情是不是搬石头砸自己的脚?
乐乘:这个问题很有意思。我觉得不同角色会有不同的视角看待这个产品。我作为这个项目的牵头人,我想的是如果这事能够做成,它会对设计行业有巨大的颠覆。就算有一天我真的被这个智能设计师淘汰,我也是很开心的。因为这件事即使我们不做,未来也一定会有人做。历史潮流或技术趋势对专业领域(的改变),是不以任何人的意志而改变的。
而我的设计同事,他们的态度比较中立。他们觉得「鹿班想淘汰我还早得很」,鹿班还不具备设计复杂系统的能力。所以他们对鹿班是一个开放的态度。他们会觉得「如果鹿班能帮我做一些我不想做的事,也不错」。
但和我们合作的外包供应商的设计师是有些心慌的。因为他们本来的工作是很容易被取代的。他们会开始想办法转型跟升级。
UX COFFEE: 人类和机器这对关系,可能是未来100年我们都会一直讨论的问题。对于鹿班来讲,这个命题更小一些,它是人类设计师和机器设计师之间的这样一个关系。你觉得人工智能设计未来会变成什么样?
乐乘:之前我听过一个很有意思的比喻——如果说真正的人工智能相当于人类登月,那现在的人工智能就只是人类爬到了树上。所以这真的是一个很宏大的命题。我们现在也只是走出了一小步。现阶段主流的算法技术是数据驱动的智能——有多少数据就有多少智能,没有数据就没有智能。但真正的设计智能,我觉得他应该不是纯粹数据驱动的。像刚刚提到的审美,光靠数据可能真的搞不定。当然未来也许像神经网络这类学科会有突破性的发展,等我们真的搞清楚了人类是怎么理解、认知问题的,到那个时候可能机器才能到「登月」的阶段吧。阿里现在也在和顶尖的研究所合作,做一些像美学评估这类面向未来的研究。
△ 乐乘在2017年 UCAN上关于人工智能的演讲
五、人工智能离能够「思考」还有多远?
机器具备设计智能的下一个节点
UX COFFEE: 在你看来,机器具备设计智能的下一个节点会是什么?
乐乘:
- 数据规模:如果站在数据智能的这个边界内去思考的话,我觉得当数据规模到达一个临界点之后会有一次跨越。直白的说,就是当今天人类做过的设计,机器都做过,人类看过的东西,机器都看过的时候,我觉得他可能就真的成为了一个大而全的数据智能机器。
- 脑神经:另一个可能的突破就是脑神经领域。如果真的能把脑神经的知识与人工智能结合,可能会带来一次比深度学习更大的革命。
人类设计师和机器设计师的优劣势
UX COFFEE:你认为人类设计师和机器设计师相比,彼此的优势和劣势是什么?
乐乘:我觉得人类设计师在灵感、创造、人文、社会问题的理解是机器哪怕到了未来阶段也不一定能做到的。现在机器的一个很明确的短板是它的认知能力是有限的,它不是真正地懂得内容。比如各国的文化禁忌,你觉得机器能理解吗?我觉得很难。
UX COFFEE:为什么会很难?
乐乘:比如说,在欧洲某个国家黑色的猫是不吉利的,所以天猫进入那个国家的时候,不能用黑猫的形象。今天你可以用一个指令告诉人工智能你不能做什么,但是它并不是智能,像这类的文化禁忌,今天机器是不会理解这背后的文化内涵的。
UX COFFEE:它需要去理解吗?我觉得 AlphaGo 给我的一个很大的冲击就是我觉得它其实并没有像人类那样去理解围棋这件事情,我们对围棋总结出了很多的规则,甚至上升到了哲学高度。但机器没有,它就是自我博弈,就习得了围棋的技巧。在它眼里,没有那些哲学概念,但它依然可以下到最好。
乐乘:对,人工智能把围棋当作一个数学问题在解,而人类把围棋当成了一种文化或者是艺术。但我也听到过一个反面观点,就是正因为今天人类没法去解这个宏大的数学问题,所以才用文化来解释它,其实也是因为人拿它没办法。也许我们下了那么多年的围棋,可我们并没有下对。
UX COFFEE:会不会有一天我们发现我们做了这么多年的 UI 都没做对,我们对界面的理解还是太浅薄。
乐乘:对,也就说有可能机器会做出比人更懂人的一些设计出来,或者让人更喜欢的设计出来,我觉得这个脑洞真的有可能。
UX COFFEE:作为人工智能设计师的设计者,你会给现在设计师什么样的建议?
乐乘:因为鹿班是从大规模的数据里抽象出的一种设计能力跟设计执行的产品,这就决定了它的上限——它的最好水平和人类的最好水平是有差距的。但是机器的下限或它最差水平却要比人类的设计要好很多。所以我判断人工智能设计会在中上游的水平,它到达不了顶尖,但是它会比很多刚入行的设计师要做的好。这可能是从设计院校刚毕业的同学必须要面临的问题,对于他们来说,刚走出社会的第一启动阶段的压力会比前辈们要高很多,你将不能在低阶上停留太久,自己的设计执行力要赶紧补上。对于高阶的设计师,我倒觉得不用担心,因为如果你知道它的原理,你就会知道哪些东西是可以给机器干的,哪些东西要自己专注去干,我觉得未来高级设计师永远是稀缺的。
参考链接
- 鹿班官网:https://luban.aliyun.com
- Alpha Go: https://deepmind.com/research/alphago/
扫描二维码或微信内搜索「UXCoffee」,关注 UX Coffee 设计咖 微信公众账号:
做过10亿次设计的人工智能「鹿班」,原来是他负责的!相关推荐
- 「鹿班智能设计平台」是如何工作的
目录 商业设计大脑的三大挑战 可控的视觉生成过程 机器如何学习设计 组成一,设计框架. 组成二,元素中心. 组成三,行动器. 组成四,评估网络. 视觉设计的四个层次 最基础的:临摹拓展. 第二层:场景 ...
- 重磅!AMD350亿美金收购赛灵思,「苏妈」终于出手啦!
点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 定了!10月27日,AMD和赛灵思正式宣布,已经达成最终协议,AMD 将以350亿美元全股票交 ...
- 纽约大学Gary Marcus发文指出AlphaZero「被夸大」,强调重视人工智能「先天因素」
原文来源:arXiv 作者:Gary Marcus 「雷克世界」编译:嗯~是阿童木呀 纽约大学Gary Marcus教授一直是深度学习的反对者,他认为深度学习并没有主动学习能力,且鲁棒性较差.同时,他 ...
- 开卖半年营收有望过亿,扫地机器人品牌「由利」获梅花创投数千万投资
2020年11月25日,扫地机器人品牌"由利"宣布完成数千万人民币天使轮融资,本轮由梅花创投独家投资.据悉,由利本轮融资资金将主要用于扫地机器人功能提升及创新应用的技术研发,推进国 ...
- 爱做梦的人工智能「Stabled Diffusion」
文章目录 开始之前 一.背景 1.1 项目速览 1.2 模型结构 1.3 参考内容 二.部署 2.1 初始化运行环境 2.2 初始化调用函数 2.3 Text To Image 2.3.1 参数配置 ...
- 算法分析与设计 —— 贪心算法「活动安排」「背包问题」「哈夫曼编码」
- android 10 数字健康,Android P 的「数字健康」功能,实际体验如何?
Android P 的「数字健康」功能,实际体验如何? 2019-04-10 15:43:52 2点赞 5收藏 1评论 入手三星S10e也有一段时间,很多功能还没有细细体验,最近发现系统设置里有个「数 ...
- 互联网日报 | 6月24日 星期四 | 快手全球月活已达10亿;HarmonyOS 2首批正式版升级;微软市值突破2万亿美元...
今日看点 ✦ 华为鸿蒙HarmonyOS 2首批正式版升级开启:支持Mate40等18款机型 ✦ 小鹏汽车通过港交所上市聆讯,港股将迎来智能电动车第一股 ✦ 快手CEO宿华:快手全球月活跃用户达到10 ...
- 推出 5 年后,微软想用设计「全面复兴」Windows 10
本文转载自 爱范儿,作者 周宇 今年 M1 芯片版 Mac 在性能.续航等方面的优异表现,直接引爆了大众舆论,它与 Windows .Intel 处理器的对比层出不穷. 不过微软也不是什么都没做,20 ...
最新文章
- SQL Server 自定义快捷键
- kafka发送及消费消息示例
- 【转】[Java] HashMap使用的示例
- sql server配置连接oracle数据库,MS SQL Server连接Oracle
- 如何简单快速调试高大上的谷歌浏览器
- PHP与ThinkPHP读写文件
- java中bmi的制作_Axure教程:在线BMI计算器制作
- 经纬度中度与度分秒的转换公式是什么,如114.629度=()度()分()秒
- 肖健雄的无人车公司AutoX,现在要在美国配送生鲜了
- php行为和事件是什么,Yii Framework框架中事件和行为的区别及应用实例分析
- redis java 下载_linux系统下安装redis以及java调用redis
- CPAL脚本自动化测试 ———— Test Report系列函数及使用
- 服务器ie浏览器总是未响应,win7电脑IE浏览器总是未响应怎么办 IE浏览器无响应原因解决方法...
- (43.1)【web应用漏洞发现】漏洞平台、开发框架、CMS漏扫工具
- 按分数段统计学生人数python_用Excel统计各分数段学生数
- 插秧诗 - 退步原来是向前
- 基于centos8部署nextcloud+onlyoffice----2021-07-16
- 为什么说OKRS-E是适合的OKR框架
- Excel之VBA编程常用语句300句
- EtcGame华丽升级为Coingame 新增ETH投注!