「分布式」艺术创作:20分钟+1080显卡,这个AI就能创造复杂作品 | 开源
点击上方,选择星标或置顶,不定期资源大放送!
阅读大概需要6分钟
Follow小博主,每天更新前沿干货
转载自:量子位
20分钟生成复杂的艺术作品,而且还是用英伟达上上代的1080显卡?
现在神经网络上手门槛这么亲民了吗?
没错,这是一个叫做neural-style-pt的风格迁移模型,基于Pytorch实现,而且刚刚开源!
有关这个算法模型的话题在Reddit上才发布一天,热度接近2000。
neural-style-pt,真的酷炫又亲民吗?
丰富的融合方式
neural-style-pt是论文A Neural Algorithm of Artistic Style的Pytorch实现。
论文介绍了一种利用卷积神经网络将一张图片的内容,与另一张图片的风格相结合的算法,就是我们熟知的“风格迁移”网络。
比如,将《星空》的艺术风格映射到一张斯坦福校园的夜景照片上:
或者根据给定图像的不同艺术风格,分别融合进目标图片:
除了“分别”融合,还能把多个艺术风格融进一张图片:
从左上角顺时针开始风格分别为”星空 “+”呐喊”、”呐喊 “+”构图七(瓦西里·康定斯基油画)“、”坐着的裸女(莫蒂里安尼油画) “+”构图七”、”坐着的裸体 “+”星空”。
在进行风格迁移时,添加“-original_colors 1”指令,还可以只改变风格,不改变原图颜色:
1080卡就能跑?
根据后台和优化器的不同,算法运行速度会有很大差异。
在Tesla K80上使用512像素图片迭代500次时间参考:
后台nn、优化器L-BFGS: 117秒
后台nn、优化器 ADAM: 100秒
后台cudnn -优化器L-BFGS: 124秒
后台cudnn -优化器ADAM:107秒
后台cudnn -cudnn_autotune -优化器L-BFGS: 109秒
后台cudnn -cudnn_autotune -优化器ADAM: 91秒
而在GTX 1080上,相同基准下时间更快:
后端nn -优化器L-BFGS: 56秒
后台nn -优化器 ADAM: 38秒
后台cudnn -优化器L-BFGS: 40秒
后台cudnn -优化器ADAM:40秒
后台cudnn -cudnn_autotune -优化器 lbfgs: 23秒
后台cudnn -cudnn_autotune -优化器ADAM: 24秒
结合当下1080卡的售价,不得不说,这样的门槛,对于机器学习来说,已经很香了。
默认情况下,neural-style-pt使用后端进行卷积,L-BFGS进行优化。但会使用大量的内存,可以通过以下方法来减少内存的使用。
使用cuDNN,添加-backend cudnn来使用cuDNN后端。而使用ADAM时,添加-optimizer adam来使用ADAM而不是L-BFGS。
在默认设置下,neural-style-pt在系统上使用了大约3.7GB的GPU内存;切换到ADAM和cuDNN可以将GPU内存占用减少到大约1GB。
如何上手试玩
安装neural-style-pt,首先要准备好Pytorch。
然后,使用下方一句话指令就能安装已经训练好的模型:
python models/download_models.py
安装完以后,上手试玩也很简单,一行代码就能实现:
python neural_style.py -style_image-content_image
如果要载入多种风格,需要分隔不同的图片文件名:
-style_image starry_night.jpg,the_scream.jpg
注意,图片名称要包含完整的地址路径。
基本操作就是这些。
neural-style-pt还有一点强大的功能,就是可以使用多个不同的计算设备来处理高分辨率图像。
不同的设备会输出不同网络层的计算结果。
你可以用-gpu指令控制使用哪些GPU和CPU设备,你也可以用-multidevice_strategy控制如何在不同设备上分割层。
例如,在一个有四个GPU的服务器中,指令“-gpu 0,1,2,3”,指按顺序在GPU 0、1、2和3上进行处理。
同时给出 -multidevice_strategy 3,6,12指令,表示前两层应该在GPU 0上计算,第3到5层应该在GPU 1上计算,第6到11层应该在GPU 2上计算,其余的层应该在GPU 3上计算。
根据你的需求调整-multidevice_strategy,可以达到输出的最大分辨率。
下面是一张4016x2213分辨率图像,是在使用8个Tesla K80 GPU的服务器上生成的:
1080显卡入门,还能“分布式”计算,这么酷炫好玩低门槛的风格迁移网络,赶快来试试吧~
传送门:
https://github.com/ProGamerGov/neural-style-pt
重磅!DLer-AI顶会交流群已成立!
大家好,这是DLer-AI顶会交流群!首先非常感谢大家的支持和鼓励,欢迎各位加入DLer-AI顶会交流群!本群旨在学习交流人工智能顶会(CVPR/ICCV/ECCV/NIPS/ICML/ICLR/AAAI等)、顶刊(IJCV/TPAMI/TIP等)写作与投稿事宜。包括第一时间发布论文信息和公开演讲视频,以及各大会议的workshop等等。希望能给大家提供一个更精准的研讨交流平台!!!
添加请备注:AI顶会+学校/公司+昵称(如CVPR+上交+小明)
???? 长按识别添加,即可进群!
「分布式」艺术创作:20分钟+1080显卡,这个AI就能创造复杂作品 | 开源相关推荐
- 20分钟+1080显卡,能跑多复杂的模型?
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 20分 ...
- 解密「天池」:如何做好一场万人AI竞赛的「大后方」?
来源:机器之心本文约9800字,建议阅读10+分钟面对数据集保护.算力公平性.结果可复现性等诸多挑战,天池是如何克服的呢? 一场一万五千人的竞赛,如何确保比赛顺利进行?如何保证公平公正?在这场活动中, ...
- 现有模型还「不懂」自然语言:20多位研究者谈NLP四大开放性问题
https://www.toutiao.com/a6649234323549454856/ 2019-01-22 16:25:07 在由 DeepMind 主办的 Deep Learning Inda ...
- 轻量型「孟子」模型比肩千亿大模型!AI大牛周明率队刷新CLUE新纪录
AI 科技评论报道 编辑 | 陈大鑫 近日,澜舟科技-创新工场团队与上海交通大学.北京理工大学等单位联合研发的中文语言模型-孟子轻量型模型,超越腾讯.搜狗等公司,在中文语言理解评测CLUE榜单上登顶第 ...
- 破解马赛克有多「容易」?
刷短视频时,估计大家都看过下面这类视频,各家营销号争相曝光「一分钟解码苹果笔刷背后内容」的秘密.换汤不换药,自媒体们戏称其为「破解马赛克」,殊不知让多少不明真相的用户建立起了错误的认知,也让苹果笔刷第 ...
- OpenAI CTO、吴恩达夫人……AI 领域值得关注的「她」力量,个个都是女强人
内容一览: 「她时代」来临,一些有着强大信念与热情的女性,纷纷投身至 AI 领域,成为不可或缺的存在与力量.值此国际妇女节到来之际,HyperAI超神经盘点了领域内令人印象深刻的杰出的女性代表. 关键 ...
- 赴一场开源盛会丨10月29日 COSCon‘22 开源年会杭州分会场,这里只差一个「你」!
报名地址:https://www.bagevent.com/event/8322877 2022年,世界正在改变,开源创造价值.已经办到第七届的开源年会首次来到杭州与开发者们相聚.你眼中的开源是怎样的 ...
- COSCon'22@Hangzhou|10月29日这里只差一个「你」!
COSCon'22 开源社/KAIYUANSHE 业界最具影响力的开源年度盛会 2022 第七届中国开源年会 (COSCon'22) 来啦! 如果你热爱开源.热衷创新 如果你想饱听各路大咖的主题 ...
- 智能汽车「博弈」供应链
由于全球仍处于疫情的重压之一,由此带来的包括供应链中断.工厂阶段性停工.物流运输成本增加及周期变长,以及人员往来的制约,一些全球汽车制造商正在考虑调整沿袭了数十年的供应链策略. 本周,大众汽车集团首席 ...
最新文章
- u盘如何linux双系统,怎么用U盘在Windows7下再安装ubuntu形成双系统?
- C语言 ---文件读取
- PhpStorm配置Xdebug调试PHP程序
- 本地创建分支push到github
- 红橙Darren视频笔记 仿QQ步数计数view 画笔的使用
- PAT甲题题解-1059. Prime Factors (25)-素数筛选法
- IDEA如何使用热部署方式启动项目?
- 遭遇 XSS 跨站脚本攻击?稳住,这些方法可保你渡劫 | 附代码、图解
- mysql什么是表的并的关系_MySQL表与表的关系
- 树莓派之安装dlna服务
- rabbitmqBat常用指令
- 计算机word表格平均分,Word表格自动求和_word求平均值 - 学无忧
- 【TSP】基于matlab蚁群算法求解旅行商问题【含Matlab源码 1130期】
- OpManager网络管理系统
- R数据分析:二分类因变量的混合效应,多水平logistics模型介绍
- 个人sublime定制
- 2020/2/24Axure 中继器使用心得
- exFat格式U盘 文件消失
- 服装企业SPA经营模式解析
- MIPI DSI转LVDS的桥接芯片,其应用图如下: ICN6202
热门文章
- yii权限rbac验证三张表字段说明
- Windump网络命令的简单用法
- mysql等价语句是_Mysql基本语句(个人笔记)
- 家电 计算机和电讯领域 英语,网络通讯及计算机英语词汇.doc
- 牛客网数据开发题库_练习SQL利器,牛客网SQL实战题库
- 不要在桌面保存长期修改的文件否则系统挂了时候面临文件丢失的问题,长期总结面试资料(公司 题目 地址 氛围 加班情况 薪资情况)毁于一旦
- python round()四舍五入有偏差 注意了解
- 阿里专家张磊:云原生为什么对云计算生态充满吸引力?
- 一本Python数据分析入门宝藏书,快藏不住了!
- 优秀的程序员都在哪里 如何寻找优秀的程序员?