年终盘点 | 2020年最佳CV论文速览「AI核心算法」
关注:耕智能,深耕AI脱水干货
作者:louisfb01 编译:ronghuaiyang 来源:AI公园
转载请联系作者
导读
论文,代码,解读,还有demo视频。
尽管今年世界上发生了这么多事情,我们还是有机会看到很多惊人的研究成果。特别是在人工智能更精确的说是计算机视觉领域。此外,今年还聚焦了许多重要的方面,比如伦理方面、重要的偏见等等。人工智能和我们对人类大脑及其与人工智能的联系的理解在不断发展,在不久的将来显示出了有前途的应用,这一点我一定会讲到。
以下是我今年在计算机视觉领域最有趣的10篇研究论文,以免你错过了其中的任何一篇。简而言之,它基本上是一个关于人工智能和CV的最新突破的精选列表,配有清晰的视频解释、更深入的文章链接和代码(如果适用的话)。好好享受吧。
观看完整的5分钟计算机视觉2020回顾
视频链接:https://youtu.be/CP3E9Iaunm4
完整的论文列表
Sea-thru: A Method For Removing Water From Underwater Images
Neural circuit policies enabling auditable autonomy
NeRV: Neural Reflectance and Visibility Fields for Relighting and View Synthesis
YOLOv4: Optimal Speed and Accuracy of Object Detection
PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Models
Image GPT - Generative Pretraining from Pixels
DeepFaceDrawing: Deep Generation of Face Images from Sketches
PIFuHD: Multi-Level Pixel-Aligned Implicit Function for High-Resolution 3D Human Digitization
RAFT: Recurrent All-Pairs Field Transforms for Optical Flow
Learning Joint Spatial-Temporal Transformations for Video Inpainting
Old Photo Restoration via Deep Latent Space Translation
Is a Green Screen Really Necessary for Real-Time Portrait Matting?
DeOldify
Sea-thru: A Method For Removing Water From Underwater Images
你有没有想过,如果没有水,海洋会是什么样子,去掉了这蓝绿色的水下照片,仍然有珊瑚礁的真实颜色?利用计算机视觉和机器学习算法,Haifa大学的研究人员能够做到这一点!
视频短片:视频链接:https://youtu.be/E1kffL4_AS8
论文解读:https://medium.com/towards-artificial-intelligence/this-ai-removes-the-water-from-underwater-images-d277281bcd0f
论文链接:https://openaccess.thecvf.com/content_CVPR_2019/papers/Akkaynak_Sea-Thru_A_Method_for_Removing_Water_From_Underwater_Images_CVPR_2019_paper.pdf
代码:https://github.com/jgibson2/sea-thru
Neural circuit policies enabling auditable autonomy
来自奥地利IST和麻省理工学院的研究人员已经成功地使用一种新的人工智能系统训练了一辆自动驾驶汽车,该系统基于小动物的大脑,比如蛲虫。他们只用几个神经元就能控制自动驾驶汽车,而流行的深度神经网络如inveptions、Resnets或VGG需要数百万个神经元。他们的网络能够完全控制一辆汽车,只需要使用由19个控制神经元组成的75000个参数,而不是数百万个!
短片:https://youtu.be/wAa358pNDkQ
论文解读:https://medium.com/towards-artificial-intelligence/a-new-brain-inspired-intelligent-system-drives-a-car-using-only-19-control-neurons-1ed127107db9
论文链接:https://www.nature.com/articles/s42256-020-00237-3.epdf?sharing_token=xHsXBg2SoR9l8XdbXeGSqtRgN0jAjWel9jnR3ZoTv0PbS_e49wmlSXvnXIRQ7wyir5MOFK7XBfQ8sxCtVjc7zD1lWeQB5kHoRr4BAmDEU0_1-UN5qHD5nXYVQyq5BrRV_tFa3_FZjs4LBHt-yebsG4eQcOnNsG4BenK3CmBRFLk%3D
代码:https://github.com/mlech26l/keras-ncp
NeRV: Neural Reflectance and Visibility Fields for Relighting and View Synthesis
该方法能够生成一个完整的三维场景,并能够决定场景的照明。与以前的方法相比,所有这些都只需要非常有限的计算成本并得到了惊人的结果。
短片:https://youtu.be/ZkaTyBvS2w4
论文解读:https://medium.com/what-is-artificial-intelligence/generate-a-complete-3d-scene-under-arbitrary-lighting-conditions-from-a-set-of-input-images-9d2fbce63243
论文链接:https://arxiv.org/abs/2012.03927
代码:https://people.eecs.berkeley.edu/~pratul/nerv/
YOLOv4: Optimal Speed and Accuracy of Object Detection
这第4个版本由Alexey Bochkovsky等人于2020年4月在论文“YOLOv4: Optimal Speed and Accuracy of Object Detection”中介绍。该算法的主要目标是在高精度方面做出一个高质量的超高速目标检测器。
短片:https://youtu.be/CtjZFkO5RPw
论文解读:https://medium.com/what-is-artificial-intelligence/the-yolov4-algorithm-introduction-to-you-only-look-once-version-4-real-time-object-detection-5fd8a608b0fa
论文链接:https://arxiv.org/abs/2004.10934
代码:https://github.com/AlexeyAB/darknet
PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Model
这个新算法将模糊的图像转换成高分辨率的图像!它可以把超低分辨率的16x16图像转换成1080p高清晰度的人脸!你不相信我?你就可以在不到一分钟的时间里自己试一下!但首先,让我们看看他们是怎么做到的。
短片:https://youtu.be/cgakyOI9r8M
论文解读:https://medium.com/what-is-artificial-intelligence/this-ai-makes-blurry-faces-look-60-times-sharper-7fcd3b820910
论文链接:https://arxiv.org/abs/2003.03808
代码:https://github.com/adamian98/pulse
Image GPT - Generative Pretraining from Pixels
一个好的人工智能,比如Gmail中使用的那个,可以生成连贯的文本并完成你的短语。这张图片使用了同样的原则来完成一张图片!所有这些都是在无人监督的训练中完成的,根本不需要任何标签!
短片:https://youtu.be/FwXQ568_io0
论文解读:https://medium.com/towards-artificial-intelligence/this-ai-can-generate-the-pixels-of-half-of-a-picture-from-nothing-using-a-nlp-model-7d7ba14b5522
论文链接:https://openai.com/blog/image-gpt/
代码:https://github.com/openai/image-gpt
DeepFaceDrawing: Deep Generation of Face Images from Sketches
你现在可以使用这种新的图像到图像转换技术,从粗糙甚至不完整的草图生成高质量的人脸图像,无需绘图技巧!如果你的画技和我一样差,你甚至可以调整眼睛、嘴巴和鼻子对最终图像的影响。让我们看看它是否真的有效,以及他们是如何做到的。
短片:https://youtu.be/djXdgCVB0oM
论文解读:https://medium.com/what-is-artificial-intelligence/ai-generates-real-faces-from-sketches-8ccbac5d2b2e
论文链接:http://geometrylearning.com/paper/DeepFaceDrawing.pdf
代码:https://github.com/IGLICT/DeepFaceDrawing-Jittor
PIFuHD: Multi-Level Pixel-Aligned Implicit Function for High-Resolution 3D Human Digitization
这个人工智能从2D图像生成3D高分辨率的人的重建!它只需要一个单一你的图像就可以生成一个3D头像,看起来就像你,甚至从背后!
短片:https://youtu.be/ajWtdm05-6g
论文解读:https://medium.com/towards-artificial-intelligence/ai-generates-3d-high-resolution-reconstructions-of-people-from-2d-images-introduction-to-pifuhd-d4aa515a482a
论文链接:https://arxiv.org/pdf/2004.00452.pdf
代码:https://github.com/facebookresearch/pifuhd
RAFT: Recurrent All-Pairs Field Transforms for Optical Flow
ECCV 2020最佳论文奖授予普林斯顿团队。他们开发了一种新的端到端可训练的光流模型。他们的方法在多个数据集上超越了最先进的架构的准确性,而且效率更高。
短片:https://youtu.be/OSEuYBwOSGI
论文解读:https://medium.com/towards-artificial-intelligence/eccv-2020-best-paper-award-a-new-architecture-for-optical-flow-3298c8a40dc7
论文链接:https://arxiv.org/pdf/2003.12039.pdf
代码:https://github.com/princeton-vl/RAFT
Learning Joint Spatial-Temporal Transformations for Video Inpainting
这个人工智能应用可以填补移除了目标之后丢失的像素,并使用更精确,更少模糊的方式重建整个视频。
短片:https://youtu.be/MAxMYGoN5U0
论文解析:https://medium.com/towards-artificial-intelligence/this-ai-takes-a-video-and-fills-the-missing-pixels-behind-an-object-video-inpainting-9be38e141f46
论文链接:https://arxiv.org/abs/2007.10247
代码:https://github.com/researchmm/STTN?utm_source=catalyzex.com
Old Photo Restoration via Deep Latent Space Translation
想象一下,你祖母18岁时的老照片,折叠的,甚至是被撕的,全部变成高清的,没有任何手工痕迹的照片。这就是所谓的旧照片修复,而这篇论文刚刚开辟了一个全新的途径来解决这个问题,使用深度学习方法。
短片:https://youtu.be/QUmrIpl0afQ
论文解析:https://medium.com/towards-artificial-intelligence/old-photo-restoration-using-deep-learning-47d4ab1bdc4d
论文链接:https://arxiv.org/pdf/2009.07047.pdf
代码:https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life?utm_source=catalyzex.com
Is a Green Screen Really Necessary for Real-Time Portrait Matting?
人像抠图是一项非常有趣的任务,目标是在照片中找到所有的人,然后把背景去掉。由于任务的复杂性,这真的很难实现,必须找到一个或多个拥有完美轮廓的人。在这篇文章中,我回顾了多年来使用的最佳技术,以及2020年11月29日发表的一篇新方法。许多技术使用基本的计算机视觉算法来实现这一任务,例如GrabCut算法,它非常快,但不是非常精确。
短片:https://youtu.be/rUo0wuVyefU
论文解读:https://medium.com/datadriveninvestor/high-quality-background-removal-without-green-screens-8e61c69de63
论文链接:https://arxiv.org/pdf/2011.11961.pdf
代码:https://github.com/ZHKKKe/MODNet
DeOldify
DeOldify是一种对黑白图像甚至电影胶片进行着色和还原的技术。它是由Jason Antic一人开发的,目前仍在进行更新。它现在是给黑白图像着色的最先进的方法,而且所有的东西都是开源的,但是我们将会回到这一点上。
短片:https://youtu.be/1EP_Lq04h4M
论文解读:https://medium.com/towards-artificial-intelligence/this-ai-can-colorize-your-black-white-photos-with-full-photorealistic-renders-deoldify-bf1eed5cb02a
代码:https://github.com/jantic/DeOldify
历史精华好文
专辑1:AI工程落地
专辑2:AI核心算法
专辑3:AI优质资源
交流合作
请加微信号:yan_kylin_phenix,注明姓名+单位+从业方向+地点,非诚勿扰。
年终盘点 | 2020年最佳CV论文速览「AI核心算法」相关推荐
- 2020最佳双人博弈对抗方法 | 基于强化学习对手建模的滚动时域演化算法「AI核心算法」...
关注:耕智能,深耕AI脱水干货 作者:唐振韬 报道:深度强化学习 CASIA 转载请联系作者 前言 格斗游戏是一项极具挑战的双人实时对抗人工智能博弈任务,常具有组合动作空间规模大.角色属性风格多样. ...
- 2020AI顶会的腾讯论文解读 | 多模态学习、视频内容理解、对抗攻击与对抗防御等「AI核心算法」
关注:决策智能与机器学习,深耕AI脱水干货 报道 | 腾讯AI实验室 计算机视觉领域三大顶会之一的 ECCV(欧洲计算机视觉会议)今年于 8 月 23-28 日举办.受新冠肺炎疫情影响,今年的 EC ...
- Science Robotics 封面论文 | 绝影狗:陌生环境自适应“摸爬滚打”「AI核心算法」...
关注:耕智能,深耕AI脱水干货 作者:Chuanyu Yang 来源:机器人大讲堂 转载请联系作者 近日上线的ScienceRobotics杂志发表了英国爱丁堡大学机器人团队与浙江大学控制学院机器人团 ...
- 【今日CV 视觉论文速览】15 Nov 2018
今日CS.CV论文速览 Thu, 15 Nov 2018 Totally 15 papers Daily Computer Vision Papers [1] Title: No-Frills Hum ...
- 【AI视野·今日CV 计算机视觉论文速览 第188期】Wed, 23 Dec 2020
AI视野·今日CS.CV 计算机视觉论文速览 Fri, 23 Dec 2020
- 【AI视野·今日CV 计算机视觉论文速览 第183期】28 Apr 2020
AI视野·今日CS.CV 计算机视觉论文速览 28 Apr 2020
- 【AI视野·今日CV 计算机视觉论文速览 第180期】Wed, 26 Feb 2020
AI视野·今日CS.CV 计算机视觉论文速览 Wed, 26 Feb 2020 Totally handcrafted papers
- 【AI视野·今日CV 计算机视觉论文速览 第179期】Tue, 25 Feb 2020
AI视野·今日CS.CV 计算机视觉论文速览 Tue, 25 Feb 2020 Totally handcrafted papers
- 【AI视野·今日CV 计算机视觉论文速览 第174期】Tue, 7 Jan 2020
AI视野·今日CS.CV 计算机视觉论文速览 Tue, 7 Jan 2020 Totally 57 papers
- 【AI视野·今日CV 计算机视觉论文速览 第182期】Fri, 10 Apr 2020
AI视野·今日CS.CV 计算机视觉论文速览 Fri, 10-11 Apr 2020 Totally 55 papers
最新文章
- 赵雅智_android多线程下载带进度条
- linux日志生成速率统计,Linux学习29-awk提取log日志信息,统计日志里面ip访问次数排序...
- 阿里云+wordpress搭建个人博客网站【小白专用的图文教程】
- 【shell】docker images 拿到ID
- 通过蜜罐技术获取攻击者手机号、微信号【网络安全】
- MFC COMBO-BOX最详细教程
- shell获取某一行中指定字符后的内容
- java ognl使用_java框架篇---struts之OGNL详解
- openmp 第一次运行时间比较长_Android App 启动时间优化
- 跟兄弟连学PHP PDF 分享
- Git版本管理及使用规范
- Linux如何增加SSH端口号
- 十折交叉验证 matlab,Matlab 十折交叉验证
- c语言编写函数isprime(int a),用来判断自变量a是否为素数,若是素数,函数返回1,否则返回0。
- Foxmail与QQ邮箱关联创建新账户
- 更好的Google Glass:棱镜变长、Intel Atom处理器和外置电池组
- android sim卡应用程序,Android双SIM卡API
- 电影9 10大经典电影
- 解决input输入的是空格问题
- curator分布式锁
热门文章
- 【SoC FPGA学习】十、SoC FPGA 开发板的 FPGA 配置数据下载和固化
- python 模块相互import
- @SpringBootTest Canot resolve symbol ‘SpringBootTest‘问题解决
- 程序员常用资源工具集合(建议收藏)
- 离职前需要注意的事情?
- 如何爬取猫眼网电影票房数据
- 新浪微博 redis mysql_新浪微博:史上最大的Redis集群
- 近年来的Java面试题汇总。帮你圆大厂梦。
- 再轰冯导,和科研人员比你只是个奢靡的戏子
- 经典算法题(中级)-----自定义函数之字符类型统计