整理 | 夕颜

来源 | CSDN(ID:CSDNnews)

昨天,一条“100 年前北京晚清的影像”喜提热搜,博主用 AI 技术修复了一段 10 多分钟的古董视频,使得 100 多年前老旧的黑白影像变得更加清晰,甚至有了颜色。

 AI 还原100 年前晚清影像

这段时长 10 多分钟视频使用了 AI 修复技术,评论中有人表示,隔着屏幕与画面中的人物对视,恍然间有种时空交错的感觉,很神奇。对着这段视频仔细观察的笔者,其实也产生了这种恍惚的感觉。

除了被修复的珍贵影视资料本身,笔者更加关心的是修复影像背后使用的神奇 AI 修复技术。

在微博 Up 主的文案标明,修复影像的技术管线参考自开发人员,同时是一名 YouTuber 的 Denis Shiryae 上传的影像修复教程。

循着这个线索,笔者发现原来这位大神早就在 YouTube 上发布过一些关于 AI 修复影像的视频。比如这段用神经网络对 1906 年大地震前的旧金山影像进行修复的视频,解说中说到,他只做了一套神经网络工作流来做视频的修复与像素倍增,其中用到了 DAIN 进行帧内插,ESRGAN 在自定义数据集上进行帧升级,然后用 DeOdify 来做视频着色,这些算法都是公开的,感兴趣的话都可以搜索软件,然后搞事情。

另外,Denis 修复的一部 1896 年的黑白短片 The Arrival of a Train at Station 项目也非常有趣,同样也是使用公开的 AI 技术将其转换成了 4k 高清视频,并且可以以每秒 60 帧进行播放。结果虽然不完美,但同样让人惊艳。

可以看到,修复的结果并不十分完美。整个画面和动态中都存在一些特征性的“平滑”和奇怪的伪像,这都是在大量插帧时会出现的典型现象。但是对于大多数人(在大多数设备上)来说,这种效果还是像魔术一样神奇,修复后的画面中,人们的衣服和火车的细节清晰可见,画面流畅同步,可视距离变长。

有意思的是,这部电影上映时,因为人们从未见过一辆火车径直冲着观众冲过来的动态镜头,很多观众一度受惊被吓得跑出电影院,这部短片也被称为“电影的奠基神话”,流传为一段佳话。

 Google 的 DAIN 

和 Topaz Labs的 Gigapixel AI

言归正传,为了实现高清修复,Shiryaev 使用了两种神经网络:Google 的 DAIN(深度感知视频帧插值,Depth-Aware Video Frame Interpolation)和 Topaz Labs的 Gigapixel AI。其中,Gigapixel AI 用于将微弱分辨率的视频一直扩展到 4K,而 DAIN 用于创建和插入之前不存在的帧,从而将视频的 FPS 增加到 60。

首先来看 Gigapixel AI,随着图片放大,它可以对图片进行细节填充。具体的实现方法,是通过分析按比例缩小的大量图像,了解丢失的信息。经过训练,当图片放大时,Gigapixel AI 可以自动弥补图像损失的细节,让画质效果更佳。

这项技术也被打包放进了 Topaz Gigapixel AI 软件中,使用软件就可以对图像“无损”放大,亲测效果还不错。

第二个算法是由 Google 工程师团队和一些研究员开发的插帧算法 DAIN 添加的。

DAIN 也像 Gigapixel AI 一样可以填充细节,但却是插入整个图片而不是单个像素,从而将帧速率提高到每秒 60 帧。

当然,AI 使用现有的大量视频作为训练材料,通过评估前后帧以及镜头中的不同深度水平,以找出缺失的信息。

上图为 DAIN 的架构图,工作原理大致为给定两个时刻的输入帧,先估计光流和深度图,然后使用建议的深度感知流投影层生成中间流。

然后,模型基于光流和局部插值内核对输入帧、深度图和上下文特征进行扭曲,合成输出帧。

这种模型紧凑、高效且完全可微分。定量和定性的结果表明,DAIN 在各种数据集上均优于最新的帧插值方法。

       

DAIN 已经在 GitHub 上开源,感兴趣的同学可以详细研究一下:

https://github.com/baowenbo/DAIN

有一点需要说明,我们在此修复中看到的所有额外细节可能实际上并不是镜头中的真实内容,而是算法在经过大量类似照片和视频库中训练给出的最接近真相的预测。

原版短片是由 Lumière brothers 拍摄的,摄像机使用了 35mm 胶卷(这种胶卷还可以作为投影仪使用)。

另外还应该指出的是,和线上那些低分辨率的盗版电影相比,Shiryaev 使用的原始视频质量相对较高,这可能要归功于先前的修复技术。

不幸的是,源视频并没有提供任何有关制作方式的详细信息,但似乎已经用某种方法进行了数字化增强。

无论原版影片是否经过处理,修复后的新版本的分辨率和流畅度都有了明显的提高,这就够了,因为这为我们用 AI 引擎构建虚拟现实提供了很多灵感。

尽管人们对 Deepfake 的照片和视频忧虑重重,这门可以虚构从未存在场景的技术经常因为负面新闻出现在头条,但是类似的修复图像技术可以还原历史,带给人们的价值,显示出神经网络的积极作用。

总之,任何好用的技术本质上都是一把双刃剑,不能因噎废食,为了更好地使用这把利器,更多地需要从法律法规等途径进行约束,创造更好的环境,是不是这个理儿?

推荐阅读

  • CycleGan人脸转为漫画脸,牛掰的知识又增加了 | 附代码

  • 一次对语音技术的彻底批判

  • 360金融首席科学家张家兴:别指望AI Lab做成中台

  • 为什么说 C++ 太复杂?有必要这么复杂吗?| 原力计划

  • 关于Spring AOP,除了动态代理、CGLIB,你还知道什么?

  • 产业区块链:新基建中的底层技术基座,各行业资深人士应积极参与建设

  • 你点的每个“在看”,我都认真当成了AI

AI修复100年前晚清影像喜提热搜,这两大算法立功了相关推荐

  1. AI 修复 100 年前晚清影像喜提热搜,有穿越内味儿了!

    整理 | 夕颜 出品 | CSDN(ID:CSDNnews) 昨天,一条"100 年前北京晚清的影像"喜提热搜,博主用 AI 技术修复了一段 10 多分钟的古董视频,使得 100 ...

  2. “六成应用开发不需要程序员”喜提热搜背后,RPA 会抢饭碗吗?

    整理 | 伍杏玲 出品 | 程序人生(ID:coder_life) 近日,一则"六成应用开发不需要程序员"喜提热搜,据 Gartner 数据显示,到 2024 年,全球约有 65% ...

  3. 北京小伙用AI修复100年前的京城老视频爆火网络,作者:7天完成,颜色还有不足...

    来源:大数据文摘 本文长度为4300字,建议阅读8分钟. 下次给AI看看清宫剧学习. 标签:机器学习 昨天,一个"修复老北京街道"的视频刷屏全网.一段由加拿大摄影师在100年前的北 ...

  4. 小伙用智能 AI 修复100 年前京城的老视频

    简介: 近日,一个"修复老北京街道"的视频刷屏全网.一段由加拿大摄影师在 100 年前的北京被 AI 修复后,活灵活现地展现在人们面前,一百年前人们打招呼的方式.使用的乐器.交通工 ...

  5. 秦岚微博之夜喜提热搜第一 优雅公主裙演绎真人版辛德瑞拉

    近日,秦岚亮相新浪微博之夜.一袭冰蓝色抹胸蓬蓬裙,空气刘海搭配着中长发,微卷的发尾散落在雪白的香肩上,清新得像散发着薄荷味的公主.尤其是公主裙的样式非常梦幻和优雅,被网友称为真人版辛德瑞拉. 当晚,秦 ...

  6. 修复100年前北京晚清影像,和马斯克谈两亿的项目,AI技术的底层逻辑是什么?...

    这几天,一段用AI修复"100年前的北京晚清影像"视频彻底火了,截至目前,这段视频在微博上的播放量高达1948万,在B站的播放量则超过了80万.许多网友留言称视频的逼·真效果打破了 ...

  7. 登顶Nature | DeepMind用AI首次实现数学领域重大进展,助力科学家证实两大猜想

    来源:AI科技评论 作者:杏花.莓酊 编辑:琰琰 数论是人类知识最古老的一个分支,然而它最深奥的秘密与其最平凡的真理是密切相连的.数学原理极易从事实中归纳出来,但证明却隐藏的极深.可以说数学,是一切科 ...

  8. 腾讯AI Lab两大算法刷新人脸识别与检测纪录,秉承「基础研究+落地应用」之路

    2017-12-22 10:07:03 雷锋网 AI 科技评论按:12 月 18 日,腾讯 AI Lab 宣布,其研发的人脸算法 Face R-FCN 和 Face CNN 分别在人脸检测平台 WID ...

  9. 绝代芳华!AI复原90年前梅兰芳:眉目传情,栩栩如生

    点击 机器学习算法与Python学习 ,选择加星标 精彩内容不迷路   新智元报道   来源:b站 近日,一段昆曲片段被AI修复还原. 原片来自1930年梅兰芳赴美演出昆曲<刺虎>.博主正 ...

最新文章

  1. 一般计算 【2007】三3 C++版
  2. linux没有mysql.server,[linux]centos7下解决yum install mysql-server没有可用包
  3. 操作篇 了解学习NAT实验(关于静态NAT、动态NAT、EasyIP、端口映射的配置方法))
  4. 机器视觉--入门小结
  5. 【LetCode算法修炼】Two Sum
  6. 类和对象之Scala程序
  7. 使用PDF Converter OCR for Mac如何区分扫描的PDF和普通文件?
  8. Java小题,通过JNI调用本地C++共享库中的对应方法实现杨辉三角的绘制
  9. google hacking搜索语法总结
  10. windows清理_一个Windows系统下好用的内存清理工具
  11. 00 SQL课程简介
  12. docker安装oracle
  13. TC气象数据下载包括NCEP的FNL(python脚本)、STI的Best_track、NOAA的SST
  14. Linux - 部署node项目
  15. [转载] python实现语义分割_使用Keras实现深度学习中的一些语义分割模型
  16. MineCraft - 创世神插件
  17. Nessus8.15安装不限IP(win10)
  18. 扁平化设计与思维导图
  19. IPv6下的DHCPv6
  20. 微信app支付和微信网页支付 java

热门文章

  1. stylus使用文档总结:内置方法+参数+条件+迭代+导入+继承
  2. linux 保留内核中sas驱动的加载导致crash问题
  3. docker的网络架构配置
  4. MSN 无法登录 错误代码 8007007e
  5. 码云新建仓库,与本地仓库关联
  6. error C2065: “M_PI”: 未声明的标识符
  7. 【天命奇御】成就进度62/71的通关攻略(1·开篇前言)
  8. 转载:HBuilder常用快捷键
  9. codeforces round 421 div2 补题 CF 820 A-E
  10. 【杂项】SVN服务器的本地搭建和使用