来源:机器之心

本文约1700字,建议阅读7分钟。

“大谷的游戏创作小屋”又用AI修复了一段老北京影像,这次还带时代原声……

剃头挑子、街边地摊、京韵大鼓,多数人可能只在电影、电视剧中看过老北京的这些景象。

但早在 90 年前,就有人将这些场景都拍了下来,而且完好地保存在美国南卡罗莱纳大学影像库。

影片中还收录了时代原声,原汁原味地记录了当时老北京的平民生活。

90 年后,有人将这些影片翻了出来,还用 AI 进行了修复,包括上色、提高分辨率等操作。

从这段影片中,我们能看到很多非常生活化的场景,比如小学生在学校外边买饭:

小伙子找个剃头摊剃头:

在观赏修复效果的同时,我们还能听到剃头师傅和小伙子一问一答:

“疼不疼?”

“不疼。我还不哭呢外带着。”

“嘿,你家什么地方住?”

“宝坻县”

“这头剃得好,不疼。剃不好,真疼!”“剃好了咱还找你去”

“你家几口人呐?”

“十口!”

“十口人?怎么那么些人呢?”

“人多,好。”

“一天挣二毛钱够挑费不?”

“一天挣两块!”

“哦,这还不错。”

这段场景被当时的拍摄者描述为 “不用付租金的理发师”。

剃完之后,小伙子还不忘给个好评,一边拍着脑瓜一边说:“剃挺好!” 那时候的人大概没有预料到,在 90 年后的今天,现代人都忙着生发、植发、戴假发……

希望坐在电脑前的你变强变秃后也能保持这份心态。

剃完了头逛逛街吧,看看 90 年前的首都地摊长什么样:

可以看到,90 年前的北京街头也是人头攒动,有卖衣服的、卖(遛)鸟的、卖各种小商品的,其热闹程度似乎不亚于疫情前的王府井。

除了这些,街头还有一些老艺人,向我们呈现百年前的京韵大鼓:

看到这里,你或许已经猜到了这段视频的修复者,他就是前段时间很火的 B 站 up 主 “大谷”。

就在不久前,大谷在他的 B 站账号“大谷的游戏创作小屋” 上发布了第一个老北京修复影片 。

截止目前,该视频的累计播放量已经达到 200 多万,还得到了央视等权威媒体的报道。

这次的修复影像由“大谷的游戏创作小屋”和央视新闻联合发布。原视频出处为南卡罗莱纳大学影像库馆藏胶片,音效也不是后期配音,全部为时代原声。

看完之后,很多人才发现,一百年前的北京市民和现在长得一模一样,口音也如出一辙:“还在想回去要咋交流,原来一样的哈哈哈”

还有人评价说,“剃头的俩人像在说相声”。

让我们一起通过视频感受一下:

这次修复用了什么技术?

在第一期的老北京影像修复过程中,UP 主借鉴了海外 YouTube 博主 Denis Shiryae 的影像修复教程,包括上海交大 Bao Wenbo 等人提出的 DAIN 插帧技术(参见论文《Depth-Aware Video Frame Interpolation》)。

这一次,UP 主特别提到,除了上述修复技术,自己还用到了一种新技术:DeepRemaster。

论文地址:

http://iizuka.cs.tsukuba.ac.jp/projects/remastering/en/index.html

这项技术由日本筑波大学和早稻田大学的两位研究者合作提出,论文被计算机图形学顶会 SIGGRAPH Asia 2019 收录。

与近年来使用递归模型处理视频的方法不同,该方法对老旧影像的修复是基于全卷积网络实现的。

老旧影片的修复包含多项步骤,比如超分辨率、噪声消除和对比度增强,旨在让已经老化的影片介质恢复到原始状态。

当然,由于特定时代的技术限制,许多老旧影片要么是黑白影像,要么色彩呈现质量较低,因此在修复中也常常需要着色。

在这项研究中,研究者提出了一个单一框架,以半交互的方式处理所有重制任务。该框架基于带有注意力机制的时间卷积神经网络。

他们提出的 source-reference 注意力允许模型处理任意数量的彩色参考图像(reference color images),在不需要分割的情况下给长视频着色,同时保持时间一致性。

与之前的方法相比,该方法的性能随着视频长度和彩色参考图像数量的增长而增长。

DeepRemaster 的网络架构如下:

输入一系列的黑白图像,通过预处理网络修复,修复的结果作为最终输出视频的亮度通道。

然后,source-reference 网络将预处理网络的输出和任意数目的彩色参考图像结合,产生视频的最终色度通道。

在着色过程中,研究者使用了 source-reference 注意力,让模型依照彩色参考图像中相似区域的颜色对视频进行着色。模型输出部分就是输入视频重制后的版本。

为了测试网络的效果,研究者对一些老旧影像进行了重制,并对该方法进行了定量和定性的深入评估。

在下图中,每个视频最上面一行的图像是着色的参考图像。实验结果表明,利用 source- reference 注意力,使用少量参考图像即可高效获得稳定、一致的数千帧图像。

《Right to Health, A (Part I)》重制结果, 使用了三张参考图像

《Freedom Highway (1956)》重制结果,使用了两张参考图像

《The Jungle Book(1967)》重制结果,使用了 41 张参考图像

与以往方法相比,用 DeepRemaster 重制的图像与真实世界的色彩更加一致:

在噪声消除方面,DeepRemaster 能够很好地处理各种类型的噪声,同时也能够锐化输入图像。

编辑:黄继彦

​AI技术重现的老北京原声影像又火了,网友:这口音太过真实相关推荐

  1. 本周AI热点回顾:AI技术重现的老北京原声影像又火了、百度ERNIE-ViL刷新5项任务记录、Transformer 3发布

    01 剃头挑子.京韵大鼓.摆地摊,AI技术重现的老北京原声影像又火了 剃头挑子.街边地摊.京韵大鼓,多数人可能只在电影.电视剧中看过老北京的这些景象.但早在 90 年前,就有人将这些场景都拍了下来,而 ...

  2. AI技术如何帮助研究人员重现历史的气味?

    欧盟已经向这支计划使用AI技术重现历史气息与嗅觉要素的研究团队提供280万欧元资助. 团队名为"Odeuropa",拥有来自多个学科的欧洲科学家及学者,具体涵盖历史.艺术史.计算语 ...

  3. 架构师实践日 · 6.30 杭州站 | 视觉 AI 技术如何助力行业提升?来西子湖畔与业内大咖面对面交流!

    伴随内容形式的变迁(文字 → 图片 → 视频),目前视觉 AI 技术不仅被应用到传统领域的升级革新中,还作为最重要的基础人工智能技术渗透到前沿技术的创新研究中. 七牛架构师实践日第二十九期将以视觉 A ...

  4. AI技术诠释全新智能,多方位优化样样贴心

    https://www.toutiao.com/a6690823365726306828/ AI技术诠释全新智能,多方位优化样样贴心 说到人工智能,不少人都是会想到如今随处可见的AI技术,最近,高通举 ...

  5. 百度吴甜做客央视《对话》:AI技术加持显著降低数字人生产成本

    1月29日,百度集团副总裁吴甜做客央视财经频道<对话>节目,畅谈虚拟数字人热度爆发背后的技术驱动力与日益广阔的应用场景.吴甜表示,计算机视觉.语音.自然语言处理.知识图谱等AI技术的整体提 ...

  6. 9277计算机音乐,抖音9277伴奏深七演唱的歌曲完整版分享_9277背景音乐mp3原声版...

    拍摄抖音视频的时候,大家都会在最后给视频添加上一段背景音乐,当然有的比较有才华的朋友就会直接使用自己的原声!视频火了之后,其他用户就会使用她的背景音乐来创作视频哦!最近就有一位你要我怎么说我怎么做你才 ...

  7. 还原时代原声,AI修复老北京再次火爆全网

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 凭借AI修复老北京影像火爆B站的Up主大谷兄,今天又来带我们玩穿越了! 这次是1929年的老北京,除了 ...

  8. 跟郎朗媳妇有得一拼的AI,只看弹琴动作,完美复现原声 | CVPR 2020

    金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 见识过「听歌识曲」,体验过看弹奏动作识曲吗? 就像最近的一档综艺节目中,郎朗比划了几个弹钢琴的动作,他媳妇(吉娜·爱丽丝)秒答:<柴可 ...

  9. CVPR 2020 | 跟郎朗媳妇有得一拼的AI,只看弹琴动作,完美复现原声

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要5分钟 Follow小博主,每天更新前沿干货 转载自:量子位 见识过「听歌识曲」,体验过看弹奏动作识曲吗? 就像最近的一档综艺节目中,郎朗比划 ...

最新文章

  1. c++标准库 及 命名空间std
  2. 开发日记-20190430 关键词 apt,aspectj,javassist
  3. 防止IE6出现BUG的十种常见解决方法
  4. kubernetes 1.7.2 安装 记录过程
  5. 【laravel54】查看版本号3种方式
  6. 一文读懂“新一代人工智能地图” ,让AI真正走进用户的生活
  7. 安装一直初始化_3D max 软件安装问题大全
  8. html怎么设计自己的网页,求一份自己设计的简单网页 HTML格式
  9. Node MemoryLeak
  10. Myeclipse学习总结(15)——Eclipse/MyEclipse中Maven项目常见问题解决汇总
  11. boss 计算机应用,Time Boss(电脑使用时间限制软件)官方版
  12. 中国 IPv6 网民活跃用户达 3.62 亿,但 App 支持与国外差距较大!
  13. iOS SDK 介绍及导入
  14. zoj1134 Strategic Game(DP/图论)
  15. 使用计算机打印汉子文档,电子科技大学《计算机应用基础(本科)》20春期末考试【标准答案】...
  16. CSGO服务器搭建教程
  17. Gucci“瑕疵”口红海报是一种对审“丑”广告的致敬吗?
  18. 重置CISCO 2911SEC/K9路由器密码
  19. java,jsp获取上一个访问页面URL
  20. C语言简单直观打印二叉树

热门文章

  1. jvm对象从新生代到老年代_深入理解jvm内存模型以及gc原理
  2. Python---20行代码爬取斗鱼平台房间数据(上)
  3. 崔瀚文:人工智能/机器人会不会成为人?取代人?
  4. Top100论文导读:深入理解卷积神经网络CNN(Part Ⅱ)
  5. 《互联网理财一册通》一一第12章 移动互联网“指尖上的理财”
  6. 解决 yum时 Error: Protected multilib versions报错
  7. [轉]fckeditor添加自定义按钮
  8. 《精通Unix下C语言编程与项目实践》目录
  9. 2021年南通各高中高考成绩查询,2021年南通所有高中排名一览表
  10. 云计算的认识和看法_【云计算】如何理解云计算才是正确的?