魔法变现实,酷炫又实用。

还记得两年前,Zach King(男巫)的爆红魔术吗?

不仅从纸直接蹦出一个手机,还直接扔进了电脑里形成虚拟的天猫页面。

现在,不用去羡慕男巫了,人人都可以把身边的东西“扔到”电脑里,而且一部手机就能搞定!

这就是来自34岁法国设计师Cyril Diagne的最新AR黑科技——AR Cut & Paste,将身边的事物“一键”复制粘贴到电脑上,整个完成时间不到10s。

比Ctrl+C和Ctrl+V还要爽快!

比如,拿手机扫一扫书上的模型图片,再把手机对准电脑屏幕,模型瞬间就复制到了电脑。

书上的人物也不在话下。

就有网友说道:连这个黑发小哥的头发都能识别出来,太神奇了。

当然,手写的笔记,也可以复制粘贴到电脑中。

他在Github上分享了他的AR新技术,已经狂揽7K颗小星星;而且在Reddit上分享不到14小时,就获得了近4K的点赞量。

即使Cyril表示目前仅仅能在Photoshop中实现,但未来——肯定会有更多不同的输出方式。

只是现在,这项AR黑科技——魔法一样的新技术,只要你想,也能复刻。

简单四步,开启“复制粘贴”新世界

小哥非常热心地在GitHub中,描述了AR Cut & Paste的“上手指南”。

首先要强调的是,这是一个研究原型,而不是针对消费者或者Photoshop用户的工具。

AR Cut & Paste原型包含3个独立的模块。

移动应用 (The mobile app)

可以查看GitHub中/app文件夹,了解如何将App部署到手机中。

本地服务器 (The local server)

手机APP与Photoshop的接口。

使用屏幕点(screenpoint)找到摄像机在屏幕上指向的位置。

可查看/server文件夹,了解关于本地服务器的配置说明。

目标检测 / 背景移除服务 (The object detection / background removal service)

目前,显著性检测和背景移除,是委托给一个外部服务来完成。

如果直接在移动应用中使用类似DeepLap这样的技术会简单很多。但这还没有在这个repo中实现。

第一步:配置Photoshop

在Photoshop软件首选项 (Preferences)中,找到增效工具 (Plug-ins)。

点击启用远程连接 (Remote Connection),并设置密码。

这里需要确保一点,PS文档中的设置要与server/src/ps.py中的设置一致,否则只会粘贴一个空层。

此外,文档需要一些背景,如果只是白色背景,SIFT可能没有足够能力来做一个正确的匹配。

第二步:设置外部显著性目标检测服务

如上所述,目前,必须使用BASNet-HTTP封装器(需要CUDA GPU)作为外部HTTP服务,部署BASNet模型。

将需要部署的服务URL来配置本地服务器。如果在本地服务的同一台计算机上运行BASNet,请确保配置不同的端口。

第三步:配置并运行本地服务器

这一步的详细文档,在GitHub项目中的/server文件夹中,包含“安装”和“运行”两个步骤。

安装代码如下:

virtualenv -p python3.7 venv
source venv/bin/activate
pip install -r requirements.txt

运行代码如下:

python src/main.py \—basnet_service_ip=”http://X.X.X.X“ \—basnet_service_host=”basnet-http.default.example.com” \—photoshop_password 123456

其中,BASNET_SERVICE_HOST是可选的,只有在使用Knative / Cloud Run等入口网关在平台上部署服务时才需要。

以及,用Photoshop远程连接密码替换123456。

第四步:配置并运行移动App

安装代码如下:

npm install

然后更新component/Server.tsx中的IP地址,使其指向运行本地服务器的计算机IP:

3: const URL = “http://192.168.1.29:8080“;

运行代码如下:

npm start

OK!开启“复制粘贴”新世界,就是这么简单!

但如果你希望“知其然更知其所以然”,别眨眼,接着往下看。

如何做到隔空「复制粘贴」?

这个神奇的AR黑科技背后的主要技术,刚开始采用的是一个叫做BASNet的显著目标检测方法。

这篇研究入围了CVPR 2019,而且论文一作还是位华人小哥哥——秦雪彬,已经于今年2月在加拿大阿尔伯塔大学拿到了博士学位,硕士就读于北京大学。


BASNet的核心框架如下图所示,主要由2个模块组成:

第一个模块是预测模块,这是一个类似于U-Net的密集监督的Encoder-Decoder网络,主要功能是从输入图像中学习预测saliency map。

第二个模块是多尺度残差细化模块(RRM),主要功能是通过学习残差来细化预测模块得到的Saliency map,与groun-truth之间的残差,从而细化出预测模块的Saliency map。

而最近,这位设计师小哥哥在此基础上,针对背景移除任务,采用了更新的方法。

同样是来自秦雪彬团队,被Pattern Recognition 2020接收,这个方法叫做U2-Net,其框架如下图所示:

还与其它20个SOTA方法分别做了定量和定性比较实验,在结果上都取得了不错的结果。


在下面的定性实验中,也可以比较明显的看到,该方法所提取出来的目标,更加细粒度和精确。

那么,北大校友的新方法,又是如何被法国设计师Cyril Diagne搞成黑科技应用的?

兼职写代码的法国设计师

原因无他,Cyril Diagne就是这样一个懂程序、搞设计,关注前沿研究进展的艺术家呀。

如果你关注他的社交动态,也都是天马行空的。

是那种从“诗词歌赋”到“人生哲学”,从“服装设计”到AR黑科技的妙人。

Cyril Diagne,现居法国巴黎,除了设计师,程序员,还是洛桑艺术州立大学(ECAL)媒体于交互设计系的教授及主管。

2008年从巴黎Les Gobelins学校毕业以后,跟5位同学创立了艺术机构,致力于实现科技与艺术之间的创意交互,也奠定了他以后的艺术生涯,注定与科技密不可分。

2015年起,Cyril加入了谷歌文化驻巴黎的实验室。

与此同时,他还不断的在Gitbub上分享他的新成果。此前,他就曾在Github上发布了一些实用的小工具。

比如,一个可在Instagram页面的照片上添加3D效果的chrome扩展程序。

在Web浏览器上直接用AR涂鸦你的脸。

输入图像转3D照片。

总之,想法多、经历丰富,还懂技术和审美……

所以现在搞出AR复制这样的奇妙应用,打开一扇新大门,也让一众网友服服气气。

也算是把北大校友小哥的牛X研究,推到了更牛X的产品应用入口。

虽然还只是牛刀小试,但前景却妥妥无限可能。

你觉得这项黑科技,还能怎么用?怎么玩?请留言评论吧。

手机扫一扫,现实物体隔空「复制粘贴」进电脑!北大校友的AI新研究,现在变成AR酷炫应用相关推荐

  1. 手机扫一扫,现实物体隔空「复制粘贴」进电脑!北大校友的AI新研究,现在变成AR酷炫应用...

    十三  白交 发自 凹非寺 量子位 报道 | 公众号 QbitAI 魔法变现实,酷炫又实用. 还记得两年前,Zach King(男巫)的爆红魔术吗? 不仅从纸直接蹦出一个手机,还直接扔进了电脑里形成虚 ...

  2. 电脑复制粘贴_手机扫一扫,现实物体隔空复制粘贴进电脑!北大校友的AI新研究,现在变成AR酷炫应用...

    本文经AI新媒体量子位(ID:QbitAI)授权转载,转载请联系出处 十三  白交 发自 凹非寺 魔法变现实,酷炫又实用. 还记得两年前,Zach King(男巫)的爆红魔术吗? 不仅从纸直接蹦出一个 ...

  3. 手机无线充电已不新鲜 “隔空充电”了解一下!

    近日,据媒体报道, 同多数大型零售商一样,美国沃尔玛百货公司正在计划用小型电子屏幕取代货架上的纸质标签,这样就能快速.低成本地更改价格并进行促销.但从纸片到屏幕的转换又面临一个问题--屏幕需要电力.目 ...

  4. vb.net如何查询电脑麦克风收到声音_EMUI 10.1 跨屏协同实测:这一次把你的手机「搬」进电脑...

    智能手机发展到现在,我们越来越需要手机与其他设备进行互联互通.电脑是我们办公最常用的工具,手机则是生活必需设备,这两者的协同需求,自然也就成为了大多数用户的痛点. Apple 用隔空投送.接力.随航等 ...

  5. 干扰网络信号的app_手机信号屏蔽软件?告诉你一个「真实有效」的屏蔽信号方法...

    屏蔽手机信号就是通过某种利用某种设备或是某种方法使手机信号暂时消失或减弱的一种行为,多用于教育部门考试.国家机密机关以及机密项目的保密工作中.近年来随着手机等移动终端的日益普及,家庭使用屏蔽设备对无线 ...

  6. 手机在线抓娃娃:600亿的「直播+物联网」爆发市场,会有你的份吗?

    作者:水度力子 全文共 4777 字 1 图,阅读需要 10 分钟 ---- / BEGIN / ---- 2016年,直播的爆发让资本和市场坐不住,这一年诞生了300亿的市场蛋糕,一时间上演&quo ...

  7. 手机扫一扫就能“隔空移物”?AR炫酷新玩法,快来解锁新技能吧!

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 转载自:量子位 魔法变现实,酷炫又实用. 还记得两年前,Zach King(男巫) ...

  8. 打破虚拟边界的视频交互新方式,AR隔空书写的应用理念和探索实践

    AR隔空书写演示 随着技术的发展和超视频化的时代驱动,交互的形式日渐丰富.从屏幕点触,到语音交互,人脸.指纹.声纹,再到近年流行的AR和VR--人类早在语言出现之前便习惯使用肢体和手势这种近乎本能的沟 ...

  9. 隔空手势操作、智能护眼模式——详解优酷最新交互技术

    目前,人脸和图像识别的相关技术已经广泛投入到商业应用中,比如以 FaceU 为代表的视频拍摄工具类 APP,以及各种直播类 APP 中都有基于脸部的动态贴纸特效功能.此外各大硬件厂商也在设备的系统层面 ...

最新文章

  1. 监控haproxy的脚本
  2. Apache发布TomEE 7.1,支持Java 8和MicroProfile 1.2
  3. php 之 post json 数据
  4. machine learning (2)-linear regression with one variable
  5. ORA-12170:TNS:连接超时
  6. [Java基础]抽象类和接口的区别
  7. python-object-twoxml-html_1
  8. ES6函数相关包含箭头函数
  9. 图解TCPIP-TCP IP
  10. 解决jQgrid 设置列宽度自动调整时, 出现滚动条问题.
  11. matlab兔子繁殖问题,斐波那契数列在《疯狂动物城》兔子繁衍中的应用
  12. 2016.09.03【初中部 NOIP提高组 】模拟赛A总结
  13. Centos修改yum源为阿里源
  14. 天勤计算机考研高分笔记(一)绪论1数据结构
  15. 数据库日志采集系统方案设计
  16. 虚拟局域网+思科交换机基础配置学习有图简单易懂.
  17. Unity二维码生成与识别
  18. 企业纳税证明(社保完税证明)如何导出
  19. 打开word文档提示文件未找到_Word格式转换大全!三分钟把100份Word文档转为PDF、PPT、JPG文件...
  20. 2021年中国物流仓储系统集成商竞争力排行TOP20

热门文章

  1. XGBoost学习(五):参数调优
  2. Codeforces H. Ancient Wisdom
  3. 02-scrapy项目的创建基本使用
  4. Scrapy + 案例
  5. 复旦非全日制研究生计算机,2018年复旦大学信息科学与工程学院非全日制招生计划...
  6. 【Python小知识】字符串前加r、u、b、f是什么意思?
  7. Android开发介绍(基于Android Studio软件)
  8. db2 查看用户权限 详细了解DB2
  9. matlab 求信噪比
  10. 电机绕组I-pin、Hair-pin、X-pin、S-winding的区别