‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍点击左上方蓝字关注我们

01

「时空版」Transformer训练速度远超3D CNN,提速3倍!

Facebook AI推出了全新的视频理解架构TimeSformer,这也是第一个完全基于Transformer的视频架构。视频剪辑上限可达几分钟,远远超过当下最好的3D CNN,且成本更低。

TimeSformer即Time-Space Transformer,这是第一个完全基于Transformer的视频架构,近年来已经成为许多自然语言处理(NLP)应用程序的主要方法,包括机器翻译和通用语言理解。

论文链接:https://arxiv.org/pdf/2102.05095.pdf

TimeSformer 在几个难度系数比较高的动作识别基准上获得了最好的效果,包括 Kinetics-400动作识别数据集。此外,与现代3D 卷积神经网络(CNN)相比,TimeSformer 的训练速度提高了大约3倍,推理所需计算量不到原来的十分之一。这是支持需要实时或按需处理视频的应用程序的重要一步。

此外,TimeSformer具有可伸缩性,可以用来训练更长的视频剪辑中的更大模型。这使得人工智能系统可以理解视频中更复杂的人类行为,例如涉及多个原子步骤的活动(修理汽车,准备食物等)。许多需要理解复杂人类行为的人工智能应用程序都能从中获益。

TimeSformer 与先进的3D 卷积神经网络在 Kinetics-400(左)和 Kinetics-600(右)动作识别基准上的视频分类精度。TimeSformer在两个数据集上都实现了最高的准确度。

信息来源:新智元

02

实时风格迁移,移动端运行,人脸特效又有了新玩法

人脸风格迁移出现新玩法!捷克理工大学联合 Snap 公司创建了一个用于视频中人脸风格实时迁移的框架,既不需要大型数据集和冗长训练周期,更能够在移动端运行。

今年,人脸视频特效在全球又大火特火了一把。年初的「蚂蚁牙黑」(人脸唱歌),还有不久前让老照片动起来的特效,效果都十分惊艳。

风格迁移一直是图像领域的热门方向。那么在视频上做实时人脸画风迁移效果怎么样呢?

是这样的:

当然,视频画风迁移并不是什么新鲜技术了。但这项研究最大的特点在于:移动端、实时,由布拉格捷克理工大学和 Snap 公司的研究者联合完成。目前已经放出了完整论文,相关代码将于下月发布。

  • 项目地址:https://ondrejtexler.github.io/faceblit/

  • 论文地址:https://ondrejtexler.github.io/res/faceblit-paper.pdf

具体而言,研究者提出了一种基于实例的实时视频人脸风格迁移框架 FaceBlit,该框架通过语义上有意义的方式保留了风格的纹理细节,也就是说,用于描绘特定风格特征的笔画出现在目标图像的适当位置。

与以往风格迁移方法相比,该框架不仅保留了目标对象(target subject)的身份,而且不需要大型数据集和冗长训练周期即可实现实时运行。

为此,研究者修改了 Fišer 等人(2017 年)的人脸风格化 pipeline,这样快速生成一组指引通道(guiding channel),不仅可以保留了目标对象的身份,还兼容 Sýkora 等人(2019 年)的基于 patch 合成算法的速度更快变体。

得益于这些方法上的改进,研究者创建了首个即使在移动端,也可以将单个肖像的艺术风格实时迁移至目标视频中人脸的系统框架。

信息来源:机器之心

03

ONNX开发者大会即将召开,百度飞桨与LF AI & Data共同承办

北京时间3月25日上午8点,百度飞桨与LF AI & Data基金会共同承办的2021年ONNX开发者大会(ONNX Community Virtual Meetup 2021)即将重磅开启,面向全球开发者进行线上直播,无论是热衷钻研开源技术,还是探索AI应用落地的开发者们,都将从大会中获取干货与灵感。

本次ONNX开发者大会将由百度飞桨主持,由来自微软、英特尔等合作企业的嘉宾分享基于ONNX的部署、新应用场景等最新信息,以及SIG和WGs更新及应用。大会规格将在往届基础上再次升级,吸引超过80家品牌及近千位开发者参与。此次大会将在B站及CSDN的“飞桨PaddlePaddle”账号进行全球直播,观众可通过弹幕互动随时进入会议的分享讨论。

在飞桨框架2.0正式版发布之际,飞桨与LF&AI密切合作,积极投入到ONNX社区的开源建设之中。

来自百度飞桨的高级产品经理王运凯(Wranky Wang)将分享飞桨产品与ONNX的深入融合。X2Paddle可以将ONNX模型转为飞桨模型,既能丰富飞桨的模型库,也可以通过飞桨推理引擎Paddle Lite实现部署。Paddle2ONNX则实现了将飞桨生态的模型转为ONNX,进一步地,能够在Nvidia,Intel,Adlik等产品上实现部署,从而让飞桨模型部署在更广泛的硬件之上。

信息来源:飞桨PaddlePaddle

04

GitLab成立中国合资公司极狐,强调“独立运营”

还没等来GitHub,倒是GitLab先传来了正式进军中国市场的消息。

根据最新报道,这家全球第二大开源代码托管平台,现在已经与投资方红杉宽带和高成资本,合作成立了一家中国合资公司——极狐信息技术(湖北)有限公司

该公司目前已经完成首轮数亿元融资。

GitLab公司联合创始人兼CEO Sid Sijbrandij对此表示:

我们一直期待以适应中国企业需求的本地化方式,扩大GitLab开源软件在中国的使用和访问量。

通过与红杉宽带和高成资本的合作,极狐公司将在战略、技术、产品、定价和运营层面获得完整的自主权。

强调“独立运营”

那么具体是怎么个“本地化”法?

根据官方介绍,GitLab会与极狐公司签署授权协议,约定向极狐公司提供独家知识产权和品牌授权,保持源代码同步持续更新。

另外,极狐还会自主研发并独立运营GitLab CN开源代码库,推出GitLab中国发行版GitLab JH,“实现100%的国产化独立运营”。

此前,红杉宽带就曾经以外方提供技术、产品和品牌,红杉宽带提供资金和本地资源,本地管理层负责运营的模式,将印象笔记引入中国本土。

而根据天眼查信息,在股份比例分配上,GitLab占比为72.25%,红杉宽带占比18.75%,高成资本占比9%。

另外,此次出任GitLab中国公司掌门人的陈冉,亦是中国开源业界的资深专家。

他是DC/OS 中国社区创始人、开源布道师,还是Docker、Mesos、OpenStack、CF的中国社区组织者、技术专家。

陈冉还表示:极狐的目标是3到5年内在国内金融市场上市。

信息来源:量子位

05

这个拒绝内卷的AI狼火了!高智商却自暴自弃,不想抓羊只想躺

近日,一个狼吃羊的AI火了!在一个狼吃羊的AI智障游戏中,狼发现自己吃不到羊,直接选择了「自杀」。然而,狼选择撞石的原因竟是「自杀分数高」

那么,狼为啥会选择直接撞死呢?

傻狼选择「自杀」,只因人间不值得!

近日,微博上一位网友@二雨TR最近发文称,听我老师给我讲他搞游戏ai的事情笑死我了。

在这个项目中,研究人员给设定了狼吃羊游戏的基本原则是,狼在20秒内得分越高越好,而羊在20秒内存活时间越长得分越高。

然而大多数情况下狼基本吃不到羊,而且在抓羊的过程中浪费的时间也被扣分,干脆就选择撞死了!

偶尔一次能吃到,虽然正分,但是不值得。

狼是打工人,羊是永远达不到的升职加薪

这只蠢狼已经在微博、知乎、豆瓣等各大平台上火出了圈。

网友们从狼抓羊的身上看到了自己。

那只狼不就是现在的我么!

狼就是打工人…每秒扣的是青春和时间,羊是永远达不到的「升职、加薪、迎娶白富美、走上人生巅峰」,撞石头就是躺平摸鱼…

还有网友表示,「AI训练告诉你,为什么现在的年轻人都不愿意努力了」!

信息来源:新智元

飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,是中国首个开源开放、技术领先、功能完备的产业级深度学习平台,包括飞桨开源平台和飞桨企业版。飞桨开源平台包含核心框架、基础模型库、端到端开发套件与工具组件,持续开源核心能力,为产业、学术、科研创新提供基础底座。飞桨企业版基于飞桨开源平台,针对企业级需求增强了相应特性,包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。EasyDL主要面向中小企业,提供零门槛、预置丰富网络和模型、便捷高效的开发平台;BML是为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。

END

本周AI热点回顾:「时空版」Transformer训练速度远超3D CNN;拒绝内卷的AI狼火了!不想抓羊只想躺!...相关推荐

  1. 这个拒绝内卷的AI狼火了!高智商却自暴自弃,不想抓羊只想躺

      新智元报道   来源:B站等 编辑:Yaxin [新智元导读]近日,一个狼吃羊的AI火了!在一个狼吃羊的AI智障游戏中,狼发现自己吃不到羊,直接选择了「自杀」.然而,狼选择撞石的原因竟是「自杀分数 ...

  2. 本周AI热点回顾:百度自动驾驶估值400亿美金;新型嵌入式无电容DRAM为AI而生...

    ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍点击左上方蓝字关注我们 01 全球无人车头部三强格局明确,百度自动驾驶估值400亿美金 财报业绩超预期,盘后股价上涨3.75%,自动驾驶业务越来越被看好-- 这就是 ...

  3. 本周AI热点回顾:意念打字登Nature封面,准确率超99%;前馈网络+线性交互层=残差MLP,纯MLP图像分类架构入场...

    ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍点击左上方蓝字关注我们 01 意念打字登Nature封面!每分钟写90个字符,准确率超99%,网友:我打的都比它慢 万万没想到,脑机接口这么快就有了重大突破!甚至还 ...

  4. 【拒绝内卷】狼吃羊的AI奖励机制不合理: 内卷,如何解决?

    深度强化学习实验室 官网:http://www.neurondance.com/ 论坛:http://deeprl.neurondance.com/ 本文转载自:Ai科技评论 作者 | 耳洞打三金 大 ...

  5. 27亿参数的「野生版」GPT-3开源,GitHub项目2.9K Star量

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 OpenAI 著名的语言模型 GPT-3 可以懂数学.翻译文字,还能写论文拿到及格成绩 ...

  6. 最新成果!超越AlphaZero!DeepMind让AI制霸「元宇宙」

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:新智元 AI博士笔记系列推荐 周志华<机器学习>手推笔记正式开源!可打印版本附pdf下载链接 Al ...

  7. [免费专栏] Android安全之Android so文件分析「详细版」

    也许每个人出生的时候都以为这世界都是为他一个人而存在的,当他发现自己错的时候,他便开始长大 少走了弯路,也就错过了风景,无论如何,感谢经历 Android安全付费专栏长期更新,本篇最新内容请前往: [ ...

  8. AI创业公司最佳「开发工具」指南火了,还发现了个可挑战Jupyter的「杀手」

    白交 发自 凹非寺  量子位 报道 | 公众号 QbitAI 一份AI创业公司最佳「开发工具」指南,火了. Reddit上,一份来自41家创业公司的调研答案,热度已达471. 除了比较流行的开发环境J ...

  9. 普通话测试第四题评分标准_2017年普通话水平测试评分细则「详细版」

    2017年普通话水平测试评分细则「详细版」 普通话是现代汉语的标准语.由国家语言文字工作委员会和国家教育委员会.广播电影电视部颁布的,<普通话水平测试等级标准(试行)>.以下是小编整理的2 ...

最新文章

  1. springboot+mybatis ,出现多于的参数导致查询数据缺少
  2. 脚本编程语言python语言-python语言是脚本语言吗
  3. UA MATH565C 随机微分方程V Markov Family的特征函数
  4. javascript创建多行字符串的方法(转)
  5. Java 字符串拼接 StringBuilder() StringBuffer
  6. Ubuntu15.04 64位安装Theano(已经测试可执行)
  7. Matlab与线性代数
  8. Hbase二级索引+CDH+Lily
  9. Java读写CSV格式文件(opencsv)
  10. 搭建了Pycharm对话平台
  11. eclipse git 取远程代码_IDEA中的Git操作,看这一篇就够了!
  12. MYSQL连接出现Auth,使用navicat连接 mysql时出现client does not support auth...upgrading Mysql Client...
  13. 用友U8审批流相关开发
  14. shell 004 __小斌文档 |数组+函数
  15. umi封装request方法 ts版
  16. 电脑取消撤销快捷键是什么_都知道“撤消”快捷键是Ctrl Z,那“反撤消”是什么呢?...
  17. MVC框架实现用户的登录注册功能
  18. ubuntu双系统引导梅花_Win10+ubuntu 双系统安装顺顺利利!
  19. DiabloFX展示模板 joomla多用途二手房公司企业博客商业主题
  20. 不带电脑看-吃货联盟集合

热门文章

  1. 详解搜索引擎的高级搜索语法指令
  2. Class not found so assuming code is running on a pre-Java 9 JVM
  3. SQL Server事物日志
  4. 第一行代码-第二版(郭霖著)笔记十一(Material Design)
  5. Fiddler功能讲解
  6. android查看显存大小,Shadow Size Computation 阴影大小计算
  7. 掌握Android图像显示原理(中)
  8. Voldemort的RoutedStore
  9. composer更换国内镜像地址
  10. 卡方独立性检验|卡方拟合性检验