全新思路!阿里达摩院将Transformer引入在线行为检测!ICCV2021
点上方计算机视觉联盟获取更多干货
仅作学术分享,不代表本公众号立场,侵权联系删除
转载于:Sophia知乎
https://zhuanlan.zhihu.com/p/410187732
985人工智能博士笔记推荐
周志华《机器学习》手推笔记正式开源!附pdf下载链接,Github2500星!
本文是阿里达摩院在ICCV2021发表的一篇高质量OadTR框架论文。文章引入Transformer用于在线行为检测(Online Action Detection),作者及团队解决的是在线行为检测任务,该任务旨在对于输入的在线视频流,识别出当前正在发生的行为类型(包括行为和背景)
文章链接:arxiv.org/pdf/2106.11149
开源链接:github.com/wangxiang123
摘要:
当前的主流方法大部分都基于RNN(Recurrent Neural Network)来对时间依赖性进行建模,并取得了令人印象深刻的效果, 如Temporal recurrent networks (TRN) [1]和Information Discrimination Network (IDN) [2]等。然而,这种RNN-like的架构存在非并行性和梯度消失的问题。
因此,很难对其框架结构进行优化,因此可能导致性能不理想,同时计算效率也不高。为了进一步提高性能,我们需要设计一个新的高效且易于优化的框架。
为此,我们提出使用Transformers。Transformers具有强大的自注意模块,具有长程时序建模的能力,同时在自然语言处理领域和各种视觉任务中都取得了显著的成绩。并且已有的工作已经证明,Transformers具有比RNN架构更好的收敛性,并且Transformers也具有更高计算效率。
对比
算法流程
和其他方法对比结果
OadTR在HDD、TVSeries、THUMOS14三个数据集
一些可视化结果:
在现实生活中具有巨大的应用前景,如自动驾驶,视频监控,异常行为检测等领域, 这项任务受到了越来越多的关注
往期论文推荐:
高效新思路!实例分割算法!腾讯、华科出品!入选ICCV 2021!
超强总结!456篇参考文献!《计算机视觉对抗攻击与防御》综述!
最新变体Transformer!∞-former!DeepMind 出品!
最新综述!深度神经网络视觉识别!329篇文献!西安交大、清华等出品
超强YOLOP!CVPR 2022领域主席团队开源!全景感知多任务SOTA!
Fastformer:史上最强最快Transformer!清华、MSRA出品!
脑洞大开!油画渲染的新算法 Paint Transformer!ICCV2021 Oral!
首次!阿里达摩院将Pure Transformer 应用于目标重识别ReID!
ResNet超强变体CoTNet!一种新的Transformer计算机视觉模块!
新模型!Conformer!Transformer与CNN的超强融合!
ImageNet又被Long-Short Transformer 霸榜!
新想法!华科、清华、康奈尔联合提出“圆形卷积”!聚合方形和圆形优势
表现SOTA!DetCo算法:目标检测无监督对比学习
新模型SkipNet在ImageNet分类任务大放光彩!优化损失函数!
高效神器!小目标检测迎来曙光!SSPNet金字塔网络!川大出品
超强!MDETR:基于Transformer的端到端目标检测神器!开源!
优秀!一种巧妙组合算法YOLOX!旷视重磅开源!
新突破!Swin-UNet:基于纯 Transformer 结构的医学图像分割网络
-------------------
END
--------------------
我是王博Kings,985AI博士,华为云专家、CSDN博客专家(人工智能领域优质作者)。单个AI开源项目现在已经获得了2100+标星。现在在做AI相关内容,欢迎一起交流学习、生活各方面的问题,一起加油进步!
我们微信交流群涵盖以下方向(但并不局限于以下内容):人工智能,计算机视觉,自然语言处理,目标检测,语义分割,自动驾驶,GAN,强化学习,SLAM,人脸检测,最新算法,最新论文,OpenCV,TensorFlow,PyTorch,开源框架,学习方法...
这是我的私人微信,位置有限,一起进步!
王博的公众号,欢迎关注,干货多多
手推笔记:
思维导图 | “模型评估与选择” | “线性模型” | “决策树” | “神经网络” | 支持向量机(上) | 支持向量机(下) | 贝叶斯分类(上) | 贝叶斯分类(下) | 集成学习(上) | 集成学习(下) | 聚类 | 降维与度量学习 | 稀疏学习 | 计算学习理论 | 半监督学习 | 概率图模型 | 规则学习
增长见识:
博士毕业去高校难度大吗? | 研读论文有哪些经验之谈? | 聊聊跳槽这件事儿 | 聊聊互联网工资收入的组成 | 机器学习硕士、博士如何自救? | 聊聊Top2计算机博士2021年就业选择 | 非科班出身怎么转行计算机? | 有哪些相见恨晚的科研经验? | 经验 | 计算机专业科班出身如何提高自己编程能力? | 博士如何高效率阅读文献 | 有哪些越早知道越好的人生经验? |
全新思路!阿里达摩院将Transformer引入在线行为检测!ICCV2021相关推荐
- 首次!阿里达摩院将Pure Transformer 应用于目标重识别ReID!
点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:Sophia 知乎 https://zhuanlan.zhihu.com/p/401450756 AI博士笔记 ...
- 研究你为啥看着淘宝想剁手,阿里达摩院论文登上NeurIPS 2019
点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 乾明 编辑整理 量子位 报道 | 公众号 QbitAI 打开淘宝后,你为什么抑制不住 ...
- 阿里达摩院最新FEDformer,长程时序预测全面超越SOTA | ICML 2022
©作者 | Qingsong 单位 | 阿里达摩院决策职能实验室 论文标题: FEDformer: Frequency Enhanced Decomposed Transformer for Long ...
- 直接对梯度下手,阿里达摩院提出新型优化方法,一行代码即可替换现有优化器...
来源:机器之心 本文约3284字,建议阅读8分钟. 本文介绍阿里达摩院的研究者另辟蹊径,直接对梯度下手,提出全新的梯度中心化方法.只需一行代码即可嵌入现有的 DNN 优化器中,还可以直接对预训练模型进 ...
- 《预训练周刊》第7期:傅立叶图像变换器解析、阿里达摩院发布最大中文预训练语言模型PLUG
No.07 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第7期 ...
- 阿里达摩院再造AI抗疫技术:20秒判读CT影像,识别准确率达96%
2020-02-16 13:22:25 允中 发自 凹非寺 量子位 报道 | 公众号 QbitAI 又是达摩院. 阿里方面最新消息,达摩院联合阿里云针对新冠肺炎临床诊断研发了一套全新AI诊断技术: ...
- 重磅!阿里达摩院发布《2020十大科技趋势》
来源:雷锋网 2019年,是新兴科技发展史上的重要年份. 这一年,各大公司的AI.云计算.大数据走向下沉市场,空中博弈进入到地面作战,技术的商业化成为生意成败的重要考量.其间,产业与场景成为大漏斗,好 ...
- 阿里达摩院再造AI抗疫技术:20秒判读CT影像,识别准确率达96%,河南率先启用...
允中 发自 凹非寺 量子位 报道 | 公众号 QbitAI 又是达摩院. 阿里方面最新消息,达摩院联合阿里云针对新冠肺炎临床诊断研发了一套全新AI诊断技术: AI可以在20秒内准确地对新冠疑似案例C ...
- AAAI 2022 | 北大 阿里达摩院:基于对比学习的预训练语言模型剪枝压缩
近年来,预训练语言模型迅速发展,模型参数量也不断增加.为了提高模型效率,各种各样的模型压缩方法被提出,其中就包括模型剪枝. 然而,现有的模型剪枝方法大多只聚焦于保留任务相关知识,而忽略了任务无关的通用 ...
最新文章
- 莱芜长运公共交通有限公司简介
- vision画流程图的软件_产品流程图的定义,作用和画法
- python字符编码解码,文件编码解码。
- c语言case标号是连续的吗,在switch语句中,case后的标号只能是什么?_后端开发...
- windows下配置nginx+php环境
- python中全局变量有缩进吗_python有全局变量吗
- go web框架_干货分享:六个知名的Go语言web框架
- Java - Java Mail邮件开发(2)springboot +Java Mail + Html
- 初探机器学习之使用讯飞TTS服务实现在线语音合成
- 【VirtualBox虚拟机总是提示“0x00000000指令引用的0x00000000内存,该内存不能为written“错误的解决方法】
- 从第一代 iPhone 细数到 iPhone 12,iPhone 屏幕尺寸进化历程背后的 app 设计哲学
- 统信UOS系统安装详细教程(小白也能装系统啦~)
- 接口与继承系列教材 (十)- Java 内部类详解
- kaldi 学习笔记-三音素训练1(Decision Tree)
- 如何用蓝牙网关广播蓝牙数据
- K8s学习(二)——核心组件
- TIA博途SCL入门学习(二)常用基本控制语句用法和举例
- matlab编写多目标性能度量r、GD、Spacing、德尔塔
- 当前版本与卡刷包android_手机端提取Android 8.x及以上版本卡刷包中的system文件
- Markdown Flow 画流程图详解
热门文章
- r软件 image画出来的图是颠倒的_如何用Python抠图?试试scikitimage
- 台式计算机windows7系统怎么做,台式电脑怎么在线进行重装win7系统
- cesium坡度坡向分析_综合分析地理空间,科学规划乡村区域
- c++ linux 线程等待与唤醒_Linux驱动程序基石-POLL机制(附.视频)
- python有栈吗_Python栈实现
- android公网ip,android 获取公网ip 内网ip
- linux cp后文件变大,使用 rsync 复制大文件的一些误解 | Linux 中国
- php 数组处理函数,PHP数组处理函数举例
- 电脑上的linux是什么文件夹,linux删除文件夹,详细教您电脑的linux怎么样删除文件夹...
- python软件打不开_ubuntu装python3.1.1之后出错,软件中心打不开,不能重装。尝试sudo apt-get -f install报error...