点上方计算机视觉联盟获取更多干货

仅作学术分享,不代表本公众号立场,侵权联系删除

转载于:Sophia知乎

https://zhuanlan.zhihu.com/p/410187732

985人工智能博士笔记推荐

周志华《机器学习》手推笔记正式开源!附pdf下载链接,Github2500星!

本文是阿里达摩院在ICCV2021发表的一篇高质量OadTR框架论文。文章引入Transformer用于在线行为检测(Online Action Detection),作者及团队解决的是在线行为检测任务,该任务旨在对于输入的在线视频流,识别出当前正在发生的行为类型(包括行为和背景)

文章链接:arxiv.org/pdf/2106.11149

开源链接:github.com/wangxiang123

摘要:

当前的主流方法大部分都基于RNN(Recurrent Neural Network)来对时间依赖性进行建模,并取得了令人印象深刻的效果, 如Temporal recurrent networks (TRN) [1]和Information Discrimination Network (IDN) [2]等。然而,这种RNN-like的架构存在非并行性和梯度消失的问题。

因此,很难对其框架结构进行优化,因此可能导致性能不理想,同时计算效率也不高。为了进一步提高性能,我们需要设计一个新的高效且易于优化的框架。

为此,我们提出使用Transformers。Transformers具有强大的自注意模块,具有长程时序建模的能力,同时在自然语言处理领域和各种视觉任务中都取得了显著的成绩。并且已有的工作已经证明,Transformers具有比RNN架构更好的收敛性,并且Transformers也具有更高计算效率。

对比

算法流程

和其他方法对比结果

OadTR在HDD、TVSeries、THUMOS14三个数据集

一些可视化结果:

在现实生活中具有巨大的应用前景,如自动驾驶,视频监控,异常行为检测等领域, 这项任务受到了越来越多的关注

往期论文推荐:

高效新思路!实例分割算法!腾讯、华科出品!入选ICCV 2021!

超强总结!456篇参考文献!《计算机视觉对抗攻击与防御》综述!

最新变体Transformer!∞-former!DeepMind 出品!

最新综述!深度神经网络视觉识别!329篇文献!西安交大、清华等出品

超强YOLOP!CVPR 2022领域主席团队开源!全景感知多任务SOTA!

Fastformer:史上最强最快Transformer!清华、MSRA出品!

脑洞大开!油画渲染的新算法 Paint Transformer!ICCV2021 Oral!

首次!阿里达摩院将Pure Transformer 应用于目标重识别ReID!

ResNet超强变体CoTNet!一种新的Transformer计算机视觉模块!

新模型!Conformer!Transformer与CNN的超强融合!

ImageNet又被Long-Short Transformer 霸榜!

新想法!华科、清华、康奈尔联合提出“圆形卷积”!聚合方形和圆形优势

表现SOTA!DetCo算法:目标检测无监督对比学习

新模型SkipNet在ImageNet分类任务大放光彩!优化损失函数!

高效神器!小目标检测迎来曙光!SSPNet金字塔网络!川大出品

超强!MDETR:基于Transformer的端到端目标检测神器!开源!

优秀!一种巧妙组合算法YOLOX!旷视重磅开源!

新突破!Swin-UNet:基于纯 Transformer 结构的医学图像分割网络

-------------------

END

--------------------

我是王博Kings,985AI博士,华为云专家、CSDN博客专家(人工智能领域优质作者)。单个AI开源项目现在已经获得了2100+标星。现在在做AI相关内容,欢迎一起交流学习、生活各方面的问题,一起加油进步!

我们微信交流群涵盖以下方向(但并不局限于以下内容):人工智能,计算机视觉,自然语言处理,目标检测,语义分割,自动驾驶,GAN,强化学习,SLAM,人脸检测,最新算法,最新论文,OpenCV,TensorFlow,PyTorch,开源框架,学习方法...

这是我的私人微信,位置有限,一起进步!

王博的公众号,欢迎关注,干货多多

手推笔记:

思维导图  |  “模型评估与选择”  |  “线性模型”  |  “决策树”  |  “神经网络”  |  支持向量机(上)  |  支持向量机(下)  |  贝叶斯分类(上)  |  贝叶斯分类(下)  |  集成学习(上)  |  集成学习(下)  |  聚类  |  降维与度量学习  |  稀疏学习  |  计算学习理论  |  半监督学习  |  概率图模型  |  规则学习

增长见识:

博士毕业去高校难度大吗?  |  研读论文有哪些经验之谈?  |  聊聊跳槽这件事儿  |  聊聊互联网工资收入的组成  |  机器学习硕士、博士如何自救?  |  聊聊Top2计算机博士2021年就业选择  |  非科班出身怎么转行计算机?  |  有哪些相见恨晚的科研经验?  |  经验 | 计算机专业科班出身如何提高自己编程能力?  |  博士如何高效率阅读文献  |  有哪些越早知道越好的人生经验?  |

其他学习笔记:

PyTorch张量Tensor  |  卷积神经网络CNN的架构  |  深度学习语义分割  |  深入理解Transformer  |  Scaled-YOLOv4!  |  PyTorch安装及入门  |  PyTorch神经网络箱  |  Numpy基础  |  10篇图像分类  |  CVPR 2020目标检测  |  神经网络的可视化解释  |  YOLOv4全文解读与翻译总结  |

点分享

点收藏

点点赞

点在看

全新思路!阿里达摩院将Transformer引入在线行为检测!ICCV2021相关推荐

  1. 首次!阿里达摩院将Pure Transformer 应用于目标重识别ReID!

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:Sophia 知乎 https://zhuanlan.zhihu.com/p/401450756 AI博士笔记 ...

  2. 研究你为啥看着淘宝想剁手,阿里达摩院论文登上NeurIPS 2019

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 乾明 编辑整理  量子位 报道 | 公众号 QbitAI 打开淘宝后,你为什么抑制不住 ...

  3. 阿里达摩院最新FEDformer,长程时序预测全面超越SOTA | ICML 2022

    ©作者 | Qingsong 单位 | 阿里达摩院决策职能实验室 论文标题: FEDformer: Frequency Enhanced Decomposed Transformer for Long ...

  4. 直接对梯度下手,阿里达摩院提出新型优化方法,一行代码即可替换现有优化器...

    来源:机器之心 本文约3284字,建议阅读8分钟. 本文介绍阿里达摩院的研究者另辟蹊径,直接对梯度下手,提出全新的梯度中心化方法.只需一行代码即可嵌入现有的 DNN 优化器中,还可以直接对预训练模型进 ...

  5. 《预训练周刊》第7期:傅立叶图像变换器解析、阿里达摩院发布最大中文预训练语言模型PLUG

    No.07 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 ‍‍‍超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第7期 ...

  6. 阿里达摩院再造AI抗疫技术:20秒判读CT影像,识别准确率达96%

    2020-02-16 13:22:25 允中 发自 凹非寺  量子位 报道 | 公众号 QbitAI 又是达摩院. 阿里方面最新消息,达摩院联合阿里云针对新冠肺炎临床诊断研发了一套全新AI诊断技术: ...

  7. 重磅!阿里达摩院发布《2020十大科技趋势》

    来源:雷锋网 2019年,是新兴科技发展史上的重要年份. 这一年,各大公司的AI.云计算.大数据走向下沉市场,空中博弈进入到地面作战,技术的商业化成为生意成败的重要考量.其间,产业与场景成为大漏斗,好 ...

  8. 阿里达摩院再造AI抗疫技术:20秒判读CT影像,识别准确率达96%,河南率先启用...

    允中 发自 凹非寺  量子位 报道 | 公众号 QbitAI 又是达摩院. 阿里方面最新消息,达摩院联合阿里云针对新冠肺炎临床诊断研发了一套全新AI诊断技术: AI可以在20秒内准确地对新冠疑似案例C ...

  9. AAAI 2022 | 北大 阿里达摩院:基于对比学习的预训练语言模型剪枝压缩

    近年来,预训练语言模型迅速发展,模型参数量也不断增加.为了提高模型效率,各种各样的模型压缩方法被提出,其中就包括模型剪枝. 然而,现有的模型剪枝方法大多只聚焦于保留任务相关知识,而忽略了任务无关的通用 ...

最新文章

  1. 莱芜长运公共交通有限公司简介
  2. vision画流程图的软件_产品流程图的定义,作用和画法
  3. python字符编码解码,文件编码解码。
  4. c语言case标号是连续的吗,在switch语句中,case后的标号只能是什么?_后端开发...
  5. windows下配置nginx+php环境
  6. python中全局变量有缩进吗_python有全局变量吗
  7. go web框架_干货分享:六个知名的Go语言web框架
  8. Java - Java Mail邮件开发(2)springboot +Java Mail + Html
  9. 初探机器学习之使用讯飞TTS服务实现在线语音合成
  10. 【VirtualBox虚拟机总是提示“0x00000000指令引用的0x00000000内存,该内存不能为written“错误的解决方法】
  11. 从第一代 iPhone 细数到 iPhone 12,iPhone 屏幕尺寸进化历程背后的 app 设计哲学
  12. 统信UOS系统安装详细教程(小白也能装系统啦~)
  13. 接口与继承系列教材 (十)- Java 内部类详解
  14. kaldi 学习笔记-三音素训练1(Decision Tree)
  15. 如何用蓝牙网关广播蓝牙数据
  16. K8s学习(二)——核心组件
  17. TIA博途SCL入门学习(二)常用基本控制语句用法和举例
  18. matlab编写多目标性能度量r、GD、Spacing、德尔塔
  19. 当前版本与卡刷包android_手机端提取Android 8.x及以上版本卡刷包中的system文件
  20. Markdown Flow 画流程图详解

热门文章

  1. r软件 image画出来的图是颠倒的_如何用Python抠图?试试scikitimage
  2. 台式计算机windows7系统怎么做,台式电脑怎么在线进行重装win7系统
  3. cesium坡度坡向分析_综合分析地理空间,科学规划乡村区域
  4. c++ linux 线程等待与唤醒_Linux驱动程序基石-POLL机制(附.视频)
  5. python有栈吗_Python栈实现
  6. android公网ip,android 获取公网ip 内网ip
  7. linux cp后文件变大,使用 rsync 复制大文件的一些误解 | Linux 中国
  8. php 数组处理函数,PHP数组处理函数举例
  9. 电脑上的linux是什么文件夹,linux删除文件夹,详细教您电脑的linux怎么样删除文件夹...
  10. python软件打不开_ubuntu装python3.1.1之后出错,软件中心打不开,不能重装。尝试sudo apt-get -f install报error...