Facebook AI的DETR:一种基于Transformer的目标检测方法
介绍
机器学习框架或库有时会更改该领域的格局。前不久,Facebook开源了一个这样的框架,DETR(DEtection TRansformer)
在本文中,我们将快速了解目标检测的概念,然后研究DETR及其带来的好处。
目标检测
在计算机视觉中,目标检测是一项将对象与背景区分开,并预测图像中存在的对象的位置和类别的任务。当前的深度学习方法试图将其作为分类问题或回归问题或综合两者的目标检测任务来解决。
例如,在RCNN算法中,从输入图像中识别出几个感兴趣的区域,然后将这些区域分类为对象或背景,最后使用回归模型为所标识的对象生成边界框。
另一方面,YOLO框架(只看一次)以不同的方式处理目标检测,它在单个实例中获取整个图像,并预测这些框的边界框坐标和类概率。
要了解有关目标检测的更多信息,请参阅以下文章:
基本目标检测算法的分步介绍
https://www.analyticsvidhya.com/blog/2018/10/a-step-by-step-introduction-to-the-basic-object-detection-algorithms-part-1/?utm_source=blog&utm_medium=facebook-detection-transformer-detr-a-transformer-based-object-detection-approach
使用流行的YOLO框架进行目标检测的实用指南
https://www.analyticsvidhya.com/blog/2018/12/practical-guide-object-detection-yolo-framewor-python/?utm_source=blog&utm_medium=facebook-detection-transformer-detr-a-transformer-based-object-detection-approach
Facebook AI引入DETR
如上一节所述,当前的深度学习算法以多步方式执行目标检测,这些算法几乎都会遇到误报问题。为简化起见,Facebook AI的研究人员提出了DETR,这是一种解决物体检测问题的创新高效方法。
论文:https://arxiv.org/pdf/2005.12872.pdf
开放源代码:https://github.com/facebookresearch/detr
Colab Notebook:https://colab.research.google.com/github/facebookresearch/detr/blob/colab/notebooks/detr_demo.ipynb
这个新模型非常简单,你无需安装任何库即可使用它。DETR借助基于Transformer的编码器-解码器体系结构将目标检测问题视为集合预测问题,所谓集合,是指边界框的集合。Transformer是在NLP领域中表现出色的新型深度学习模型。
本文作者对比了Faster R-CNN,并且在最流行的物体检测数据集之一COCO上评估了DETR
结果,DETR取得了可比的性能,更准确地说,DETR在大型物体上表现出明显更好的性能,但是它在小型物体上的效果不佳。我相信研究人员很快就会解决这个问题。
DETR的体系结构
实际上,整个DETR架构很容易理解。它包含三个主要组件:
CNN骨干网
编码器-解码器transformer
一个简单的前馈网络
首先,CNN骨干网将输入图像生成特征图。
然后,将CNN骨干网的输出转换为一维特征图,并将其作为输入传递到Transformer编码器,该编码器的输出是N个固定长度的嵌入(向量),其中N是模型假设的图像中的对象数。
Transformer解码器借助自身和编码器-解码器注意机制将这些嵌入解码为边界框坐标。
最后,前馈神经网络预测边界框的标准化中心坐标,高度和宽度,而线性层使用softmax函数预测类别标签。
想法
对于所有深度学习和计算机视觉爱好者来说,这是一个非常令人兴奋的框架。非常感谢Facebook与社区分享其方法。
原文链接:https://www.analyticsvidhya.com/blog/2020/05/facebook-detection-transformer-detr-a-transformer-based-object-detection-approach/
留言送书福利
感谢大家的走心留言,每一条小编都认真阅读了,会继续努力哒。
这次没被抽中的朋友不要气馁~ 我们会坚持不定期推出留言送书活动,多多留言会增加中奖概率的。
恭喜下面留言的这位读者,获赠书籍《Python数据分析与可视化从入门到精通》一本。请联系小编:mthler。
☆ END ☆
如果看到这里,说明你喜欢这篇文章,请转发、点赞。微信搜索「uncle_pn」,欢迎添加小编微信「 mthler」,每日朋友圈更新一篇高质量博文(无广告)。
↓扫描二维码添加小编↓
Facebook AI的DETR:一种基于Transformer的目标检测方法相关推荐
- 独家 | Facebook AI发布DETR一种基于Transformer的对象检测方法!
作者:PRATEEK JOSHI 翻译:陈之炎 校对:王晓颖 本文约1800字,建议阅读8分钟. 每隔一段时间,一些新的机器学习的框架或者库就会改变整个领域的格局.今天,Facebook开源了-DET ...
- 高效!Anchor DETR:旷视提出一种基于Transformer的目标检测神器!
点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:Sophia知乎 https://zhuanlan.zhihu.com/p/412738375 985人工智能 ...
- 旷视孙剑团队提出Anchor DETR:基于Transformer的目标检测新网络
开放了预训练,r50 400多m 写在前面 在本文中,作者提出了一种基于Transformer的目标检测器.在以前基于Transformer的检测器中,目标的查询是一组可学习的embedding.然而 ...
- 计算机视觉算法——基于Transformer的目标检测(DETR / Deformable DETR / DETR 3D)
计算机视觉算法--基于Transformer的目标检测(DETR / Deformable DETR / DETR 3D) 计算机视觉算法--基于Transformer的目标检测(DETR / Def ...
- LVC | 一种简单的小样本目标检测方法
欢迎关注我的公众号 [极智视界],获取我的更多笔记分享 大家好,我是极智视界,本文解读一下 Label, Verify, Correct (LVC):一种简单的小样本目标检测方法. 本文的 ...
- 自动驾驶采标系列四:基于激光雷达的目标检测方法
标注猿的第55篇原创 一个用数据视角看AI世界的标注猿 上一篇文章我们讲了基于图像的目标检测技术,但对于标注人员来说这部分内容就相对比较难一些,只是作为一个了解就可以,但是如 ...
- MATLAB目标检测恒虚警技术,一种自适应的恒虚警率目标检测方法
一种自适应的恒虚警率目标检测方法 [专利摘要]本发明涉及一种自适应的恒虚警率目标检测方法,包括以下步骤:1):将雷达接收到的数据传入匹配滤波器中:2):将匹配滤波器输出的信号传入平方律检波器中进行处理 ...
- 基于形心的目标检测方法
基于形心的目标检测方法 用VisualStudio和OpenCV实现,包括BMP文件读取.固定阈值分割.大津阈值分割.迭代法分割.目标形心的确定.目标框的确定等. Object_Detection.h ...
- 一种基于KINECT的摔倒检测方法,全新的特征
全文下载地址 Kinect 为提供的深度图像,为行为识别和行为分析提供了一种全新的方法.本文在KINECT的骨骼数据上提取了一个全新的特征,并成功实现了摔倒检测和类似摔倒检测行为的区别.经认证测试,效 ...
最新文章
- 理解Java对象:要从内存布局及底层机制说起,话说....
- 计算机未识别网络什么意思,win7 64位系统提示当前连接到未识别的网络怎么办...
- 【干货】参与感,网易是这样做的
- 解析:为什么人工智能要用Python?
- egret中loadingUI的自定义
- typeof需要注意的内容
- 看得上瘾的斗鱼,首次开源了自家项目 Jupiter !
- editview软键盘弹出和隐藏
- cad标注桩号lisp_cad桩号标注插件下载
- 用yolov5训练kitti数据集
- MFC中CImageList的用法
- VS2018+TensorFlow安装
- USB-PPI数据电缆驱动
- 精密划片机在钽酸锂晶圆切割案例
- 如何用两台虚拟机搭建LAMP架构访问qq农场
- Linux input子系统上报键值失败问题
- 淘宝店群的失败,标志另一代店群平台的崛起,店群“时代在发展”
- 微信原生小程序电商实战项目----附源码和分析
- 伯远帖 - Java Spring 4.0 集成 MyBatis 3.1 支持
- Feedback Prize-Kaggle比赛调研