(深度学习论文精读总结)You Only Look Once: Unified, Real-Time Object Detection
一、文献名字和作者
文献名:You Only Look Once: Unified, Real-Time Object Detection
作者名:Joseph Redmon,Santosh Divvala,Ross Girshick,Ali Farhadi
二、阅读时间
2019年7月24日~2019年7月26日(本人读的第一篇英文论文,比较慢)
三、文献领域
目标检测
四、文献目的
本文主要实现的是目标检测,即对于给定图片,对其中的各个对象进行检测,最终以比较准确的边界框的形式将其圈出,并显示其具体为哪一个类别。前人已经通过一些算法诸如DPM,R-CNN等实现过目标检测,本文力求提出一种新算法以提高准确率与性能。
五、文献核心与创新点
核心:作者提出了YOLO算法,其详细过程为:给定一张图,分为N x N网格,每一个小网格生成两个边界框,再使用非最大抑制法去掉多余边界框,确保每一个对象最终只有一个边界框,最终输出目标检测结果。
创新点:
- 提出了一种新的目标检测算法——YOLO算法
- YOLO算法与之前的DPM,R-CNN算法相比,总的来说mAP和fps都有显著提升,尤其是实时目标检测方面更加出色
- YOLO+R-CNN结合的方法进一步提升性能,在当前所有检测算法中性能可以排到第五位
六、文献前景与不足
前景:文里没说,应该是继续优化提升YOLO算法性能
不足:YOLO算法对于小物体以及挨得很近的物体预测的不是很好,由于其算法设定特性可能会漏预测个别对象
七、自己的收获
这是我阅读的第一篇英文学术论文,比较有纪念价值,首先要克服语言上的障碍,比如单词不认识,单词认识但是句子不懂,阅读速度慢等等。这篇论文用了3天时间读完,当然比较懒,每天就读了不到2小时,边读边要查漏补缺各种知识所以比较慢,以后应该会加快速度。
小知识点:
- mAP:mean average precision,平均精度
- fps:frames per second,每秒传输帧数
这两个是评价算法性能的主要指标,mAP是根据presicion-recall曲线面积计算得到
(深度学习论文精读总结)You Only Look Once: Unified, Real-Time Object Detection相关推荐
- 深度学习论文精读(4):MobileNetV2
深度学习论文精读(4):MobileNetV2 论文地址:MobileNetV2: Inverted Residuals and Linear Bottlenecks 参考博文1:https://zh ...
- 深度学习论文精读[10]:Deeplab v1
在语义分割发展早期,一些研究观点认为将CNN用于图像分割主要存在两个问题:一个是下采样导致的信息丢失问题,另一个则是CNN的空间不变性问题,这与CNN本身的特性有关,这种空间不变性有利于图像分类但却不 ...
- 深度学习论文精读[9]:PSPNet
场景解析(scene parsing)是语义分割的一个重要应用方向,区别于一般的语义分割任务,场景解析需要在复杂的自然图像场景下对更庞大的物体类别的每一个像素进行分类,场景解析在自动驾驶和机器人感知等 ...
- 深度学习论文精读05——用于乳腺癌组织病理学图像分类的深度特征
用于乳腺癌组织病理学图像分类的深度特征 标题:Deep Features for Breast Cancer Histopathological Image Classifification 链接:查 ...
- 深度学习论文精读06——应对卷积神经网络对乳腺癌组织病理学图像进行分类
标题:Deep Features for Breast Cancer Histopathological Image Classifification 链接:查看文献原文 翻译参考:查看文献翻译 文章 ...
- 深度学习论文精读01——基于多任务学习的肿瘤医学影像语义分割与分类研究
基于多任务学习的肿瘤医学影像语义分割与分类研究 文章目录 基于多任务学习的肿瘤医学影像语义分割与分类研究 1 背景介绍 2 主要内容 3 材料和方法 3.1卷积神经网络 多层感知模型(全连接) 3.1 ...
- 论文精读《OFT: Orthographic Feature Transform for Monocular 3D Object Detection》
OFT: Orthographic Feature Transform for Monocular 3D Object Detection 文章目录 OFT: Orthographic Feature ...
- 脉脉发布AI人才数据图鉴;『李沐·深度学习论文精读』视频合辑;CVPR 2022自动驾驶资源合集;线性代数图绘笔记;前沿论文 | ShowMeAI资讯日报
ShowMeAI日报系列全新升级!覆盖AI人工智能 工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文 等方向.点击查看 历史文章列表, ...
- 深度学习论文: TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head 及其PyTorch实现
深度学习论文: TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head for Object Detection on Dro ...
最新文章
- python魔术方法call_php魔术方法__call
- midaspay能删除吗_midasPay返回90009错误
- OpenShift v3:使用WildFly和MySQL的Java EE 7入门
- 3.hello hibernate
- eclipemaven本地仓库依赖_只用一招,让你Maven依赖下载速度快如闪电
- 二叉树的公共祖先(递归)
- java诺基亚nba,HMD 签约NBA 新秀劳里·马尔卡宁 为诺基亚手机品牌大使
- php元类,iOS中类、元类、isa详解
- 医疗护理与监测 智能可穿戴发展的另一个方向
- FastReport 数据区二级显示
- Apache HttpClient 客户端使用详解
- 数据库实验八 数据库编程
- 我的世界手机java版下载_我的世界java版下载手机版-我的世界java版手机版v1.16 - 手机迷...
- 如何为谷歌浏览器启用暗模式
- PTA 数据结构与算法 7-29 修理牧场
- hint ksql oracle_性能测试中发现oracle11g数据库每天22点,oralce进程CPU占用率突增
- 【损失函数系列】softmax loss损失函数详解
- 移远EC200 EC20 EC600 EC800连接MQTT服务器
- npm安装慢 ,卡在sill idealTree buildDeps不动
- HR人力资源系统管理源码