作者提出了 CTPN(Connectionist Text Proposal Network) 模型, 来直接检测文字序列.(端到端)

CTPN 主要做了三个工作使它这么强:

  1. Detecting Text in Fine-scale proposals(将文本检测任务转化为一连串小尺度文本框的检测)
  2. Recurrent Connectionist Text Proposals(引入RNN 中的 Bidirectional LSTM 提升上一步的文本检测效果)
  3. Side-refinement(连接文本, 并对边缘位置的锚框进行优化)

作者的工作:

Ren 等人使用 锚回归机制 来使小尺寸滑动窗口能够检测到不同大小的对象 (对象检测).

> 作者借鉴了RPN(Region Proposal network)的思想, 提出了竖直锚回归.--- RPN 在目标检测上有这 stat of art 的表现, 但是对于文字检测有着缺陷

作者借鉴了这个思想, 提出了 竖直锚回归(vertical anchor mechanism), 它可以

  1. 同时生成 text/non-text 分数 和 每个锚框的 y 坐标
  2. 更可靠的检测出固定宽度的文本建议 (指可以是文本的一部分), 而不是检测单个字符
  3. 它使用与不同大小和高宽比的文本

同时, 受到 RNN 在文字检测中优秀表现的影响 (能利用文本信息改善模型性能), 作者尝试了 LSTM , 他可以缓解来自 RNN 训练过程中梯度消失和梯度爆炸的问题. 并且, 作者更进一步尝试了 BLSTM , 它可以编码来自两个方向的卷积层的信息, 即他可以利用文本的上下文信息.

最后, 作者将 竖直锚机制 和 BLSTM 结合起来, 开发了一个端到端的可训练模型.

锚框的合并: 当两个锚框

  • 是最想领的两个锚框
  • 距离小于 50 pixels
  • text / non-text 分数大于0.7

则将两个锚框合并.

并且, 作者利用下式
vc=(cy−cya)/ha,vh=log⁡(h/ha)vc∗=(cy∗−cya)/ha,vh∗=log⁡(h∗/ha)\begin{array}{ll}{v_{c}=\left(c_{y}-c_{y}^{a}\right) / h^{a},} & {v_{h}=\log \left(h / h^{a}\right)} \\ {v_{c}^{*}=\left(c_{y}^{*}-c_{y}^{a}\right) / h^{a},} & {v_{h}^{*}=\log \left(h^{*} / h^{a}\right)}\end{array}vc​=(cy​−cya​)/ha,vc∗​=(cy∗​−cya​)/ha,​vh​=log(h/ha)vh∗​=log(h∗/ha)​
来调整处于文本检测边缘位置的锚框.

CTPN 的缺点: 对于非水平的文本的检测效果不好.

对于任意角度的文本检测, 参考论文 《Detecting Oriented Text in Natural Images by Linking Segments》, CVPR, 2017.

Connectionist Text Proposal Network相关推荐

  1. CTPN模型详解--Detecting Text in Natural Image with Connectionist Text Proposal Network

    文章目录 Abstract 1 Introduction 1.1 Contributions 2 Related Work 3 Connectionist Text Proposal Network ...

  2. 场景文字检测(一)--CTPN(Connectionist Text Proposal Network)

    论文:Detecting Text in Nature Image with Connectionist Text Proposal Network 在通用目标检测中,每一个物体都有一个定义良好的封闭 ...

  3. detecting text in natural image with connectionist text proposal network

    场景文字检测-CTPN原理与实现 - 知乎对于复杂场景的文字识别,首先要定位文字的位置,即文字检测.这一直是一个研究热点. Detecting Text in Natural Image with C ...

  4. 《Mask TextSpotter v3: Segmentation Proposal Network for Robust Scene Text Spotting》论文阅读笔记

    论文阅读笔记 去年在ECCV上发表的<Mask TextSpotter v3: Segmentation Proposal Network for Robust Scene Text Spott ...

  5. 【aixiv2016】DeepText A Unified Framework for Text Proposal Generation and Text Detection in Natural I

    本文转载自: http://www.cnblogs.com/lillylin/p/6118268.html Zhuoyao Zhong--[aixiv2016]DeepText A Unified F ...

  6. 无人机数车--Drone-based Object Counting by Spatially Regularized Regional Proposal Network

    Drone-based Object Counting by Spatially Regularized Regional Proposal Network ICCV2017 数据库:https:// ...

  7. 目标检测方法简介:RPN(Region Proposal Network) and SSD(Single Shot MultiBox Detector)

    原文引用:http://lufo.me/2016/10/detection/ 最近几年深度学习在计算机视觉领域取得了巨大的成功,而在目标检测这一计算机视觉的经典问题上直到去年(2015)才有了完全使用 ...

  8. SGPN: Similarity Group Proposal Network for 3D Point Cloud Instance Segmentation

    摘要 我们介绍了相似性组提议网络(SGPN),这是一种用于点云上3D对象实例细分的简单直观的深度学习框架.  SGPN使用单个网络来预测点分组建议和每个建议的对应语义类,我们可以从中直接提取实例分割结 ...

  9. High Performance Visual Tracking with Siamese Region Proposal Network全文翻译

    摘要   近年来,视觉对象跟踪一直是一个基本主题,许多基于深度学习的跟踪器在多个基准测试中取得了最先进的性能.然而,这些跟踪器中的大多数很难以实时速度获得最佳性能.在本文中,我们提出了 Siamese ...

  10. 自动驾驶轨迹预测论文阅读(二)TPNet: Trajectory Proposal Network for Motion Prediction

    论文链接:https://openaccess.thecvf.com/content_CVPR_2020/papers/Fang_TPNet_Trajectory_Proposal_Network_f ...

最新文章

  1. smartform连续打印,并自动补充空行
  2. ubuntu14.04中 gedit 凝视能显示中文,而source insight中显示为乱码的解决的方法
  3. python dialect='excel'是什么意思_python读取和生成excel文件
  4. 一起来学习LiteOS中断模块的源代码
  5. Python高性能编程指南大纲
  6. c:递归算法的三个demo:八皇后问题、台阶问题、汉诺塔
  7. (2)R包,GO.db调研(数据库构建角度解析)
  8. 创建属于自己的OneNote插件
  9. 中华流传十大吉祥图解
  10. 华科计算机系教学大纲,《批判性思维》课程教学大纲
  11. 机器人被挠脚心_《fm及机器人系列(tk)》专题
  12. 【java毕业设计】基于java+swing+Eclipse的推箱子游戏设计与实现(毕业论文+程序源码)——推箱子游戏
  13. 电子招投标系统EBD
  14. 对称加密,非对称加密详解
  15. 06 - table表格标签+ 行合并+列合并
  16. matlab memory 代数环,matlab/simulink中代数环的问题及解决措施
  17. office文件在线预览
  18. 铁道部新客票系统设计(三)
  19. 自学Java半年,没有包装简历,成功找到工作!!个人经验分享
  20. 【力扣周赛】第293场周赛

热门文章

  1. HDU 6438 Buy and Resell (优先队列 or 贪心)
  2. arcengine Icommond 自定义工具
  3. 001数据类型-字面值-运算规则
  4. STM32F103RCT+TJA1050+USBCAN盒做can通讯
  5. html中背景条纹效果,CSS3做出条纹大背景
  6. gis 六边形网格_六边形网格快速定位
  7. Cannot allocate memory
  8. 无人驾驶实践进阶——定位
  9. 中国风来袭!如何用ArcGIS制作水墨风山水画?
  10. 服务器网卡不显示了,重装系统后网络适配器怎么不见了?没有网络适配器解决方法...