TextBoxes++是基于SSD和TextBoxes的。论文:https://arxiv.org/pdf/1801.02765.pdf

前言

文本检测和其他物体检测的区别:

(1) 文本检测有比较大的长宽比;

(2) 一半的convolutional filter无法全部检测到;

可能的解决方案:

(1) 长的卷积核;

(2) inception convolutional kernels;

(3) part detection and grouping.

textboxes

与SSD区别:

(1) 把SSD的defaultbox的比例改成(1,2,3,5,7,10)的长矩形。

(2) 如下图所示,把原来的作为分类的卷积核3*3改成了1*5,更适合文本检测。

(3) 从多尺度变换成单尺度(textboxes系列算法对尺度的严重依赖性,对于不同尺度的图片,要调整不同的尺度效果才好)。

textboxes网络结构

SSD网络结构

TextBoxes++

代码:https://github.com/MhLiao/TextBoxes_plusplus

参考:

[1] https://zhuanlan.zhihu.com/p/34131821

TextBoxes++相关推荐

  1. 开源OCR文本检测器,基于TextBoxes++和RetinaNet

    开源OCR文本检测器,基于TextBoxes++和RetinaNet 权重都比较大: https://github.com/qjadud1994/Text_Detector/tree/master/P ...

  2. 论文: TextBoxes

    在SSD的结构上做了一些改进使之更适合场景文字识别. 文字识别有助于区分文本和背景. Contribution:一个端到端的场景文字识别模型.结合了检测和识别.高效. 文字检测可以大概分为三类: 1. ...

  3. TextBoxes与TextBoxes++算法详解

    这是两篇文章,因为这两篇文章大部分是相同的所以写一块了. TextBoxes <TextBoxes: A Fast Text Detector with a Single Deep Neural ...

  4. 《TextBoxes: A Fast Text Detector with a Single Deep Neural Network》论文笔记

    参考博文: 日常阅读论文,这是在谷歌学术上搜索其引用CRNN的相关文献中被引数量比较高的一篇OCR方向的文章,这里拿来读一读. 文章目录 make decision step1:读摘要 step2:读 ...

  5. 对输入框以及选择框集体的数据检验

    对于一个档案输入框,有很多输入框是需要输入数据的,但有时候我们会在输入的时候遗留一些必填的项,如果不做数据校验,这时候点击保存按钮,就悲剧了,报错不说,我们前面填写的数据也就没有了. 所以数据校验非常 ...

  6. (OCR论文)Mask TextSpotter V3机翻

    <Mask TextSpotter v3: Segmentation Proposal Network for Robust Scene Text Spotting>,ECCV 2020, ...

  7. AI 博士生获201万最高档年薪,华科学子连续三年入选华为“天才少年”!

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 文末送5本北京大学出版社<GAN生成对抗神经网络> 来源 ...

  8. OCR光学字符识别方法汇总(附开源代码)

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 文本是人类最重要的信息来源之一,自然场景中充满了形形色色的文字符号 ...

  9. 干货 | 一文总结旋转目标检测全面综述:论文方法与代码

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自|计算机视觉联盟 1.RRPN(两阶段文字检测 华科白翔组 ...

最新文章

  1. 吴恩达新书《Machine Learning Yearning》完整中文版开源!
  2. 转载:PHP JSON_ENCODE 不编码中文汉字的方法
  3. HBase major version number must be less than 2 for hbase-sink
  4. php7 echo无法显示,PHP7 echo和print语句实例用法
  5. 利用koa实现mongodb数据库的增删改查
  6. 【ASP.NET Web API教程】2.3.5 用Knockout.js创建动态UI
  7. 几个常见的 slice 错误
  8. 面试官 | AJAX请求为什么不安全?
  9. wordpress-Sakurairo美化主题模板
  10. python中两个集合的运算并交补_三种方式实现 Python 中的集合的交、并、补运算...
  11. 凸优化与非线性优化基础(3)-- 二次规划Quadratic Programming
  12. 如何在阿里云国际上设置邮箱主机
  13. java实现代理服务器
  14. 小黑盒不显示服务器,小黑盒有的好友不显示 | 手游网游页游攻略大全
  15. 直通车点击率、点击率、创意图、关键词、出价卡位,提升直通车点击率的技巧和方法
  16. DCloud之Android平台应用启动时读写手机存储、访问设备信息(如IMEI)等权限策略控制
  17. python颜色画线_matplotlib设置颜色、标记、线条,让你的图像更加丰富(推荐)
  18. 单片机 数码管0~F显示
  19. 使用helm部署kubeapps
  20. Android深入浅出系列之Bluetooth—蓝牙操作(一)

热门文章

  1. Example 3, 4 of variadic templates
  2. 视频去除水印,只需两分钟随时学会
  3. 物联网是什么?物联网应用场景有哪些?物联网有什么好处?
  4. 深克隆与浅克隆的区别
  5. 用python实现模拟登录人人网
  6. shortcut和残差连接
  7. 破解webshell方法~
  8. [JZOJ5454]仔细的检查
  9. Python获取pi值的五种方法
  10. Android学习 书籍