2019、2020最新的中文文本检测检测模型

1、DBNet(Real-time Scene Text Detection with Differentiable Binarization)

  • 论文地址:https://arxiv.org/pdf/1911.08947.pdf

  • 作者:华中科技大学 Minghui Liao 1∗ , Zhaoyi Wan 2∗ , Cong Yao 2 , Kai Chen 3,4 , Xiang Bai 1

  • 网络结构

  • 创新点
    在基于分割的文本检测网络中,最终的二值化map都是使用的固定阈值来获取,并且阈值不同对性能影响较大。本文中,对每一个像素点进行自适应二值化,二值化阈值由网络学习得到,彻底将二值化这一步骤加入到网络里一起训练,这样最终的输出图对于阈值就会非常鲁棒。

  • 开源代码:
    github:https://github.com/MhLiao/DB

  • 检测结果示例

  • 测试结果

2、CRAFT(Character Region Awareness for Text Detection)

  • 论文地址:https://arxiv.org/pdf/1904.01941.pdf

  • 作者:Youngmin Baek, Bado Lee, Dongyoon Han, Sangdoo Yun, and Hwalsuk Lee ∗
    Clova AI Research, NAVER Corp.

  • 网络结构

  • 创新点
    利用了分割的方法,将一个字符视为一个检测目标对象,而不是一个文本框当做目标。先检测单个字符(character region score)及字符间的连接关系(affinity score),然后根据字符间的连接关系确定最终的文本行。这样做的好处在于:使用小感受野也能预测大文本和长文本,只需要关注字符级别的内容而不需要关注整个文本实例。

  • 开源代码:
    github:https://github.com/clovaai/CRAFT-pytorch

  • 检测结果示例

  • 测试结果

3、PSENet(Shape Robust Text Detection with Progressive Scale Expansion Network)

  • 论文地址:https://arxiv.org/abs/1806.02559

  • 作者:Xiang Li, Wenhai Wang, Wenbo Hou, Ruo-Ze Liu, Tong Lu, Jian Yang

  • 网络结构

  • 创新点
    1、提出了一种基于基于像素级别的分割的方法psenet,能够对任意形状的文本进行定位。
    2、提出了一种渐进的尺度扩展算法,该算法可以成功地识别相邻文本实例。

  • 开源代码:
    github:https://github.com/whai362/PSENet

  • 其他参考:AI实战:最强文本检测模型Shape Robust Text Detection with Progressive Scale Expansion Network (PSENet)

AI实战:2019、2020最新的中文文本检测检测模型相关推荐

  1. AI艺术的背后:详解文本生成图像模型【基于 Diffusion Model】

    系列文章链接: AI艺术的背后:详解文本生成图像模型[基于 VQ-VAE] AI艺术的背后:详解文本生成图像模型[基于GAN] AI艺术的背后:详解文本生成图像模型[基于Diffusion Model ...

  2. AI艺术的背后:详解文本生成图像模型【基于GAN】

    系列文章链接: AI艺术的背后:详解文本生成图像模型[基于 VQ-VAE] AI艺术的背后:详解文本生成图像模型[基于GAN] AI艺术的背后:详解文本生成图像模型[基于Diffusion Model ...

  3. AI艺术的背后:详解文本生成图像模型【基于 VQ-VAE】

    系列文章链接: AI艺术的背后:详解文本生成图像模型[基于 VQ-VAE] AI艺术的背后:详解文本生成图像模型[基于GAN] AI艺术的背后:详解文本生成图像模型[基于Diffusion Model ...

  4. 《中文文本信息抽取模型与方法研究》5:基于论元结构的事件要素及其角色识别

    论元结构是沟通认知与句法结构的桥梁,是语义和句法的接口,在现代句法学和语义学研究中有着相当重要的地位,对于确定句子含义和进行文本理解意义重大.利用CRF来识别事件要素及其角色的方法. 语义分析旨在让计 ...

  5. 【阿旭机器学习实战】【33】中文文本分类之情感分析--朴素贝叶斯、KNN、逻辑回归

    [阿旭机器学习实战]系列文章主要介绍机器学习的各种算法模型及其实战案例,欢迎点赞,关注共同学习交流. 目录 1.查看原始数据结构 2.导入数据并进行数据处理 2.1 提取数据与标签 2.2 过滤停用词 ...

  6. 【代码实战】基于pytorch实现中文文本分类任务

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 来自 | 知乎 地址 | https://zhuanlan.zhihu.com/p/73176 ...

  7. python自动化办公 百度网盘-Python自动化办公实战教程2020最新带源码

    资源目录: 视频 001_Excel_xlrd读_xlwt写.mp4 003_Excel_案例_统计每位同学总分.mp4 004_MySQL_我为什么不建议学.mp4 005_Excel_更灵活的操作 ...

  8. python自动化办公入门书籍-Python自动化办公实战教程2020最新带源码

    资源目录: 视频 001_Excel_xlrd读_xlwt写.mp4 003_Excel_案例_统计每位同学总分.mp4 004_MySQL_我为什么不建议学.mp4 005_Excel_更灵活的操作 ...

  9. python自动办公pdf_Python自动化办公实战教程2020最新带源码

    资源目录: 视频 001_Excel_xlrd读_xlwt写.mp4 003_Excel_案例_统计每位同学总分.mp4 004_MySQL_我为什么不建议学.mp4 005_Excel_更灵活的操作 ...

最新文章

  1. k8s 带你一步步 创建用户账号(User Account)
  2. 大数据的应用难题:是否该建立数据公地
  3. [转载] 什么时候应该使用 ==?什么时候应该使用 Equals?
  4. 【Android Gradle 插件】ProductFlavor 配置 ( ProductFlavor#buildConfigField 方法 | 单独编译生成 BuildConfig 类的任务 )
  5. Leetcode 100. 相同的树 (每日一题 20210811)
  6. springboot 引入jdbc驱动_Spring Boot:企业常用的 Starter以及实现
  7. 【SQL进阶】03.执行计划之旅1 - 初探
  8. Linux截取文件名的后几位,Linux字符串截取和处理命令 cut、printf、awk、sed、sort、wc...
  9. LINQ根据某字段GroupBy
  10. closewait一直不释放_机床为什么要释放应力?怎么释放应力才好?
  11. 中国 GDP 20 强城市排行榜(2001-2020)
  12. 46. Permutations 1
  13. 如何解决Mac苹果电脑使用Safari浏览器时无法在地址栏搜索?
  14. delphi 如何解决假死
  15. AWVS 13 Docker版本(破解后)
  16. oracle := 和=,oracle中 =: 和 := 分别是什么意思?
  17. 五、网络整理BAT脚本——字符串常规操作
  18. 属于EDG的奇迹之夜
  19. html盒子距离上边距50px,Margin的垂直外边距问题
  20. 最近成了三等奖专业户

热门文章

  1. 牙齿美白粉行业调研报告 - 市场现状分析与发展前景预测
  2. 未来IT工程师协会 会徽征集
  3. 丘比特射箭时为何要蒙上眼睛?
  4. 大学需要计算机知识点,大学计算机基础知识点
  5. Java文件操作详解
  6. 华为手机的6个截屏方法,你都会用吗?不会那你手机可真是白用了
  7. Quartz任务调度框架
  8. hihocoder #1179 : 永恒游戏 暴力
  9. 照片做成视频的软件手机上用照片做成视频
  10. android videoview 播放之前短暂黑屏