AI实战:2019、2020最新的中文文本检测检测模型
2019、2020最新的中文文本检测检测模型
1、DBNet(Real-time Scene Text Detection with Differentiable Binarization)
论文地址:https://arxiv.org/pdf/1911.08947.pdf
作者:华中科技大学 Minghui Liao 1∗ , Zhaoyi Wan 2∗ , Cong Yao 2 , Kai Chen 3,4 , Xiang Bai 1
网络结构
创新点
在基于分割的文本检测网络中,最终的二值化map都是使用的固定阈值来获取,并且阈值不同对性能影响较大。本文中,对每一个像素点进行自适应二值化,二值化阈值由网络学习得到,彻底将二值化这一步骤加入到网络里一起训练,这样最终的输出图对于阈值就会非常鲁棒。开源代码:
github:https://github.com/MhLiao/DB检测结果示例
测试结果
2、CRAFT(Character Region Awareness for Text Detection)
论文地址:https://arxiv.org/pdf/1904.01941.pdf
作者:Youngmin Baek, Bado Lee, Dongyoon Han, Sangdoo Yun, and Hwalsuk Lee ∗
Clova AI Research, NAVER Corp.网络结构
创新点
利用了分割的方法,将一个字符视为一个检测目标对象,而不是一个文本框当做目标。先检测单个字符(character region score)及字符间的连接关系(affinity score),然后根据字符间的连接关系确定最终的文本行。这样做的好处在于:使用小感受野也能预测大文本和长文本,只需要关注字符级别的内容而不需要关注整个文本实例。开源代码:
github:https://github.com/clovaai/CRAFT-pytorch检测结果示例
测试结果
3、PSENet(Shape Robust Text Detection with Progressive Scale Expansion Network)
论文地址:https://arxiv.org/abs/1806.02559
作者:Xiang Li, Wenhai Wang, Wenbo Hou, Ruo-Ze Liu, Tong Lu, Jian Yang
网络结构
创新点
1、提出了一种基于基于像素级别的分割的方法psenet,能够对任意形状的文本进行定位。
2、提出了一种渐进的尺度扩展算法,该算法可以成功地识别相邻文本实例。开源代码:
github:https://github.com/whai362/PSENet其他参考:AI实战:最强文本检测模型Shape Robust Text Detection with Progressive Scale Expansion Network (PSENet)
AI实战:2019、2020最新的中文文本检测检测模型相关推荐
- AI艺术的背后:详解文本生成图像模型【基于 Diffusion Model】
系列文章链接: AI艺术的背后:详解文本生成图像模型[基于 VQ-VAE] AI艺术的背后:详解文本生成图像模型[基于GAN] AI艺术的背后:详解文本生成图像模型[基于Diffusion Model ...
- AI艺术的背后:详解文本生成图像模型【基于GAN】
系列文章链接: AI艺术的背后:详解文本生成图像模型[基于 VQ-VAE] AI艺术的背后:详解文本生成图像模型[基于GAN] AI艺术的背后:详解文本生成图像模型[基于Diffusion Model ...
- AI艺术的背后:详解文本生成图像模型【基于 VQ-VAE】
系列文章链接: AI艺术的背后:详解文本生成图像模型[基于 VQ-VAE] AI艺术的背后:详解文本生成图像模型[基于GAN] AI艺术的背后:详解文本生成图像模型[基于Diffusion Model ...
- 《中文文本信息抽取模型与方法研究》5:基于论元结构的事件要素及其角色识别
论元结构是沟通认知与句法结构的桥梁,是语义和句法的接口,在现代句法学和语义学研究中有着相当重要的地位,对于确定句子含义和进行文本理解意义重大.利用CRF来识别事件要素及其角色的方法. 语义分析旨在让计 ...
- 【阿旭机器学习实战】【33】中文文本分类之情感分析--朴素贝叶斯、KNN、逻辑回归
[阿旭机器学习实战]系列文章主要介绍机器学习的各种算法模型及其实战案例,欢迎点赞,关注共同学习交流. 目录 1.查看原始数据结构 2.导入数据并进行数据处理 2.1 提取数据与标签 2.2 过滤停用词 ...
- 【代码实战】基于pytorch实现中文文本分类任务
点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 来自 | 知乎 地址 | https://zhuanlan.zhihu.com/p/73176 ...
- python自动化办公 百度网盘-Python自动化办公实战教程2020最新带源码
资源目录: 视频 001_Excel_xlrd读_xlwt写.mp4 003_Excel_案例_统计每位同学总分.mp4 004_MySQL_我为什么不建议学.mp4 005_Excel_更灵活的操作 ...
- python自动化办公入门书籍-Python自动化办公实战教程2020最新带源码
资源目录: 视频 001_Excel_xlrd读_xlwt写.mp4 003_Excel_案例_统计每位同学总分.mp4 004_MySQL_我为什么不建议学.mp4 005_Excel_更灵活的操作 ...
- python自动办公pdf_Python自动化办公实战教程2020最新带源码
资源目录: 视频 001_Excel_xlrd读_xlwt写.mp4 003_Excel_案例_统计每位同学总分.mp4 004_MySQL_我为什么不建议学.mp4 005_Excel_更灵活的操作 ...
最新文章
- k8s 带你一步步 创建用户账号(User Account)
- 大数据的应用难题:是否该建立数据公地
- [转载] 什么时候应该使用 ==?什么时候应该使用 Equals?
- 【Android Gradle 插件】ProductFlavor 配置 ( ProductFlavor#buildConfigField 方法 | 单独编译生成 BuildConfig 类的任务 )
- Leetcode 100. 相同的树 (每日一题 20210811)
- springboot 引入jdbc驱动_Spring Boot:企业常用的 Starter以及实现
- 【SQL进阶】03.执行计划之旅1 - 初探
- Linux截取文件名的后几位,Linux字符串截取和处理命令 cut、printf、awk、sed、sort、wc...
- LINQ根据某字段GroupBy
- closewait一直不释放_机床为什么要释放应力?怎么释放应力才好?
- 中国 GDP 20 强城市排行榜(2001-2020)
- 46. Permutations 1
- 如何解决Mac苹果电脑使用Safari浏览器时无法在地址栏搜索?
- delphi 如何解决假死
- AWVS 13 Docker版本(破解后)
- oracle := 和=,oracle中 =: 和 := 分别是什么意思?
- 五、网络整理BAT脚本——字符串常规操作
- 属于EDG的奇迹之夜
- html盒子距离上边距50px,Margin的垂直外边距问题
- 最近成了三等奖专业户