图像风格迁移cvpr2020_CVPR 2020 论文大盘点-文本图像篇
本文盘点CVPR 2020 所有文本图像(text)相关论文,主要分为手写文本和场景文本两大方向,总计16篇,对文献进行了细致的分类,大部分论文是围绕识别问题的研究。
方向包括:
1)场景文本检测(Scene Text Detection),从街景等场景文本中检测文本的位置,2 篇文献均为不规则任意形状文本的检测;
2)场景文本识别(Scene Text Recognition),对场景文本检测得到的结果进行识别,共 4 篇文章;
3)手写文本识别(HandwrittenText Recognition),2 篇文章;
4)场景文本端到端识别(Scene Text Spotting),1 篇文章,即华南理工大学和阿德莱德大学学者提出的实时ABCNet算法,很吸引人,已经开源;
5)手写文本生成(Handwritten Text Generation),为了增加手写文本的训练样本(感觉也可以用来“写作业”
),1 篇文章;
6)场景文本合成(Scene Text Synthesis),为了增加场景文本的训练样本,1 篇文章,出自旷视科技,UnrealText用渲染引擎生成逼真场景文本;
7)文本图像的数据增广,用于手写和场景文本识别算法的训练,1 篇文章;
8)场景文本编辑(Scene Text Editor),对场景文本图像中的文字进行替换;
9)碎纸文档重建,用于刑侦领域的文档被破坏成碎片后的重建,1篇;
10)文本风格迁移,1篇;
11)场景文本识别的对抗攻击研究,1篇;
12)笔迹鉴定,1篇。
值得一提的,16篇文章中10篇已经开源或者准备开源,感谢这些开发者~
已经开源或者即将开源的论文,把代码地址也附上了。
大家可以在:
http://openaccess.thecvf.com/CVPR2020.py
按照题目下载这些论文。
如果想要下载所有CVPR 2020论文,请点击这里:
场景文本检测
深度关系推理图网络用于任意形状文本检测
[1].Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection
作者 | Shi-Xue Zhang, Xiaobin Zhu, Jie-Bo Hou, Chang Liu, Chun Yang, Hongfa Wang, Xu-Cheng Yin
单位 | 北京科技大学;中国科学技术大学人工智能联合实验室;腾讯科技(深圳)
代码 | https://github.com/GXYM/DRRG
备注 | CVPR 2020 Oral
解读 | https://blog.csdn.net/SpicyCoder/article/details/105072570
[2].ContourNet: Taking a Further Step Toward Accurate Arbitrary-Shaped Scene Text Detection
作者 | Yuxin Wang, Hongtao Xie, Zheng-Jun Zha, Mengting Xing, Zilong Fu, Yongdong Zhang
单位 | 中国科学技术大学
代码 | https://github.com/wangyuxin87/ContourNet
解读 | https://zhuanlan.zhihu.com/p/135399747
场景文本识别
论场景文本识别中的词汇依赖性
[3].On Vocabulary Reliance in Scene Text Recognition
作者 | Zhaoyi Wan, Jielei Zhang, Liang Zhang, Jiebo Luo, Cong Yao
单位 | 旷视;中国矿业大学;罗切斯特大学
[4].SCATTER: Selective Context Attentional Scene Text Recognizer
作者 | Ron Litman, Oron Anschel, Shahar Tsiper, Roee Litman, Shai Mazor, R. Manmatha
单位 | Amazon Web Services
语义推理网络,用于场景文本的精确识别
[5].Towards Accurate Scene Text Recognition With Semantic Reasoning Networks
作者 | Deli Yu, Xuan Li, Chengquan Zhang, Tao Liu, Junyu Han, Jingtuo Liu, Errui Ding
单位 | 国科大;百度;中科院
代码 | https://github.com/chenjun2hao/SRN.pytorch
语义增强的编解码框架,用于识别低质量图像(模糊、光照不均、字符不完整等)场景文本
[6].SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition
作者 | Zhi Qiao, Yu Zhou, Dongbao Yang, Yucan Zhou, Weiping Wang
单位 | 中科院;国科大
代码 |https://github.com/Pay20Y/SEED(即将)
手写文本识别
[7].OrigamiNet: Weakly-Supervised, Segmentation-Free, One-Step, Full Page Text Recognition by learning to unfold
作者 | Mohamed Yousef, Tom E. Bishop
单位 | Intuition Machines, Inc
代码 | https://github.com/IntuitionMachines/OrigamiNet
Scene Text Spotting
实时端到端场景文本识别
[8].ABCNet: Real-Time Scene Text Spotting With Adaptive Bezier-Curve Network
作者 | Yuliang Liu, Hao Chen, Chunhua Shen, Tong He, Lianwen Jin, Liangwei Wang
单位 | 华南理工大学;阿德莱德大学;
代码 | https://github.com/Yuliang-Liu/bezier_curve_text_spotting
备注 | CVPR 2020 Oral
解读 | https://zhuanlan.zhihu.com/p/146276834
手写文本生成
半监督变长手写文本生成,增加文本数据集,提高识别算法精度
[9].ScrabbleGAN: Semi-Supervised Varying Length Handwritten Text Generation
作者 | Sharon Fogel, Hadar Averbuch-Elor, Sarel Cohen, Shai Mazor, Roee Litman
单位 | 以色列国,Amazon Rekognition;康奈尔大学
代码 | https://github.com/amzn/convolutional-handwriting-gan
场景文本合成
使用渲染引擎合成场景文本,增加训练样本,提升识别算法精度
[10].UnrealText: Synthesizing Realistic Scene Text Images From the Unreal
作者 | WorldShangbang Long, Cong Yao
单位 | 卡内基梅隆大学;旷视
代码 | https://jyouhou.github.io/UnrealText/
解读 | https://zhuanlan.zhihu.com/p/137406773
数据增广+文本识别
图像增广用于手写与场景文本识别
[11].Learn to Augment: Joint Data Augmentation and Network Optimization for Text Recognition
作者 | Canjie Luo, Yuanzhi Zhu, Lianwen Jin, Yongpan Wang
单位 | 华南理工大学;阿里
代码 | https://github.com/Canjie-Luo/Text-Image-Augmentation
场景文本编辑
[12].STEFANN: Scene Text Editor Using Font Adaptive Neural Network
作者 | Prasun Roy, Saumik Bhattacharya, Subhankar Ghosh, Umapada Pal
单位 | 印度统计研究所;印度理工学院
代码 | https://github.com/prasunroy/stefann
网站 | https://prasunroy.github.io/stefann/
碎纸文档重建
破碎纸片重建文档,用于法医等刑侦调查
[13].Fast(er) Reconstruction of Shredded Text Documents via Self-Supervised Deep Asymmetric Metric Learning
作者 | Thiago M. Paixao, Rodrigo F. Berriel, Maria C. S. Boeres, Alessandro L. Koerich, Claudine Badue, Alberto F. De Souza, Thiago Oliveira-Santos
单位 | IFES,Brazil;UFES,Brazil;ETS,Canada
文本风格迁移
[14].SwapText: Image Based Texts Transfer in Scenes
作者 | Qiangpeng Yang, Jun Huang, Wei Lin
单位 | 阿里
场景文本识别+对抗攻击
[15].What Machines See Is Not What They Get: Fooling Scene Text Recognition Models With Adversarial Text Images
作者 | Xing Xu, Jiefu Chen, Jinhui Xiao, Lianli Gao, Fumin Shen, Heng Tao Shen
单位 | 电子科技大学
笔迹鉴定
[16].Sequential Motif Profiles and Topological Plots for Offline Signature Verification
作者 | Elias N. Zois, Evangelos Zervas, Dimitrios Tsourounis, George Economou
单位 | University of West Attica ;
派图拉斯大学
往期"精彩阅读"
END
备注:ocr
OCR交流群
文本检测、识别、编辑等更多最新技术,若已为CV君其他账号好友请直接私信。
我爱计算机视觉
微信号:aicvml
QQ群:805388940
微博知乎:@我爱计算机视觉
投稿:amos@52cv.net
网站:www.52cv.net
在看,让更多人看到
图像风格迁移cvpr2020_CVPR 2020 论文大盘点-文本图像篇相关推荐
- CVPR 2020 论文大盘点-文本图像篇
本文盘点CVPR 2020 所有文本图像(text)相关论文,主要分为手写文本和场景文本两大方向,总计16篇,对文献进行了细致的分类,大部分论文是围绕识别问题的研究. 方向包括: 1)场景文本检测(S ...
- CVPR 2020 论文大盘点-图像质量评价篇
本文继 去雨去雾去模糊篇 . 图像增强与图像恢复篇 .图像修复Inpainting篇之后,继续盘点CVPR 2020 中底层图像处理技术中非常重要的一块:图像质量评价(Image Quality As ...
- CVPR 2020 论文大盘点-语义分割篇
图像分割应用广泛,在CVPR 2020 论文中所占比例很高,可说是一大热门,有110多篇相关论文,本文盘点CVPR 2020 所有语义分割(Semantic Segmentation)相关论文(文末有 ...
- CVPR 2020 论文大盘点-动作识别篇
本文盘点所有CVPR 2020 动作识别(Action Recognition )相关论文,该方向也常被称为视频分类(Video Classification ).从后面的名字可以看出该任务就是对含人 ...
- ECCV 2020 论文大盘点-场景解析篇
场景解析是一种特殊的语义分割,对整幅场景图像进行语义像素标注,典型应用是自动驾驶领域的道路环境的语义分割. 本文盘点 ECCV 2020 中所有场景解析(Scene Parsing)相关的3篇论文. ...
- CVPR 2020 论文大盘点-抠图Matting篇
抠图 (Image Matting)是一个非常有趣的领域,它的任务是对图像前景像素的不透明度(alpha 通道)进行计算,方便后续的图像合成编辑. 传统的Matting方法需要输入三色图(Trimap ...
- ECCV 2020 论文大盘点-实例分割篇
本文盘点 ECCV 2020 中所有实例分割(Instance Segmentation)相关论文,其中 oral 2 篇, 9 篇论文开源或将开源. 下载包含这些论文的 ECCV 2020 所有论文 ...
- CVPR 2020 论文大盘点—目标跟踪篇
本文盘点CVPR 2020 所有目标跟踪(object tracking)相关论文,总计33篇,因为跟踪相关的技术很多,这里单指具体目标的跟踪,不涉及点的跟踪(如人体关键点跟踪,会另有总结). 最大的 ...
- ECCV 2020 论文大盘点-目标跟踪篇
本文盘点ECCV 2020 所有与跟踪相关的研究,单指目标的跟踪,不涉及人体姿态等点的跟踪,总计19篇文章,其中12篇开源或者将开源. 其中多目标跟踪.单目标跟踪.对抗学习+目标跟踪研究工作较多.其中 ...
最新文章
- python爬虫项目-33个Python爬虫项目实战(推荐)
- JSP_include指令和lt;jsp:includegt;
- 【实习】今日头条【抖音火山】后台开发实习生
- Request登录案例
- 年薪50-80万 | 海南省崖州湾种子实验室海外优青招聘公告
- PowerShell 开启无线热点
- Ubuntu 12.04 用户安装Chromium
- 清理SharePoint 2010的SQL Server 2008 R2日志数据库的方法
- 王思祺2015080360030的第一次作业完全版
- 分享一个Latex一页纸简历模板(中英文)
- cad等比例缩放快捷键_cad等比例缩放快捷键
- 如何在Web前端实现CAD图文字全文搜索功能之技术分享
- 360全景倒车影像怎么看_最近淘了一个360度全景倒车影像-4路行车记录仪监控录像,和大家分享一下...
- 通过SetWindowsHookEx实现跨进程子类化
- excel中怎么拆分表格
- Github连接不上问题
- Vulnhub 靶机 VulnOSv2 write up opendocman cms 32075 sql注入 账号密码 ssh连接 37292.c 脏牛提权
- 微信公众号里放XLS链接教程
- 鸟哥的Linux私房菜(服务器)- 第十九章、主机名控制者: DNS 服务器
- APP推广—区分推广渠道解决方案
热门文章
- uniapp树组件优化 树节点设置单选,单击单选框可以选中多个 偶尔根节点点击后会隐藏整棵树
- 修改element ui tree 搜索功能,实现分级搜索,关键字高亮
- java 文件拷贝保留原来的属性_Java常用属性拷贝工具类使用总结
- expect 中的回车和换行
- Elasticsearch X-Pack许可证过期解决办法
- ALSA子系统(十七)------支持Type-C耳机驱动
- armbian 斐讯n1_斐讯N1安装Armbian
- 解决python的selenium打开edge浏览器,但是无法打开网页driver.get的方法
- python爬虫十二:初步使用Scrapy框架爬取数据
- SVN the working copy needs to be upgraded svn 解决办法