EAST: An Efficient and Accurate Scene Text Detector(自然场景下文本识别)训练,测试
首先介绍一下我的环境配置,ubuntu16.04+cuda9.0,cudnn7.0,tensorflow-gpu=1.8
简介
其实对这个不是很有研究的,只是要参加一个阿里天池的比赛,然后用这个跑了一下,成绩很一般。
论文原地址:https://arxiv.org/abs/1704.03155v2
源码:https://github.com/argman/EAST
下载
主要是根据上面github源码进行的,首先下载源码,然后可以看到教程中的Download中训练好的模型以及slim resnet v1,如下图。
然后首先解压源码EAST,打开EAST-master/tmp文件,将上面下载好的模型解压就行了。
训练
import osdef rename(path, num=1):filelist = os.listdir(path)filelist = sorted(filelist)Newdir = 'label'if not os.path.exists(Newdir):os.makedirs(Newdir)for files in filelist:Olddir = os.path.join(path, files)if os.path.isdir(Olddir):continuefilename = os.path.splitext(files)[0]filetype = os.path.splitext(files)[1]if 'img_' + str(num) == filename:num = num + 1continueNew_name = 'img_' + str(num) + filetypeos.system("cp " + Olddir + ' ' + os.path.join(Newdir, New_name))num = num + 1if __name__ == "__main__":path = 'txt_1000'num = 1rename(path,num)
根据自己文件的名字进行修改的啦。
将修改好的images(.jpg)和(.txt)文件放在一起,重新起一个名字,如icdar2015也行吧,如图:
训练命令如下:
python multigpu_train.py --gpu_list=0 --input_size=512 --batch_size_per_gpu=14 --checkpoint_path=tmp/east_icdar2015_resnet_v1_50_rbox/ \
--text_scale=512 --training_data_path=icdar2015/ --geometry=RBOX --learning_rate=0.0001 --num_readers=24 \
--pretrained_model_path=tmp/resnet_v1_50.ckpt
注意:不要在文件前添加/会出现找不到Failed to find any matching files for /tmp/resnet_v1_50.ckpt
这里面可以修改一下训练多少次保存模型,打开mutigpu_train.py,找到作如下修改,因为电脑配置有点差。
tf.app.flags.DEFINE_integer('save_checkpoint_steps', 200, '')
还有一个就是如果不想要训练的话,可以直接Ctrl+c直接停止训练,虽然保存了模型,但是还是得在此训练一段时间才能达到之前的效果。再次训练的话,可以不用添加
--pretrained_model_path=tmp/resnet_v1_50.ckpt
使用tensorboard查看训练情况
cd ~/Documents/workspace/EAST-master/tmp/
tensorboard --logdir='east_icdar2015_resnet_v1_50_rbox'
测试
测试的话,里面images的名字还是有一点限制的,不过一般都不会有问题,主要是阿里天池比赛的images中有
T1..VkFqJdXXXXXXXX_!!0-item_pic.jpg.jpg。这里面需要稍微修改一下就可以了。
python eval.py --test_data_path=test_images/ --gpu_list=0 --checkpoint_path=tmp/east_icdar2015_resnet_v1_50_rbox/ \
--output_dir=test_out_images
EAST: An Efficient and Accurate Scene Text Detector(自然场景下文本识别)训练,测试相关推荐
- EAST: An Efficient and Accurate Scene Text Detector
EAST: An Efficient and Accurate Scene Text Detector EAST:高效准确的场景文本检测器 [Abstract] 先前的场景文本检测方法已经在各种基准测 ...
- 【翻译】EAST: An Efficient and Accurate Scene Text Detector
EAST: An Efficient and Accurate Scene Text Detector 论文地址 概要 以前的场景文本检测方法已经在各种基准上取得了有希望的表现.然而,即使配备深层神经 ...
- EAST: An Efficient and Accurate Scene Text Detector 论文阅读
EAST: An Efficient and Accurate Scene Text Detector 论文阅读 Reference 正文 摘要 引言 相关工作 方法 算法 网络设计 标签生成 损失函数 ...
- EAST实现自然场景下文本检测tensorflow
案例一:python+opencv+EAST做自然场景文本检测 链接:https://blog.csdn.net/luolan9611/article/details/81914251 案例二:高效准 ...
- 文本检测 论文阅读笔记之 Pixel-Anchor: A Fast Oriented Scene Text Detector with Combined Networks
Pixel-Anchor: A Fast Oriented Scene Text Detector with Combined Networks 摘要:最近语义分割和通用对象检测框架已被场景广泛采用文 ...
- 1:MOST: A Multi-Oriented Scene Text Detector with Localization Refinement
1.介绍 现代文本检测器能够捕捉各种不同挑战场景下的文本.然而,它们可能在处理极端横纵比和不同尺度时仍然检测不到文本实例 为了处理这些困难,我们在本文中提出了一个新的场景文本检测的新算法,该算法提出了 ...
- 端到端OCR算法:Towards Accurate Scene Text Recognition with Semantic Reasoning Networks(SRN)
1.SRN网络结构 2.Backbone Network 3.Parallel Visual Attention Module(PVAM) 4.Global Semantic Reasoning Mo ...
- 基于深度学习的场景文本检测和识别(Scene Text Detection and Recognition)综述
1. 引言 文字是人类最重要的创作之一,它使人们在时空上可以有效地.可靠的传播或获取信息. 场景中的文字的检测和识别对我们理解世界很有帮助,它应用在图像搜索.即时翻译.机器人导航.工业自动化等领域. ...
- EAST 自然场景文本检测
自然场景文本检测是图像处理的核心模块,也是一直想要接触的一个方面. 刚好看到国内的旷视今年在CVPR2017的一篇文章:EAST: An Efficient and Accurate Scene Te ...
最新文章
- 无人驾驶中的 3D 目标检测技术
- 初学 Delphi 嵌入汇编[9] - asm 可以代替 begin
- glusterfs快速安装
- WEBI 中的参数传递
- VMware文件扩展名
- HDU4273(求三维凸包重心到表面的最短距离)
- IOS网络框架的Alamofire5.4高版本网络工具封装
- mac地址容量的作用_S6520X+MAC地址容量检查命令
- python调用存储过程怎么传多个参数_Python - pyodbc调用具有参数名称的存储过程...
- 音视频开发(9)--视频编解码的理论和实践
- Express 常用中间件 body-parser 实现解析
- java JDBC入门及案例演示
- priority_queue 优先队列 hdu裸题。
- python做单因素方差分析
- 禅道类似软件_推荐几款不错的项目管理软件
- python制作pdf电子书
- WIN7英文操作系统,中文语言包安装。及部分开发环境,软件中文乱码问题解决。
- 微信小程序开发工具显示网络错误
- matlab polyfit和polyval函数的使用
- 你画过哪些好玩儿的作品?
热门文章
- javascript中动态加载js、vbs脚本或者css样式表
- UML建模【转http://www.cnblogs.com/gaojun/archive/2010/04/27/1721802.html】
- Python学习_进程multiprocessing 多进程 协程
- python 学习总结----正则表达式
- SQL Server初探
- Spring3中js/css/jpg/gif等静态资源无法找到(No mapping found for HTTP request with URI)问题解决(转)...
- JMeter察看结果树的显示模式详解
- c语言程序改错输入5结果为15,《C语言程序设计教学课件》程序改错(自我总结).doc...
- PHP地图规划骑行路径,骑行路线规划
- linux uucp 改为 root,ubuntu 10.04 /etc目录下找不到vsftpd.user_list和vsfepd.ftpusers两个文件?...