首先介绍一下我的环境配置,ubuntu16.04+cuda9.0,cudnn7.0,tensorflow-gpu=1.8

简介

其实对这个不是很有研究的,只是要参加一个阿里天池的比赛,然后用这个跑了一下,成绩很一般。

论文原地址:https://arxiv.org/abs/1704.03155v2

源码:https://github.com/argman/EAST

下载

主要是根据上面github源码进行的,首先下载源码,然后可以看到教程中的Download中训练好的模型以及slim resnet v1,如下图。

然后首先解压源码EAST,打开EAST-master/tmp文件,将上面下载好的模型解压就行了。

训练

首先得寻找一个数据集,然后我首先用的是icdar2015的数据集,上面教程也说了需要将image和label(.txt)修改一下名字,当然也可以修改代码,这里面我选择的是修改名字,代码如下:
import osdef rename(path, num=1):filelist = os.listdir(path)filelist = sorted(filelist)Newdir = 'label'if not os.path.exists(Newdir):os.makedirs(Newdir)for files in filelist:Olddir = os.path.join(path, files)if os.path.isdir(Olddir):continuefilename = os.path.splitext(files)[0]filetype = os.path.splitext(files)[1]if 'img_' + str(num) == filename:num = num + 1continueNew_name = 'img_' + str(num) + filetypeos.system("cp " + Olddir + ' ' + os.path.join(Newdir, New_name))num = num + 1if __name__ == "__main__":path = 'txt_1000'num = 1rename(path,num)

根据自己文件的名字进行修改的啦。

将修改好的images(.jpg)和(.txt)文件放在一起,重新起一个名字,如icdar2015也行吧,如图:

训练命令如下:

python multigpu_train.py --gpu_list=0 --input_size=512 --batch_size_per_gpu=14 --checkpoint_path=tmp/east_icdar2015_resnet_v1_50_rbox/ \
--text_scale=512 --training_data_path=icdar2015/ --geometry=RBOX --learning_rate=0.0001 --num_readers=24 \
--pretrained_model_path=tmp/resnet_v1_50.ckpt

注意:不要在文件前添加/会出现找不到Failed to find any matching files for /tmp/resnet_v1_50.ckpt

这里面可以修改一下训练多少次保存模型,打开mutigpu_train.py,找到作如下修改,因为电脑配置有点差。

tf.app.flags.DEFINE_integer('save_checkpoint_steps', 200, '')

还有一个就是如果不想要训练的话,可以直接Ctrl+c直接停止训练,虽然保存了模型,但是还是得在此训练一段时间才能达到之前的效果。再次训练的话,可以不用添加

--pretrained_model_path=tmp/resnet_v1_50.ckpt

使用tensorboard查看训练情况

cd ~/Documents/workspace/EAST-master/tmp/
tensorboard --logdir='east_icdar2015_resnet_v1_50_rbox'

测试

测试的话,里面images的名字还是有一点限制的,不过一般都不会有问题,主要是阿里天池比赛的images中有

T1..VkFqJdXXXXXXXX_!!0-item_pic.jpg.jpg。这里面需要稍微修改一下就可以了。

python eval.py --test_data_path=test_images/ --gpu_list=0 --checkpoint_path=tmp/east_icdar2015_resnet_v1_50_rbox/ \
--output_dir=test_out_images

EAST: An Efficient and Accurate Scene Text Detector(自然场景下文本识别)训练,测试相关推荐

  1. EAST: An Efficient and Accurate Scene Text Detector

    EAST: An Efficient and Accurate Scene Text Detector EAST:高效准确的场景文本检测器 [Abstract] 先前的场景文本检测方法已经在各种基准测 ...

  2. 【翻译】EAST: An Efficient and Accurate Scene Text Detector

    EAST: An Efficient and Accurate Scene Text Detector 论文地址 概要 以前的场景文本检测方法已经在各种基准上取得了有希望的表现.然而,即使配备深层神经 ...

  3. EAST: An Efficient and Accurate Scene Text Detector 论文阅读

    EAST: An Efficient and Accurate Scene Text Detector 论文阅读 Reference 正文 摘要 引言 相关工作 方法 算法 网络设计 标签生成 损失函数 ...

  4. EAST实现自然场景下文本检测tensorflow

    案例一:python+opencv+EAST做自然场景文本检测 链接:https://blog.csdn.net/luolan9611/article/details/81914251 案例二:高效准 ...

  5. 文本检测 论文阅读笔记之 Pixel-Anchor: A Fast Oriented Scene Text Detector with Combined Networks

    Pixel-Anchor: A Fast Oriented Scene Text Detector with Combined Networks 摘要:最近语义分割和通用对象检测框架已被场景广泛采用文 ...

  6. 1:MOST: A Multi-Oriented Scene Text Detector with Localization Refinement

    1.介绍 现代文本检测器能够捕捉各种不同挑战场景下的文本.然而,它们可能在处理极端横纵比和不同尺度时仍然检测不到文本实例 为了处理这些困难,我们在本文中提出了一个新的场景文本检测的新算法,该算法提出了 ...

  7. 端到端OCR算法:Towards Accurate Scene Text Recognition with Semantic Reasoning Networks(SRN)

    1.SRN网络结构 2.Backbone Network 3.Parallel Visual Attention Module(PVAM) 4.Global Semantic Reasoning Mo ...

  8. 基于深度学习的场景文本检测和识别(Scene Text Detection and Recognition)综述

    1. 引言 文字是人类最重要的创作之一,它使人们在时空上可以有效地.可靠的传播或获取信息. 场景中的文字的检测和识别对我们理解世界很有帮助,它应用在图像搜索.即时翻译.机器人导航.工业自动化等领域. ...

  9. EAST 自然场景文本检测

    自然场景文本检测是图像处理的核心模块,也是一直想要接触的一个方面. 刚好看到国内的旷视今年在CVPR2017的一篇文章:EAST: An Efficient and Accurate Scene Te ...

最新文章

  1. 无人驾驶中的 3D 目标检测技术
  2. 初学 Delphi 嵌入汇编[9] - asm 可以代替 begin
  3. glusterfs快速安装
  4. WEBI 中的参数传递
  5. VMware文件扩展名
  6. HDU4273(求三维凸包重心到表面的最短距离)
  7. IOS网络框架的Alamofire5.4高版本网络工具封装
  8. mac地址容量的作用_S6520X+MAC地址容量检查命令
  9. python调用存储过程怎么传多个参数_Python - pyodbc调用具有参数名称的存储过程...
  10. 音视频开发(9)--视频编解码的理论和实践
  11. Express 常用中间件 body-parser 实现解析
  12. java JDBC入门及案例演示
  13. priority_queue 优先队列 hdu裸题。
  14. python做单因素方差分析
  15. 禅道类似软件_推荐几款不错的项目管理软件
  16. python制作pdf电子书
  17. WIN7英文操作系统,中文语言包安装。及部分开发环境,软件中文乱码问题解决。
  18. 微信小程序开发工具显示网络错误
  19. matlab polyfit和polyval函数的使用
  20. 你画过哪些好玩儿的作品?

热门文章

  1. javascript中动态加载js、vbs脚本或者css样式表
  2. UML建模【转http://www.cnblogs.com/gaojun/archive/2010/04/27/1721802.html】
  3. Python学习_进程multiprocessing 多进程 协程
  4. python 学习总结----正则表达式
  5. SQL Server初探
  6. Spring3中js/css/jpg/gif等静态资源无法找到(No mapping found for HTTP request with URI)问题解决(转)...
  7. JMeter察看结果树的显示模式详解
  8. c语言程序改错输入5结果为15,《C语言程序设计教学课件》程序改错(自我总结).doc...
  9. PHP地图规划骑行路径,骑行路线规划
  10. linux uucp 改为 root,ubuntu 10.04 /etc目录下找不到vsftpd.user_list和vsfepd.ftpusers两个文件?...