ABCNet训练测试自定义数据集

ABCNet:基于自适应贝塞尔曲线的实时端到端自然场景文字检测及识别网络

论文推荐ABCNet

论文链接 : https://arxiv.org/abs/2002.10200
官方开源代码: https://github.com/aim-uofa/AdelaiDet

论文是2020 CVPR 收录, 贡献1)提出采用贝塞尔曲线来拟合任意形状文本，2）提出贝塞尔对齐方式更准确地提取文本实例．

环境配置和运行demo.py遇到的问题

系统配置：ubuntu16.04 + cuda10.0
因该项目基于最新的detecron2构建，需要torch>=1.3.建议隔离一个虚拟环境安装相应的库．

Q1 运行python setup.py build develop编译adet库时出现,　/usr/bin/ld: cannot find -lcudart

问题原因：安装的/usr/local/cuda-10.0/lib64/中cudart库不完整．
ls -lh /usr/local/cuda-10.0/lib64 | grep cudart
完整的lib64目录下包含四个文件：

libcudart.so
libcudart.so.10.0
libcudart.so.10.0.130
libcudart_static.a
解决方案：重装cuda-10.0, 或者将某个安裝完整的cuda10.0的这几个文件拷贝到对应目录即可．
再重新运行之前编译命令，编译成功后会如图所示完成AdelaiDet安装.

Q2 运行ABCnet的测试代码：python -m e demo/demo.py --config-file configs/BAText/CTW1500/attn_R_50.yaml --input totaltext/Images/Test --opts MODEL.WEIGHTS test/ctw1500_attn_R_50.pth出现如下问题
QObject::moveToThread: Current thread (0x55f48724d2a0) is not the object’s thread (0x55f485279c70

解决方案：未解决．可指定"–output"来将测试结果输出到目录，暂时避免这个问题．

基于AdelaiDet训练自定义ABCNet

数据集

abcnet数据标签生成
自定义abcnet的数据集，以labelme的目标框标注为例生成．转换脚本百度云提取码: 42v4
数据集结构

data└── train├── 0001.jpg├── 0002.jpg└── 0003.jpg└── test├──1001.jpg├── 1002.jpg└── 1003.jpg└── annotations├── train.json├── test.json

修改相关配置文件进行训练

将制作好的data数据目录放在"AdelaiDet/datasets"目录
修改"adet/data/builtin.py"中的_PREDEFINED_SPLITS_TEXT值来指定训练测试数据，注意这里默认是在datasets下的，所以它们的相对路径都是从下层目录开始的．

_PREDEFINED_SPLITS_TEXT = {
"totaltext_train": ("totaltext/train_images", "totaltext/train.json"),
"totaltext_val": ("totaltext/test_images", "totaltext/test.json"),
...
"abcnet_train": ("data/train", "data/annotations/train.json"),
"abcnet_test": ("data/test", "data/annotations/test.json"),}

在需要训练的配置文件中指定数据集即可．以configs/BAText/CTW1500/Base-CTW1500.yaml为例，
```
DATASETS:
# detail cfg：　AdelaiDet/adet/data/builtin.pyTRAIN: ("abcnet_train",)TEST: ("abcnet_test",)
```
训练 OMP_NUM_THREADS=1 python tools/train_net.py --config-file configs/BAText/TotalText/attn_R_50.yaml --num-gpus 1
“args”: ["–config-file",“configs/BAText/CTW1500/attn_R_50.yaml”,
“–input” ,“totaltext/Images/Test”,
“–output”,“output/total”,
// “–webcam”,
“–opts”, “MODEL.WEIGHTS”, “pretrained/ctw1500_attn_R_50.pth”,
推理python demo/demo.py ---config-file configs/BAText/TotalText/attn_R_50.yaml –input datasets/data/test --output res --opts “MODEL.WEIGHTS output/batext/ctw1500/attn_R_50/model_0009999.pth

样例展示

测试图片为total-text测试图

当前的不足：训练了中文手写和英文印刷体，比较直观的问题是测试出现了比较多的漏检，密集文本行间会出现预测的贝塞尔曲线交叉问题．即有密集文本粘连问题．

…