一、git上star比较多的项目

1.https://github.com/breezedeus/cnocr  *****

1.https://github.com/tmbdev/ocropy

2. https://github.com/YCG09/chinese_ocr *****

3. https://github.com/tesseract-ocr/tesseract  *****

4. https://github.com/chineseocr/darknet-ocr

https://github.com/chineseocr/chineseocr

5. https://github.com/Sierkinhane/crnn_chinese_characters_rec

https://blog.csdn.net/Sierkinhane/article/details/82857572 文字识别(OCR)CRNN(基于pytorch、python3) 实现不定长中文字符识别

*6. 好 xiaomaxiao/keras_ocr

7. tianzhi0549/CTPN caffe 3年前的

8. ctpn的pytorch实现: opconty/pytorch_ctpn

9. ctpn的TF实现: eragonruan/text-detection-ctpn

*好 10.psenet的实现,最新的,pytorch: whai362/PSENet

11.学习crnn weslynn/AlphaTree-graphic-deep-neural-network

*12.crnn pytorch: meijieru/crnn.pytorch

*13ICDAR2019 第一名 zhang0jhon/AttentionOCR

14. kuangshi research in text detection and recognition using PyTorch 1.2. Megvii-CSG/MegReader

15. a PyToch implementation of "Real-time Scene Text Detection with Differentiable Binarization". MhLiao/DB

16. 论文集Scene Text Detection and Recognition: must-read papersJyouhou/SceneTextPapers

17.ICDAR2019 ArT 的第一名,清华:this is the code repository for our algorithm that ranked No.1 on ICDAR2019 Robust Reading Challenge on Arbitrary-Shaped Text(Latin scripts). Our team name is PKU Team Zero. Jyouhou/ICDAR2019-ArT-Recognition-Alchemy

18.ICDAR2019 ReCTS脱机单字识别任务部分代码,TF代码,复现改进了alexnet resnet等网络,进行了图像增强、分割,比赛结果排名第11。 HuiyanWen/ICDAR2019-ReCTS

19.Faster R-CNN and Mask R-CNN in PyTorch 1.0 facebookresearch/maskrcnn-benchmark

二、 数据集

6.1 https://blog.csdn.net/Sierkinhane/article/details/82857572 先下载360万中文数据集:https://pan.baidu.com/s/1ufYbnZAZ1q0AlK7yZ08cvQ 训练之前首先制作数据集,因为360万的中文数据集制作成lmdb格式的数据有十几G,就没直接放到Github中。 先下载360万中文数据集

6.2 https://blog.csdn.net/monk1992/article/details/99670559 数据集:https://pan.baidu.com/s/1QkI7kjah8SPHwOQ40rS1Pw (密码:lu7m)

共约364万张图片,按照99:1划分成训练集和验证集,数据利用中文语料库(新闻 + 文言文),通过字体、大小、灰度、模糊、透视、拉伸等变化随机生成.包含汉字、英文字母、数字和标点共5990个字符,每个样本固定10个字符,字符随机截取自语料库中的句子.图片分辨率统一为280x32. 图片解压后放置到train/images目录下,描述文件放到train目录下

6.3 https://github.com/xiaofengShi/CHINESE-OCR

训练数据集补充

列举可用于文本检测和识别领域模型训练的一些大型公开数据集, 不涉及仅用于模型fine-tune任务的小型数据集。

Chinese Text in the Wild(CTW): 该数据集包含32285张图像,1018402个中文字符(来自于腾讯街景), 包含平面文本,凸起文本,城市文本,农村文本,低亮度文本,远处文本,部分遮挡文本。图像大小2048*2048,数据集大小为31GB。以(8:1:1)的比例将数据集分为训练集(25887张图像,812872个汉字),测试集(3269张图像,103519个汉字),验证集(3129张图像,103519个汉字)。

文献链接:https://arxiv.org/pdf/1803.00085.pdf
数据集下载地址:https://ctwdataset.github.io/

Reading Chinese Text in the Wild(RCTW-17): 该数据集包含12263张图像,训练集8034张,测试集4229张,共11.4GB。大部分图像由手机相机拍摄,含有少量的屏幕截图,图像中包含中文文本与少量英文文本。图像分辨率大小不等。

http://mclab.eic.hust.edu.cn/icdar2017chinese/dataset.html
文献:http://arxiv.org/pdf/1708.09585v2

6.4 RCTW数据集2017

http://rctw.vlrlab.net/dataset/

RCTW数据集主要由场景中文文字构成,总共包含了12,034张图片,其中训练集8034张,测试集4000张。比赛分为文字检测和端到端文字识别两部分。MLT数据集由6个文种共9种语言的文字图片构成,共18,00张图片。该比赛包括了文字检测、语种识别以及文字检测加语种识别三个任务。链接:https://zhuanlan.zhihu.com/p/37678860

6.5 文字的检测与识别资源截止2017 https://blog.csdn.net/u010183397/article/details/56497303

6.8 我们在2012年发布了MSRA-TD500这个数据集,虽然数据量比较小,但是含有英文和中文两种语言。

三. 知乎上的参考

  1. ocr - 搜索结果 - 知乎

2. 汉字OCR,文档识别,什么方法最好?

CTC的方式,CTPN+CRNN 都开源了, 可以了解一下,传统的如果是印刷体的话,应该难度也不大,只是在切割的时候需要一些技巧避免将汉字的偏旁切开。

不同场景下的ocr识别,肯定方法不一样的。对于文档来说,如果排版比较统一,纯文本,没有其他东西的,ctpn效率和效果上会好一些。自然场景的话,现在基于attention的end-to-end模型是比较好用的,比如tensorflow/models感觉比较通用的还是目标检测+识别吧,基本各个场景都适用,只不过目标检测对于长文本,行间距非常小的文本训练起来没那么容易。还有,如果文本存在倾斜的情况,attention-ocr基本没什么影响,用目标检测也有带角度的方法,但ctpn就不太行了。

3. 金天:TensorFlow 2.0 中文手写字识别(汉字OCR)

4. 法大大:基于深度学习的汉字识别实现思路 | 干货

5. 陈小白:【Pytorch】CNN实现手写汉字识别(数据集制作,网络搭建,训练验证测试全部代码)

6. https://blog.csdn.net/lovebyz/article/details/84959818 主流深度学习OCR文字识别方法对比:Tesseract(LSTM)、CTPN+CRNN、Densenet

(一)Tesseract(LSTM)和Densenet

(二)CTPN+CRNN:CHINESE-OCR 和 Tesseract(LSTM) 代码地址:https://github.com/xiaofengShi

7. https://blog.csdn.net/monk1992/article/details/99670559 chinese-ocr自然场景下不定长文字识别(ctpn + densenet)

8. 天池竞赛 ICPR MTWI 2018 挑战赛二:网络图像的文本检测 https://tianchi.aliyun.com/competition/entrance/231651/forum

9. 程程:【领域报告】图像OCR年度进展|VALSE2018之十一 微信公众号:深度学习大讲堂

程程:【领域报告】行人再识别年度进展 |VALSE2018之十 Person ReID(Person Re-identification)

程程:俞扬:“审时度势”的高效强化学习

程程:白翔:趣谈“捕文捉字”-- 场景文字检测 | VALSE2017之十 华南理工大学金连文老师研究组提出了一个基于Faster R-CNN的方法,针对文字形状和一般物体形状的区别,对其进行了完善。

程程:让机器“一叶知秋”:弱监督视觉语义分割|VALSE2018之九

程程的主页,多个ocr的内容链接:知乎用户

***10. 极好 深度学习-TextDetection , CTC算法原理 CTC算法原理

***11. 好 OCR-从零开始 传统方案,预处理的代码,深度的方案

***12. 极好 深度学习-OCR_Overview

一般目标检测器(SSDYOLO 和 DenseBox )为基础,例如 TextBoxesFCRN 以及 EASTSegLink等,它们直接预测候选的边界框。

以语义分割为基础,例如PixelLinkFTSN,它们生成分割映射,然后通过后处理生成最终的文本边界框。

视觉领域常规物体检测方法(SSDYOLOFasterRCNN等)直接套用于文字检测任务效果并不理想, 主要原因如下:

·相比于常规物体,文字行长度、长宽比例变化范围很大。
·文本行是有方向性的。常规物体边框BBox的四元组描述方式信息量不充足。
·自然场景中某些物体局部图像与字母形状相似,如果不参考图像全局信息将有误报。
·有些艺术字体使用了弯曲的文本行,而手写字体变化模式也很多。
·由于丰富的背景图像干扰,手工设计特征在自然场景文本识别任务中不够鲁棒。

针对上述问题根因,近年来出现了各种基于深度学习的技术解决方案。它们从特征提取、区域建议网络(RPN)、多目标协同训练、Loss改进、非极大值抑制(NMS)、半监督学习等角度对常规物体检测方法进行改造,极大提升了自然场景图像中文本检测的准确率。例如:

·CTPN方案中,用BLSTM模块提取字符所在图像上下文特征,以提高文本块识别精度。
·RRPN等方案中,文本框标注采用BBOX +方向角度值的形式,模型中产生出可旋转的文字区域候选框,并   在边框回归计算过程中找到待测文本行的倾斜角度。
·DMPNet等方案中,使用四边形(非矩形)标注文本框,来更紧凑的包围文本区域。
·SegLink将单词切割为更易检测的小文字块,再预测邻近连接将小文字块连成词。
·TextBoxes等方案中,调整了文字区域参考框的长宽比例,并将特征层卷积核调整为长方形,从而更适合检测出细长型的文本行。
·FTSN方案中,作者使用Mask-NMS代替传统BBOX的NMS算法来过滤候选框。
·WordSup方案中,采用半监督学习策略,用单词级标注数据来训练字符级文本检测模型。

13. SIGAI:自然场景文本检测识别技术综述

14. 燕小花:综述:基于深度学习文本检测的十全大补丸

15. 有pytorch代码地址FasterRCNN: TeddyZhang:目标检测:Faster R-CNN(NIPS 2015)

16. 文本检测论文综述 lilicao - 博客园

17. 2017-2018_OCR_papers汇总 - lilicao - 博客园

18. 文字检测分类方法,库,及部分代码: 文字检测与识别数据库整理【持续更新】 - lilicao - 博客园

19. 文本检测的最新进展 小石头的码疯窝

20. 仅PSENet有代码,曲线文本 燕小花:2019CVPR文本检测综述

*** 21. 好,有各方法的综合评价: 燕小花:综述:基于深度学习文本检测的十全大补丸

各模型在ICDAR2015数据集上的测试结果。

我用了ctpn,效果已经能够接受了。没想到masktextspotter表现这么好。TextBoxes,EAST,CTPN,PixelLink,SegLink,RRPN,R2CNN,RRD,ITN都有开源的。LSPR这篇文章的,是SLPR,我写错了

***22. 好 第一名 ICDAR2019, 有docker: zhang0jhon/AttentionOCR

22.1 TF的最好的coco的预训练模型,best open source TF modelon COCO dataset.: https://github.com/tensorpack/tensorpack/tree/master/examples/FasterRCNN

https://rrc.cvc.uab.es/?ch=12

23. *较好,CNN及物体检测网络的发展,基于深度学习的目标检测及场景文字检测研究进展 2018-03 https://blog.csdn.net/u013250416/article/details/79591263

****25.极好 很好的一个技术博客:aiuai.cn 一个较好的detectron 2的网站

25.1  aiuai.cn/aifram951.html  计算机视觉八大任务全概述
25.2  aiuai.cn/aifram931.html  coco等开源数据集
25.3  aiuai.cn/aifram935.html  基于Tesseract的英文文本识别
25.4  aiuai.cn/aifram961.html  Git项目-TextBoxes系列文字检测, 基于SSD
25.5  https://aiuai.cn/aifarm897.html 深度学习的7种架构范例及对应的Tensorflow例示
25.6  https://aiuai.cn/aifarm887.html  论文阅读 - Feature Pyramid Networks for Object Detection
***25.7  https://aiuai.cn/aifarm862.html 目标检测算法Faster R-CNN, R-FCN, SSD, FPN, RetinaNet 和 YOLOv3的对比
25.8  https://aiuai.cn/aifarm856.html 目标检测评测指标mAP及计算[译]
25.9  https://aiuai.cn/aifarm854.html COCO 数据集目标检测等相关评测指标
25.10 https://aiuai.cn/aifarm827.html  中国电信使用 TensorFlow 实现人工智能
25.11 https://aiuai.cn/aifarm807.html Python - 图片上显示中文字符
25.12 https://aiuai.cn/aifarm796.html 基于 Keras 实现的图书推荐系统
25.13 https://aiuai.cn/aifarm227.html Github项目 - Mask R-CNN 的 Keras 实现看到30/52

三、其他竞赛

  1. "合肥高新杯"心电人机智能大赛 https://tianchi.aliyun.com/competition/entrance/231754/introduction

JavisPeng开源的优质baseline https://github.com/JavisPeng/ecg_pytorch

github https://github.com/RandomWalk-xzq/Hefei_ECG_TOP1

2. 燕小花:2018ai_challenger之农作物病害检测比赛总结

四 docker安装

1. https://blog.csdn.net/haveqing/article/details/90676055

lsb_release -a
uname -r
uname -a下载地址
tgz
https://download.docker.com/linux/static/stable/x86_64/rpm
https://download.docker.com/linux/centos/7/x86_64/stable/Packages/安装
上传文件tar -xvf docker-18.06.1-ce.tgzcp docker/* /usr/bin/dockerd &测试[root@centos75-1 ~]# docker -v
Docker version 18.06.1-ce, build e68fc7a参考:Linux下离线安装Docker
https://www.cnblogs.com/luoSteel/p/10038954.htmllinux如何成功地离线安装docker
https://blog.csdn.net/u011681409/article/details/82695087官方安装文档https://docs.docker.com/install/linux/docker-ce/binaries/#install-static-binaries

OCR 上git上star比较多的项目相关推荐

  1. git 项目代码上传到服务器上,git 上传代码到服务器

    一.建立本地git仓库 1.cd到你项目根目录下 git init 二.将本地所有文件添加到暂存区 git add . . 表示所有文件 如果想添加项目中的指定文件,那就把.改为指定文件名或者目录即可 ...

  2. 使用git上传代码到github

    1.      github上创建项目 github是一个服务器托管商,我们写好的代码可以上传到github上面去 登录github的官方网站:http://github.com/ 注册一个自己的用户 ...

  3. 用Git上传删除本地项目到gitlab---图文解析

    Git简介 Git是目前世界上最先进的分布式版本控制系统 故事起源:如果你用Microsoft Word写过长篇大论,那你一定有这样的经历: 想删除一个段落,又怕将来想恢复找不回来怎么办?有办法,先把 ...

  4. 牛X,试用了下 GitHub 上 2 万 Star 的第一抢票神器,3 秒钟抢到!

    点击上方"视学算法",选择"星标" 车栗子 发自 凹非寺 量子位 报道 | 公众号 QbitAI 春节抢票正在如火如荼的进行,过年回家那肯定需要抢票,每年的抢票 ...

  5. JAE京东云引擎Git上传管理代码教程和京东云数据库导入导出管理

    文章目录 Git管理准备工作 Git工具上传代码 发布代码装程序 mywebsql管理 京东云引擎小结 JAE京东云引擎是京东推出的支持Java.Ruby.Python.PHP.Node.js多语言. ...

  6. 使用Git上传项目到码云仓库

    初始化本地库 git init 管理到远程仓库 git remote add origin "你的项目地址(刚才在码云创建的项目的地址)" # 注:项目地址形式为:https:// ...

  7. 使用git 上传自己代码

    正确使用git上传项目代码的方法. git init git add . git remote add origin git@github.com:USERNAME/XXXXX.git git com ...

  8. idea从git上拉取并管理项目

    idea从git上拉取并管理项目 1:idea从git上拉取项目 (1)FILE --> New --> Project from Version Control --> Git ( ...

  9. Git使用入门 - 在Git上新建项目

    2019独角兽企业重金招聘Python工程师标准>>> Git的使用很简单,第一次在客户端获取代码时,直接通过各种IDE的clone方法,可以把Git上的工程get下来即可.后续使用 ...

最新文章

  1. 截屏悬浮软件_【第295期】FV悬浮球,一款全能悬浮球
  2. oracle 文件写 n r,文本模式读写文件中\r和\n的问题
  3. HandlerInterceptor拦截器使用总结
  4. Python之数据分析(numpy中的多项式拟合)
  5. linux内核循环,模仿Linux内核kfifo实现的循环缓存
  6. Devexpress 10.1.6 源代码重新编译成功(DXperience 10.1.6 重新编译)附所有需要用到的资源下载地址 (收藏)...
  7. 8.2学长讲解(数论入门)
  8. miui kindle安装目录
  9. 【Leetcode】347. 前 K 个高频元素
  10. 如何将手机的网络代理给电脑 win10
  11. 哮喘模型造模构建制备 治疗哮喘新药的药效学评估
  12. shell sed(流编辑器)的基本使用
  13. Mybatis:Mybatis分页插件
  14. python数据分析实战基础_Python数据分析实战基础(二):清洗常用4板斧
  15. 大数据-安装 Hadoop3.1.3 详细教程-单机/伪分布式配置(Centos)
  16. 目标转化出价多少_头条信息流广告目标转化出价(ocpc出价)常见问题讲解
  17. 微信小程序富文本中图片溢出,使用max-width无效
  18. 如何把一个3D的stp文件导入AD做边框
  19. 前端工作总结199-对ref的理解
  20. stm32编译错误error: #20: identifier “USART_IT_RXNE“ is undefined

热门文章

  1. 【英语语法入门】第01讲 语序和五种基本句式
  2. Scrapy爬虫进阶操作之CrawlSpider(三)血崩啊
  3. 云计算机能否移动网络,移动云计算能实现吗?
  4. 亚马逊erp是什么?大卖为何钟爱积加ERP系统
  5. 光谱反射率重建方法小总结
  6. AUTOMATE THE BORING STUFF WITH PYTHON读书笔记 - 第12章:WEB SCRAPING
  7. 无向图有向图的邻接表法建立
  8. Java堆转储Dump文件的几种方法,java高级程序员面试笔试
  9. 智能ABC一般人不知道的五招(转贴)
  10. CMU运动捕捉数据处理 MOCAP(一)——数据介绍