图文可以参考
crnn就是卷积加lstm加ctc,cnn用于提取特征,lstm用于提取序列特征,ctc用来解决训练时标签对齐问题,假如没有ctc,经过lstm输出的维度为w×n×c,其中w为输入进lstm的特征图宽度,n为batch size,c为类别数,如果直接以softmax输出,我们需要为每一个时刻的序列都标注一个标签,而每一个序列在原图上会对应一个区域,这样我们会为一个图片标注w个标签,我们在标注标签的时候还需要计算每一个序列在原图对应的区域,是相当麻烦的,ctc提出了一种计算方法,引入blank,如果输出序列中相邻的字符相同,那么就合并,如果相同但是中间有个空白符,就保留,这样就会输出一个标签序列,即为P(Π|x),意思是在x的条件下输出为Π的概率,在ctc中就是每个序列的预测概率乘积,但是输出序列可能会和标签序列的长度不同,ctc计算思想就是,计算所有由Π到达标签l的的概率总和的-ln,简单来说就是-ln(p(l|x)),l是标签,x对应lstm输出。
这里我并没有去解释Π怎么变成l的,实际中会用到动态规划的算法,求编辑距离,比较麻烦,这些足够应付面试提问了

关于crnn中的ctc相关推荐

  1. 谁给讲讲语音识别中的CTC方法的基本原理?

    以下是经论智编译的原文: />CTC识别效果示意图CTC识别效果示意图 简介 谈及语音识别,如果这里有一个剪辑音频的数据集和对应的转录,而我们不知道怎么把转录中的字符和音频中的音素对齐,这会大大 ...

  2. 语音识别中的CTC算法的基本原理解释

    原标题:语音识别中的CTC算法的基本原理解释 目前主流的语音识别都大致分为特征提取,声学模型,语音模型几个部分.目前结合神经网络的端到端的声学模型训练方法主要CTC和基于Attention两种. 本文 ...

  3. 10万元奖金语音识别赛进行中!CTC 模型 Baseline 助你轻松上分

    随着互联网.智能硬件的普及,智能音箱和语音助手已经深入人们的日常生活,家居场景下的语音识别技术已成为企业和研究机构竞相追逐的关键技术. 目前,由北京智源人工智能研究院.爱数智慧.biendata 共同 ...

  4. 语音识别 Speech recognition 中的 CTC cost,CTC损失函数(学习心得)

    seq2seq 模型在语音识别方面的应用让人激动! 什么是语音识别问题呢? 气压随着时间推移不断变化,产生了音频 人的耳朵可以衡量不同频率和强度的声波 输入整个原始的音频片段 raw audio cl ...

  5. 【项目实践】中英文文字检测与识别项目(CTPN+CRNN+CTC Loss原理讲解)

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自:opencv学堂 OCR--简介 文字识别也是图像领域一 ...

  6. 基于CRNN+CTC的改进图像文本识别算法

    上一次介绍了基于改进EAST(An Efficient and Accurate Scene Text Detector)算法的文本定位算法这次我来介绍基于卷积循环神经网络CRNN (Convolut ...

  7. 一文读懂CRNN+CTC文字识别

    转自:https://zhuanlan.zhihu.com/p/43534801 文字识别也是图像领域一个常见问题.然而,对于自然场景图像,首先要定位图像中的文字位置,然后才能进行识别. 所以一般来说 ...

  8. 一文读懂CRNN+CTC(Connectionist Temporal Classification)文字识别

    先总结一把CTC,下面文档太长: CTC是一种Loss计算方法,用CTC代替Softmax Loss,TF和pytorch都有对CTC的实现,从而解决OCR或者语音识别中序列对齐的问题.CTC特点: ...

  9. 华为开源自研AI框架昇思MindSpore模型体验:ModelZoo中的CRNN

    目录 一.环境准备 1.进入ModelArts官网 2.使用CodeLab体验Notebook实例 二.脚本说明 三.数据集 四.训练过程 五.评估过程 六.推理过程 CRNN描述 CRNN是一种基于 ...

最新文章

  1. 13个Pandas技巧
  2. python怎么读excel文件-python如何读写excel文件
  3. 【白话机器学习】算法理论+实战之Xgboost算法
  4. 用于稠密检索的无监督领域适应方法—Generative Pseudo Labeling (GPL)
  5. 基于Java的TCP Socket通信详解(计算机端/Android手机端)
  6. 狗窝里的小日子- 5 ...
  7. 微信公众号页面模版怎么添加文章推荐功能
  8. windows环境下IDEA安装和配置和第一个IDEA项目运行加常用快捷键
  9. Java基础学习总结(110)——Java主要技术点总结
  10. Servlet HTTP 状态码
  11. 借助Haproxy_exporter实现对MarathonLb的流量和负载实例业务的可用状态监控-续
  12. php opendir 相对路径,我是wamp环境,怎么样让php的opendir函数可以接受相对路径?...
  13. 搜狐自媒体还是蛮拼的 竟拉着加多宝做了一档美食节目
  14. Linux下STM32MP157芯片的A7核裸跑方法
  15. 北航外国语学院计算机项目,北京航空航天大学外国语学院游学项目.pdf
  16. vs如何设置在Release下进行调试
  17. 自学SQL网题库答案
  18. Windows系统下安装配置 MinGW-w64 开发环境
  19. javascript【写法规范】
  20. sqlserver 2008 r2 直接下载地址,可用迅雷下载

热门文章

  1. 传感器检测技术——传感器的静态特性
  2. 完全用Linux工作——看清华学子痛批Windows
  3. Unity脚本(一)
  4. 极限理论总结03:中心极限定理(CLT)与Edgeworth展开
  5. Velocity最简易的Servlet加载
  6. vb.net程序可以在触摸屏上运行么_触摸屏amp;触控一体机常见故障解决方法
  7. 【论文读后感】:A simple yet effective baseline for 3d human pose estimation
  8. 刚刚,马斯克宣布重磅消息!一切来得那么快!
  9. (10.2)【隐写实现】简介、流程图、具体步骤
  10. 鉴别真正牛奶生产日期方法