2020-04-01 11:19

导语:为了更好地服务广大 AI 青年,AI 研习社正式推出全新「论文」版块。

  目录

用于场景文本识别的高效骨干搜索

学习扩充:用于文本识别的联合数据增强和网络优化

KPNet:最小人脸检测器

DEPARA:深度知识可迁移性的深度属性图

用于任意形状文本检测的深度关系推理图网络

  用于场景文本识别的高效骨干搜索

论文名称:Efficient Backbone Search for Scene Text Recognition

作者:Zhang Hui /Yao Quanming /Yang Mingkun /Xu Yongchao /Bai Xiang

发表时间:2020/3/14

论文链接:https://paper.yanxishe.com/review/14658?from=leiphonecolumn_paperreview0401

推荐原因

这篇论文要解决的是场景文本识别(Scene Text Recognition, STR)的问题。过去的研究更加重视通过改进预处理图像模块来提高性能,比如校正和去模糊,或者序列转换器。然而,另一个关键模块,即特征序列提取器,还没有得到广泛的研究。这篇论文提出了一个自动化场景文本识别(AutoSTR)方法来搜索依赖于数据的主干模型,以提高文本识别性能。首先,新方法为STR设计了一个特定于域的搜索空间,其中包含了各种运算的选择和下采样路径的约束。然后,新方法使用了一个两步搜索算法,它解耦了操作和下采样路径,可以在给定的空间中进行有效的搜索。实验表明,通过搜索依赖于数据的主干,AutoSTR可以在更少错误和模型参数的情况下,在标准基准数据集上超越最先进的方法。

  学习扩充:用于文本识别的联合数据增强和网络优化

论文名称:Learn to Augment: Joint Data Augmentation and Network Optimization for Text Recognition

作者:Luo Canjie /Zhu Yuanzhi /Jin Lianwen /Wang Yongpan

发表时间:2020/3/14

论文链接:https://paper.yanxishe.com/review/14657?from=leiphonecolumn_paperreview0401

推荐原因

这篇论文被CVPR 2020接收,要解决的是文本识别问题。

这篇论文提出了一种新的文本图像数据增强方法。与传统增强方法(例如旋转、缩放和透视变换)不同,新方法旨在掌握适当而高效的数据增强方法,对于训练健壮的识别器更有效而具体。新方法通过使用一组自定义基准点变得灵活而可控,并通过联合学习弥合了孤立数据增强过程与网络优化之间的鸿沟。代理网络从识别网络的输出中学习并控制基准点,从而为识别网络生成更合适的训练样本。在包括常规场景文本、不规则场景文本、手写文本在内的各种基准上进行的大量实验表明,这篇论文提出的增强方法和联合学习策略显著提高了识别网络的性能。

  KPNet:最小人脸检测器

论文名称:KPNet: Towards Minimal Face Detector

作者:Song Guanglu /Liu Yu /Zang Yuhang /Wang Xiaogang /Leng Biao /Yuan Qingsheng

发表时间:2020/3/17

论文链接:https://paper.yanxishe.com/review/14656?from=leiphonecolumn_paperreview0401

推荐原因

这篇论文发表于AAAI 2020,考虑的是人脸检测的问题。

这篇论文发现脸部外观特征具有足够的判别力,用微型浅层神经网络也可以从背景中进行检测。与大多数自上而下联合面部检测和对齐方法不同,所提KPNet以自下而上的方式检测较小的面部关键点,而非整个面部。KPNet首先通过精心设计的细粒度比例逼近和比例自适应Soft-argmax运算符从低分辨率图像预测面部界标。无需任何复杂的头部架构或精心的网络设计,KPNet只需约1M参数即可实现通用人脸检测和对齐基准的当前最佳准确率,在GPU上的运行速度为1000fps,且易于在大多数前端芯片上实时执行。

  DEPARA:深度知识可迁移性的深度属性图

论文名称:DEPARA: Deep Attribution Graph for Deep Knowledge Transferability

作者:Song Jie /Chen Yixin /Ye Jingwen /Wang Xinchao /Shen Chengchao /Mao Feng /Song Mingli

发表时间:2020/3/17

论文链接:https://paper.yanxishe.com/review/14655?from=leiphonecolumn_paperreview0401

推荐原因

这篇论文被CVPR 2020接收,提出了名为DEPARA的深度属性图模型,以研究从预训练的深度神经网络(PRe-trained Deep Neural Networks,PR-DNN)中获得的知识的可迁移性。在DEPARA中,节点对应于输入,并由它们在PR-DNN的输出的向量化属性图表示。边表示输入之间的相关性,并通过从PR-DNN中提取的特征相似度来衡量。两个PR-DNN的知识可迁移性是通过它们对应的DEPARA的相似性来衡量的。这篇论文将DEPARA应用于迁移学习中的预训练模型选择和层选择问题,并通过大量实验证明所提方法在解决这两个问题上的有效性和优越性。

  用于任意形状文本检测的深度关系推理图网络

论文名称:Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection

作者:Zhang Shi-Xue /Zhu Xiaobin /Hou Jie-Bo /Liu Chang /Yang Chun /Wang Hongfa /Yin Xu-Cheng

发表时间:2020/3/17

论文链接:https://paper.yanxishe.com/review/14654?from=leiphonecolumn_paperreview0401

推荐原因

这篇论文已经被CVPR 2020接收,要解决的是任意形状的文本检测。

这篇论文提出了一种用于任意形状文本检测的新统一关系推理图网络。在该方法中,局部图通过卷积神经网络桥接了文本提议模型,并通过图卷积网络跨越深度关系推理网络,从而使所提网络端到端可训练。具体而言,每个文本实例将被分成一系列小的矩形组件,并且这些小组件的几何属性(如高度、宽度和方向)将由文本提案模型估算。给定几何属性,本地图构造模型可以大致建立不同文本组件之间的链接。为进一步推理并推论组件与其邻居之间链接的可能性,这篇论文采用基于图的网络对局部图执行深度关系推理。公开数据集上的实验证明了所提方法具有当前最佳性能。

今日 Paper | 高效骨干搜索;学习扩充;最小人脸检测器;​DEPARA等相关推荐

  1. 网络摄像头+net_今日 Paper | 神经网络结构搜索;视觉目标;人物识别;视频3D人体姿态估计等...

    目录 基于进化算法和权值共享的神经网络结构搜索 检测视频中关注的视觉目标 包含状态信息的弱监督学习方法进行人物识别 基于解剖学感知的视频3D人体姿态估计 RandLA-Net:一种新型的大规模点云语义 ...

  2. 今日 Paper | 虚拟试穿网络;人群计数基准;联邦元学习;目标检测等

    2020-01-15 05:41:40 为了帮助各位学术青年更好地学习前沿研究成果和技术,AI科技评论联合Paper 研习社(paper.yanxishe.com),推出[今日 Paper]栏目, 每 ...

  3. 今日 Paper | 人脸数据隐私;神经符号推理;深度学习聊天机器人等

    为了帮助各位学术青年更好地学习前沿研究成果和技术,AI科技评论联合Paper 研习社(paper.yanxishe.com),推出[今日 Paper]栏目, 每天都为你精选关于人工智能的前沿学术论文供 ...

  4. 【AutoML】损失函数也可以进行自动搜索学习吗?

    大家好,欢迎来到专栏<AutoML>,在这个专栏中我们会讲述AutoML技术在深度学习中的应用,这一期讲述在优化目标设计中的应用. 作者&编辑 | 言有三 一个有效的损失函数在深度 ...

  5. ELK搜索学习笔记--Day1

    ELK搜索学习笔记–Day1 1. 课程简介 1.1 课程内容 ELK是包含但不限于Elasticsearch(简称es).Logstash.Kibana 三个开源软件的组成的一个整体.这三个软件合成 ...

  6. 今日 Paper | 协作蒸馏;人脸反欺骗;人脸表示;3D-CariGAN等

    020-04-02 10:58 导语:为了更好地服务广大 AI 青年,AI 研习社正式推出全新「论文」版块.   目录 用于超分辨率通用样式迁移的协作蒸馏 通过学习去攻击来进行防御 用于人脸反欺骗的深 ...

  7. 基于Solr的空间搜索学习笔记

    基于Solr的空间搜索学习笔记 在Solr中基于空间地址查询主要围绕2个概念实现: (1) Cartesian Tiers 笛卡尔层 Cartesian Tiers是通过将一个平面地图的根据设定的层次 ...

  8. 百度飞桨:十行代码高效完成深度学习POC

    本文用户记录黄埔学院学习的心得,并补充一些内容. 课程2:十行代码高效完成深度学习POC,主讲人为百度深度学习技术平台部:陈泽裕老师. 因为我是CV方向的,所以内容会往CV方向调整一下,有所筛检. 课 ...

  9. 《强化学习周刊》第33期:UdeM | 基于不确定性估计的样本高效深度强化学习

    No.33 智源社区 强化学习组 强 化 学  习 研究 观点 资源 活动 关于周刊 强化学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注.为帮助研究与工程人员了解该领域的相关进展和 ...

最新文章

  1. 一张照片就能生成3D模型,GAN和自动编码器碰撞出奇迹,苏黎世联邦理工学院出品...
  2. 无人数据中心何时到来仍需等待
  3. Acwing第 27 场周赛【完结】
  4. 在11g中alter system set recyclebin = off 报错 recyclebin 参数在11g和10g中的区别
  5. xcode 4.2开发 ——navigation controller 添加按钮
  6. Could not resolve host: 'localhost 报错解决办法
  7. MobileNet V3简单总结
  8. 【JavaScript】数学计算的函数与数字的格式化
  9. maven local responsitory 手工新增jar
  10. PS 一寸照换底
  11. R语言对数据进行非参数检验
  12. 免费开源的智能家居系统,SpringBoot+Vue前后端分离,WiFi智能设备接入,手把手开发安卓APP,建立QQ智能管家机器人!
  13. Mac Xshell 下载 (FinallShell)
  14. Hello China V1.75版本运行截图
  15. Y05 - 024、数据的应用①:四则运算、运算优先级
  16. 1,10-Phen|邻菲啰啉|邻二氮杂菲|1,10-菲啰啉有机配体-66-71-7
  17. C# VBA 提取word中图片方法
  18. 浏览器无法连接的解决方法 windows无法与设备和资源通信的解决方法
  19. 苹果系统各平台软件安装包地址
  20. 艾力奋RFID人脸识别闸机助力小鹏汽车发布会【技术篇】

热门文章

  1. python 一个文本是否包含另一字符串 in find是区分大小写的
  2. BiLSTM+CRF的损失由发射矩阵和转移矩阵计算而得 BiLSTM+CRF命名实体识别:达观杯败走记(下篇
  3. 2021-03-18TOMCAT的非双亲委派机制众家辨解
  4. seaborn官方API
  5. socket 读取 所有 数据 java_Java Socket 读取服务器端返回数据
  6. Docker系列 三. Docker安装mysql
  7. 汉语(普通话)的音素对齐
  8. GeneGAN: Learning Object Transfiguration and Attribute Subspace from Unpaired Data
  9. OpenCV Python教程(1、图像的载入、显示和保存)
  10. 2021年Graph ML热门趋势和主要进展总结