Dan Deng——【AAAI2018】PixelLink_Detecting Scene Text via Instance Segmentation

作者和代码

tensorflow代码

关键词

文字检测、多方向、直接回归、$$xywh\theta$$、one-stage、开源

方法亮点

  • 使用instance segmentation的思路做(利用了二类分类+每个像素点与周围8个顶点的link分类)
  • 利用图像处理方法进行后处理,不需要用NMS

方法概述

本文方法采用instance segmentation思路,预测text/non-text和pixel-link关系,再使用简单的图像处理的方式进行后处理来去除噪声。

方法细节

方法流程图

网络结构

Link定义
  • 两个像素的都是positive(text)-> link是positive
  • 一个是text,一个是non-text -> link是positive
  • 两个都是non-text -> link是negative
损失函数
  • 总损失

  • pixel 损失(Instance-Balanced Cross-Entropy Loss)

    利用每个instance的面积来对其loss进行加权,目的是为了提高小目标对loss的贡献。

  • link损失

    link_CE是Cross-Entropy loss。

后处理
  • 通过pixel信息来链接Text/non-text prediction的score map里的像素,得到instance segmentation map
  • 利用OpenCV的minAreaRect来提取oriented rectangle
  • 使用后处理过滤噪声
    • 去掉短边小于10个像素的box
    • 去掉面积小于300的box
    • 其他利用长宽比等(参数设置为在训练集上做统计,利用百分比对应的值作为参数,例如99%以上的文字短边都大于10,)

实验结果

  • ICDAR2015

  • MSRA-TD500

  • ICDAR2013

  • 模型分析对比实验

总结与收获

这篇方法采用纯分割的思路,完全没有利用目标检测的方法,连后处理都没用nms,方法还是比较特别的。

转载于:https://www.cnblogs.com/lillylin/p/9955024.html

【论文速读】Dan_Deng_AAAI2018_PixelLink_Detecting_Scene_Text_via_Instance_Segmentation相关推荐

  1. 【论文速读】城市自动驾驶应用的概率语义地图

    点云PCL免费知识星球,点云论文速读. 标题:Probabilistic Semantic Mapping for Urban Autonomous Driving Applications 作者:D ...

  2. 【论文速读】RandLA-Net大规模点云的高效语义分割

    点云PCL免费知识星球,点云论文速读. 文章:RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds 作者:Qi ...

  3. 【论文速读】基于投影方法的激光雷达点云处理比较

    点云PCL免费知识星球,点云论文速读. 文章:LiDAR point-cloud processing based on projection methods: a comparison 作者:Gui ...

  4. 【论文速读】基于图像的伪激光雷达三维目标检测

    点云PCL免费知识星球,点云论文速读. 标题:End-to-End Pseudo-LiDAR for Image-Based 3D Object Detection 作者:Rui Qian, Divy ...

  5. 【点云论文速读】最佳点云分割分析

    点云PCL免费知识星球,点云论文速读. 标题:Learning to Optimally Segment Point Clouds 作者:Peiyun Hu, David Held 星球ID:part ...

  6. 【点云论文速读】点云高质量3D表面重建

    点云PCL免费知识星球,点云论文速读. 标题:Local Implicit Grid Representations for 3D Scenes 作者:Chiyu "Max" Ji ...

  7. 【点云论文速读】6D位姿估计

    点云PCL免费知识星球,点云论文速读. 标题:MoreFusion: Multi-object Reasoning for 6D Pose Estimation from Volumetric Fus ...

  8. 【点云论文速读】点云分层聚类算法

    点云PCL免费知识星球,点云论文速读. 标题:PAIRWISE LINKAGE FOR POINT CLOUD SEGMENTATION 作者:Lu, Xiaohu and Yao, Jian and ...

  9. 【ECCV2016论文速读】回归框架下的人脸对齐和三维重建

    本文来源微信公众号:深度学习大讲堂,已授权发布. 作者:刘峰,四川大学计算机学院生物特征识别实验室博士三年级学生,导师游志胜教授.赵启军博士.研究方向为机器学习与模式识别(三维人脸建模与识别.二维人脸 ...

  10. 【点云论文速读】基于优化的视觉惯导里程计与GPS的紧耦合的融合方案

    转载自:https://mp.weixin.qq.com/s/Y-h7eto1Zc_Mkzlh653vpg [点云论文速读]基于优化的视觉惯导里程计与GPS的紧耦合的融合方案 原创 dianyunPC ...

最新文章

  1. AI设计师“鲁班”进化史:每秒制作8000张双11海报,没一张雷同!
  2. 2017年Q1安卓ROOT类恶意病毒发展趋势研究报告
  3. 【LaTex】LaTeX Warning: Citation xxx on page xxx undefined on input line xxx
  4. php完整验证码代码
  5. 是Dubbo不香了吗?阿里为啥又搞一套Spring Cloud Alibaba?
  6. windows curl ssl版本编译
  7. 贝叶斯思维 统计建模的Python学习法
  8. 自动化测试 短信验证登录
  9. RN开发系列<2>--基本调试
  10. 软考(计算机软件水平考试)程序员介绍
  11. Unity网络教程翻译(三)多人游戏大厅
  12. 爬取了bilibili站644w视频信息之后的故事。
  13. uint 数据类型理解
  14. 报告解读下载 | 7月《中国数据库行业分析报告》重磅发布!精彩抢先看!
  15. draft伦理——第七章
  16. 使用Eclips开发java程序
  17. java中定义一个时间_Java中的日期和时间
  18. docker安装apollo
  19. java狐妖外传,月华凌乱——狐不归外传
  20. 简单介绍长短期记忆网络 - LSTM

热门文章

  1. Express全系列教程之(十):jade模板引擎
  2. VS2005得include,library,src等路径自动设置
  3. 奋斗吧,程序员——第三十七章.雄关漫道真如铁,而今迈步从头越
  4. Selenium 自动化测试从零实战
  5. 段码液晶屏笔段电压范围_一种笔段式液晶屏测试装置的制作方法
  6. android 自定义音量调节,Android——自定义音量调节控件
  7. OnSysCommand( UINT nID, LPARAM lParam );分析
  8. 澳大利亚政府为区块链能源项目拨款800万澳元
  9. 基于stm32+LM2904+esp8266的噪声预警系统
  10. python源文件后缀_python 文件后缀杂录