【2017-VCIP】LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation
概述
像素级语义分割不仅要精度也要速度,现有算法精度有但速度慢。因此本文提出了LinkNet,在不显著增加参数量的情况下进行学习,最后在CamVid数据集上取得了SOTA,Cityscapes数据集上也是类似结果。
- Paper
- Code | Pytorch
总结
- 创新点:
- 1.编码器和解码器直接相连,共享了学习信息,保留了通常丢失掉的空间信息
- 2.编码器用ResNet18,编解码器参数更少
- 不足:依旧是编解码器
- 分析:编解码器直接相连,保留空间信息,共享学习减少学习参数量
- 结论:CamVid中的SOTA、省成本、速度快精度高
1. Introdution
CNN网络在图像分类、定位、场景理解上很成功,现有许多学者聚焦于场景理解即逐像素级的语义分割。现有语义分割网络大多以编码器解码器为其核心。目标检测算法有YOLO、FastRCNN、SSD等优化速度的算法,但目前针对语义分割的还没有。通常由于池化和步长卷积而丢失的编码信息使用池化索引和全卷积来恢复,本文则绕过空间信息,直接从编码器到对应的解码器,提高精度的同时显著减少了处理时间,使得原本要丢失的信息保留。
2. Related Work
用于场景理解的神经网络架构可细分为编码器网络和解码器网络,它们基本上就是判别器和生成器。SOTA一般使用分类模型作为它们的判别器,生成器使用来自于判别器储存的池化索引,或使用卷积来学习参数执行上采样。#P2
3. Architecture
Every conv(k × k)(im, om) and full-conv(k × k)(im, om) operations has at least three parameters. Here, (k × k) represent (kernel − size) and (im, om) represent (inputmap, outputmap) respectively. 本文网络使用ResNet18作为编码器,不同于其他语义分割网络的亮点是将每个编码器和解码器连接起来,以此可以恢复由于下采样而丢失的空间信息,此外,解码器在每一层共享由编码器学习到的知识,所以解码器使用的参数更少。
4. Results
与其他现有网络比较的两个尺度:1.速度(执行前向传播所用的时间,涉及的操作次数)2.在Cityscapes和CamVid数据集上的精度。
速度
精度
5. Conclusion
提出了一个专用于语义分割的网络LinkNet。使用嵌入式平台成本大大降低,以更快更高效的方式执行大规模计算,性能也还不错,节省大量成本。
【2017-VCIP】LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation相关推荐
- 【论文翻译】PLOP: Learning without Forgetting for Continual Semantic Segmentation
论文地址:http://https://arxiv.org/abs/2011.11390 代码地址:GitHub - arthurdouillard/CVPR2021_PLOP: Official ...
- 【论文笔记】FCN:Fully Convolutional Networks for Semantic Segmentation
<Fully Convolutional Networks for Semantic Segmentation>,CVPR 2015 文章目录 1. 概览 2. 主要亮点 2.1 全卷积化 ...
- 【语义分割】ICCV21_Mining Contextual Information Beyond Image for Semantic Segmentation
文章目录 一.背景 二.动机 三.方法 3.1 整体结构 3.2 特征存储模块 Feature Memory Module 3.3 数据集层面的上下文聚合 Dataset-level Context ...
- 【论文阅读】Online Attention Accumulation for Weakly Supervised Semantic Segmentation
一篇弱监督分割领域的论文,其会议版本为: (ICCV2019)Integral Object Mining via Online Attention Accumulation 论文标题: Online ...
- 【弱监督学习】Weakly Supervised Adversarial Domain Adaptation for Semantic Segmentation in Urban Scenes
0. 前言 本文是2019年发表在IEEE Transactions On Image Processing期刊上的一篇关于弱监督的城市场景语义分割的文章,文章中采用两个域分类器进行对抗训练,从而提高 ...
- 【2017.05】技术员GHOST系统最新发布(32位/64位)
[2017.05]技术员GHOST系统最新发布(32位/64位) ■ 本系统采纳几十位经验丰富的装机人员经验和建议,系统稳定,快速,预装软件更加适合完美 ■ 系统精简适当(装机人员可以把光盘目录下的G ...
- 【论文研读】【医学图像分割】【FCN+RNN】Recurrent Neural Networks for Aortic Image Sequence Segmentation with ...
[FCN+RNN]Recurrent Neural Networks for Aortic Image Sequence Segmentation with Sparse Annotations Ab ...
- 【语义分割】OCRNet:Object-Context Representations for Semantic Segmentation
文章目录 一.文章出发点 二.方法 三.效果 一.文章出发点 每个像素点的类别(label)应该是它所属目标(object)的类别. 所以这篇文章对像素的上下文信息建模 建模方法:求每个像素点和每个类 ...
- 【雷达与对抗】【2017.06】空中目标的无源雷达探测
本文为瑞典国防研究局(作者:Erol Ali)的硕士论文,共63页. 本文的目的是利用两个USRP-N200软件无线电和两副普通电视天线构成无源双基地雷达系统.为了校准这些设备,使用了一些辅助部件,包 ...
最新文章
- 解决在非spring上下文的环境中无法获取Spring容器的bean【nullpointer:connot invoke because xxx is null问题】
- 团体程序设计天梯赛-练习集 L1-002 打印沙漏
- java在一个类里实现存款_用Java编写一个简单的存款
- 在PHP代码中处理JSON 格式的字符串的两种方法:
- Java摇骰子比大小_还在摇骰子比大小?这几款火热的KTV喝酒游戏你值得收藏
- ES6新特性_ES6语法糖class介绍与初体验_就是个语法糖而已---JavaScript_ECMAScript_ES6-ES11新特性工作笔记033
- 上deepweb难吗_发动机保养难?傲群除尘毛刷用上了吗
- Ubuntu中DenyHosts清除黑名单IP地址
- linux 两个mysql_Linux 安装两个MySQL
- eclipse及tomcat设置编码
- 做独立淘客app有哪些运营方法
- 机器视觉软件能够做什么?-龙熙视觉机器视觉培训李杰
- 职场泥潭 | 这样的IT公司绝对不宜久留
- 从期刊层面看科研!计算机顶级期刊大盘点(下)
- GF1、Landast、Sentinel等常用免费遥感影像下载地址
- 谁的青春不迷茫--无关技术,只谈选择
- 微软账户 设置 服务器地址,设置Microsoft账户提示此电子邮件地址是保留域怎么办...
- 人工神经网络:多层感知器
- 计算机大三如何找名企实习?
- 《笨办法学Python》——习题5
热门文章
- MySQL分库分表解决方案
- C#如何正确的释放资源
- 计算机要继续教育吗,计算机继续教育学习心得
- 关于DevOps工具链的探讨
- 大数据面试问题,大数据面试技巧都有哪些呢?
- Burpsuite抓包工具
- 魔众相册系统 v1.1.0 页面SEO优化,系统升级调整
- windows共享打印机机器定时清理连接会话的问题
- 联想计算机BIOS开启Intel-vx,各品牌电脑BIOS开启Intel VT-X虚拟化技术方法(华硕,联想,HP,技嘉等)...
- Java大数据BigInteger和BigDecimal