点击我爱计算机视觉标星,更快获取CVML新技术


图片来自智能体“躲猫猫”

总结了过去一周CV领域的最新开源代码,发现本周出现多份很有价值的高质量、重量级工作,比如致力于使得图卷积网络更深的DeepGCNs、Mask引导的注意力网络大大改进了遮挡行人重识别、格灵深瞳轻量级人脸识别比赛冠军模型VarGFaceNet、比LSTM更优的新RNN模型IndRNN、还有异常强大的字符级文本识别CharNet。

一种web运行的半自动图像标注的灵活框架LOST(Label Objects and Save Time)

LOST: A flexible framework for semi-automatic image annotation

Jonas Jäger, Gereon Reus, Joachim Denzler, Viviane Wolff, Klaus Fricke-Neuderth

https://arxiv.org/abs/1910.07486v1

https://github.com/l3p-cv/lost

对抗表示学习中的全局最优化问题

On the Global Optima of Kernelized Adversarial Representation Learning

Bashir Sadeghi, Runyi Yu, Vishnu Naresh Boddeti

ICCV 2019

https://arxiv.org/abs/1910.07423v1

https://github.com/human-analysis/Kernel-ARL

学习泛化的全尺度表示,用于人员重识别,模型更小,精度更优

Learning Generalisable Omni-Scale Representations for Person Re-Identification

Kaiyang Zhou, Xiatian Zhu, Yongxin Yang, Andrea Cavallaro, Tao Xiang

ICCV 2019

https://arxiv.org/abs/1910.06827v1

https://github.com/KaiyangZhou/deep-person-reid

将ResNet和DenseNet引入到图卷积网络中,可以训练更深(达112层)的GCN,在多个任务中达到了更高的精度。

DeepGCNs: Making GCNs Go as Deep as CNNs

Guohao Li, Matthias Müller, Guocheng Qian, Itzel C. Delgadillo, Abdulellah Abualshour, Ali Thabet, Bernard Ghanem

ICCV 2019

https://arxiv.org/abs/1910.06849v1

https://github.com/lightaime/deep_gcns_torch

https://github.com/lightaime/deep_gcns

训练智能体玩“躲猫猫”游戏

Visual Hide and Seek

Boyuan Chen, Shuran Song, Hod Lipson, Carl Vondrick

https://arxiv.org/abs/1910.07882v1

http://www.cs.columbia.edu/~bchen/visualhideseek/

掩膜引导的注意力网络,用于遮挡严重的行人检测,在多个数据集实现了更高的最好精度。CityPersons提升9.5%,Caltech提升5.0%。

Mask-Guided Attention Network for Occluded Pedestrian Detection

Yanwei Pang, Jin Xie, Muhammad Haris Khan, Rao Muhammad Anwer, Fahad Shahbaz Khan, Ling Shao

ICCV 2019

https://arxiv.org/abs/1910.06160v2

https://github.com/Leotju/MGAN

一种几何启发的卷积操作,有效提升了消失点检测

NeurVPS: Neural Vanishing Point Scanning via Conic Convolution

Yichao Zhou, Haozhi Qi, Jingwei Huang, Yi Ma

https://arxiv.org/abs/1910.06316v1

https://github.com/zhou13/neurvps

单次神经架构搜索,基于自我评估模版网络,在CIFAR和ImageNet数据集达到最先进的性能

One-Shot Neural Architecture Search via Self-Evaluated Template Network

Xuanyi Dong, Yi Yang

ICCV 2019

https://arxiv.org/abs/1910.05733v1

https://github.com/D-X-Y/NAS-Projects

学习鉴别特征,用于非监督域适应

Drop to Adapt: Learning Discriminative Features for Unsupervised Domain Adaptation

Seungmin Lee, Dongwan Kim, Namil Kim, Seong-Gyun Jeong

ICCV 2019

https://arxiv.org/abs/1910.05562v1

https://github.com/postBG/DTA.pytorch

可变组卷积神经网络,可以支持大规模人脸识别,同时减少计算成本和参数。获得格灵深瞳轻量级人脸识别挑战赛冠军!

VarGFaceNet: An Efficient Variable Group Convolutional Neural Network for Lightweight Face Recognition

Mengjia Yan, Mengao Zhao, Zining Xu, Qian Zhang, Guoli Wang, Zhizhong Su

ICCV 2019 Workshop

https://arxiv.org/abs/1910.04985v1

https://github.com/zma-c-137/VarGFaceNet

发明一种称为Hadamard乘积的递归连接,构建了独立递归神经网络(IndRNN),其中同一层中的神经元彼此独立并且跨层连接。

IndRNN可有效替代LSTM,精度更高的同时,速度是其10倍!

Deep Independently Recurrent Neural Network (IndRNN)

Shuai Li, Wanqing Li, Chris Cook, Yanbo Gao, Ce Zhu

https://arxiv.org/abs/1910.06251v1

https://github.com/Sunnydreamrain/IndRNN_pytorch

一种以字符为基本单元的单阶段文本检测识别网络,在三个标准基准上对CharNet结果显示,其结果以最先进的结果大大领先之前的算法,比如ICDAR 2015上从65.33%改进到71.08%,TotalText上从54.0%跃升至69.23%。

Convolutional Character Networks

Linjie Xing, Zhi Tian, Weilin Huang, Matthew R. Scott

ICCV 2019

https://arxiv.org/abs/1910.07954v1

https://github.com/MalongTech/research-charnet

基于语音指令实现的自动驾驶

Conditional Driving from Natural Language Instructions

Junha Roh, Chris Paxton, Andrzej Pronobis, Ali Farhadi, Dieter Fox

CoRL 2019

https://arxiv.org/abs/1910.07615v1

https://sites.google.com/view/language-grounded-driving

医学图像域适应 | 提出了一种新型的无监督域自适应框架,称为协作特征集合自适应(CFEA),改进了眼底图像分割的精度

CFEA: Collaborative Feature Ensembling Adaptation for Domain Adaptation in Unsupervised Optic Disc and Cup Segmentation

Peng Liu, Bin Kong, Zhongyu Li, Shaoting Zhang, Ruogu Fang

MICCAI 2019

https://arxiv.org/abs/1910.07638v1

https://github.com/cswin/AWC


CV细分方向交流群

52CV已经建立多个CV专业交流群,包括:目标跟踪、目标检测、语义分割、姿态估计、人脸识别检测、医学影像处理、超分辨率、神经架构搜索、GAN、强化学习等,扫码添加CV君拉你入群,如已经为CV君其他账号好友请直接私信,

(请务必注明相关方向,比如:目标检测

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉

重磅推荐,计算机视觉开源周报20191003期相关推荐

  1. CV Code|计算机视觉开源周报20200502期

    五月第二周,盘点本周新开源或即将开源的CV代码,涵盖方向广泛,不仅涉及到技术创新,还涉及多种CV应用,希望对大家有帮助.    图像分割 [1].A Hand Motion-guided Articu ...

  2. CV Code|计算机视觉开源周报20200602期~文末送书

    六月的第二周马上就要过去了,又到了我们盘点开源代码的时候.本周出了多份CVPR 2020的论文代码,涵盖目标视点估计.目标检测.ReID.图像增强与质量评价.超分辨率.光流算法.目标跟踪.无监督学习. ...

  3. CV Code|计算机视觉开源周报20200503期

    五月第三周,盘点本周新开源或即将开源的CV代码,涵盖方向广泛,不仅涉及到技术创新,还涉及多种CV应用,尤其值得一提的是谷歌和MIT都在研究的对比表征学习和香港中文大学开源的InterFaceGan,希 ...

  4. CV Code|计算机视觉开源周报20200601期

    六月的第一周马上就要过去了,又到了我们盘点开源代码的时候. 谷歌发布的目标检测新算法DetectoRS刷新了沉寂将近一年的COCO数据集的最高精度,是这周最具影响力的工作,同时谷歌还开源了视频质量评价 ...

  5. CV Code|计算机视觉开源周报20200504期

    五月第四周,盘点本周新开源或即将开源的CV代码,涵盖方向广泛,不仅涉及到技术创新,还涉及多种CV应用. 其中Facebook新目标检测框架DETR是本周最热的论文,开辟了目标检测新方向! 鲁汶大学等提 ...

  6. CV Code | 计算机视觉开源周报 20190701期

    点击我爱计算机视觉标星,更快获取CVML新技术 7月第一周的周末,盘点了这一周的新出开源代码. 神经架构搜索(小米) FairNAS: Rethinking Evaluation Fairness o ...

  7. CV Code | 计算机视觉开源周报 20190505期

    点击我爱计算机视觉标星,更快获取CVML新技术 今天正式将每周末盘点计算机视觉开源代码的环节,改名为计算机视觉开源周报,并为此编排了期号,希望把这个栏目坚持做下去,方便以后期数多了之后大家参考索引. ...

  8. CV Code | 计算机视觉开源周报20191002期

    点击我爱计算机视觉标星,更快获取CVML新技术 图片来自ECA-Net 总结了过去一周新出的计算机视觉开源代码. 涵盖的方向包括域适应.消除偏差网络训练.视觉注意力模型.机器人动作搜索.机器人抓取.自 ...

  9. CV Code | 计算机视觉开源周报20191001期

    点击我爱计算机视觉标星,更快获取CVML新技术 本图出自OpenVSLAM‍ ‍ ‍总结了过去一周新出的计算机视觉开源代码. ICCV 2019 临近,不少论文和相应代码公布,也包括其中的WorkSh ...

最新文章

  1. matlab--微积分与微分方程
  2. Firefox3.0火速前进 比2.0版快2到3倍
  3. vectorobserver obs是做什么_带着色碳纤维主体的OBS雪佛兰皮卡
  4. 【Linux部署】Greenplum数据库6.13.0单机版【重启实录】(5次报错问题及解决的避坑指南+日志文件查看方法)
  5. 获取XML的文件信息
  6. 禁术级竞赛刷分技巧:找到跟测试集最接近的有标签样本
  7. redis分布式锁,面试官请随便问,我都会
  8. html 单行文本(input text)
  9. 学习nodejs之hello world
  10. Clang编译Objective-C
  11. 数据质量六大评价标准
  12. 呼和浩特php平均工资,2019年内蒙古平均工资出炉
  13. 同行评审就是个笑话!Nature爆料:计算机生成的垃圾文章竟还能被接受,64%来自中国...
  14. 段码超低功耗LCD液晶显示驱动芯片(IC)-VKL系列-VKL128/060/076/144A/144B,VKL144A兼容MCP144
  15. 微信小程序 view的文本自动换行了的问题(scroll-view)/微信小程序 view换行跟不换行的解决方案
  16. Gym101635C Macarons
  17. Laya Air游戏开发模式之MVC模式(核心篇)
  18. oracle 数据字典画报,Oracle 数据字典查询
  19. Oracle 数据库利用回收站恢复删除的表实例演示
  20. Matlab------------怎么取一个复数的实部和虚部

热门文章

  1. VC2008以资源形式实现多语言版本
  2. JDBC简单连接MySQL
  3. leetcode50:Pow(x, n)详解——pygo
  4. python opencv 摄像头_python+opencv实现摄像头调用的方法
  5. mysql索引失效_MySQL索引失效的底层原理详解,终于有人讲清楚了
  6. python 描述器 详解_深入解析Python中的descriptor描述器的作用及用法
  7. erp沙盘采购总监的心得_沙盘部 | 会计协会新宠
  8. 还在维护吗_你的模具生锈了吗?来了解一下这些防锈维护事项
  9. android折叠listview,android – 如何在listview中展开和折叠项目
  10. vue怎么通过if跳出方法_vue多种弹框的弹出形式