点击我爱计算机视觉标星,更快获取CVML新技术


微软亚洲研究院产出了很多计算机视觉黑科技,也有大量关注度极高的高质量开源项目,对于热爱CV的同学来说,以下这波推荐不容错过。

另外文末52CV举办“CV项目推荐赢红包”的活动,欢迎参加。

作者:微软亚洲研究院
链接:https://www.zhihu.com/question/320330671/answer/738260594
来源:知乎,已获作者授权转载,禁止二次转载。

我们邀请了微软亚洲研究院视觉计算组资深研究员王井东博士和研究员元玉慧博士为大家推荐来自微软亚洲研究院众多项目,共分为目标检测、语义和实例分割、人体姿态估计、人脸对齐、高效和轻量级卷积神经网络结构设计、行人再识别、视频目标检测、目标跟踪、最近邻搜索等领域。

目标检测

1. HRNet-Object-Detection

微软亚洲研究院视觉计算组提出的一种新型主干网络结构,可以学到高分辨率表征,提高了目标特别是小目标检测的空间精准率。支持multi-scale sync-bn 训练。

代码:

https://github.com/HRNet/HRNet-Object-Detection
https://github.com/HRNet/HRNet-MaskRCNN-Benchmark
https://github.com/HRNet/HRNet-FCOS

论文:

https://arxiv.org/pdf/1904.04514.pdf

2. Deformable convolutional networks

微软亚洲研究院视觉计算组提出的具备建模几何形变的卷积神经网络。

代码:

https://github.com/msracver/Deformable-ConvNets

论文:

https://arxiv.org/abs/1703.06211
https://arxiv.org/abs/1811.11168

3. Relation networks

微软亚洲研究院视觉计算组提出的利用物体之间的关联来提高物体检测器的性能。

代码:

https://github.com/msracver/Relation-Networks-for-Object-Detection

论文:

https://arxiv.org/pdf/1711.11575.pdf

语义和实例分割

1. HRNet-Semantic-Segmentation

微软亚洲研究院视觉计算组提出的一种新型主干网络结构,可以学到高分辨率表征,有效的提高了语义分割的性能。

代码:

https://github.com/HRNet/HRNet-Semantic-Segmentation
https://github.com/HRNet/HRNet-MaskRCNN-Benchmark

论文:

https://arxiv.org/pdf/1904.04514.pdf

2. Fully convolutional instance-aware semantic segmentation

微软亚洲研究院视觉计算组提出的端到端的实例分割的系统,整体设计是基于全卷积网络,在COCO2016比赛中获得了冠军。

代码:

https://github.com/msracver/FCIS

论文:

https://arxiv.org/pdf/1611.07709.pdf

人体姿态估计

1. HRNet-Human-Pose-Estimation

微软亚洲研究院视觉计算组提出的一种新型主干网络结构,可以学到高分辨率表征,有效的提高了人体关键点热图空间的精准度。

代码:

https://github.com/leoxiaobin/deep-high-resolution-net.pytorch

论文:

https://arxiv.org/pdf/1902.09212.pdf

2. SimplePose

微软亚洲研究院视觉计算组提出的一种用于检测人体的关键点任务的网络结构,简单有效。

代码:

https://github.com/Microsoft/human-pose-estimation.pytorch

论文:

https://arxiv.org/abs/1804.06208

3. Integral human pose regression

微软亚洲研究院视觉计算组提出了一种积分操作来处理3D人体姿态估计任务中的后处理/量化不可求导的问题。

代码:

https://github.com/JimmySuen/integral-human-pose

论文:

https://arxiv.org/abs/1711.08229

人脸对齐

1. HRNet-Facial-Landmark-Detection

微软亚洲研究院视觉计算组提出的一种新型主干网络结构,可以学到高分辨率表征,有效的提高了人脸关键点检测的性能。

代码:

https://github.com/HRNet/HRNet-Facial-Landmark-Detection

论文:

https://arxiv.org/pdf/1904.04514.pdf

高效和轻量级卷积神经网络结构设计

1. HRNet-Classification

微软亚洲研究院视觉计算组提出的一种新型主干网络结构,可以学到多分辨率表征,然后组合多分辨率表征来做图像识别。

代码:

https://github.com/HRNet/HRNet-Image-Classification

论文:

https://arxiv.org/pdf/1904.04514.pdf

2. Interleaved group convolutions

微软亚洲研究院视觉计算组提出的一种轻量级的网络结构,在分类检测等任务上都取得了比谷歌的MobileNetv2更好的结果。

代码:

https://github.com/homles11/IGCV3

论文:

https://arxiv.org/pdf/1707.02725.pdf
https://arxiv.org/pdf/1804.06202.pdf
https://arxiv.org/pdf/1806.00178.pdf

行人再识别

1. Deeply-learned part-aligned representations

微软亚洲研究院视觉计算组提出的利用人体部位信息来提取行人表征。

代码:

https://github.com/zlmzju/part_reid

论文:

http://openaccess.thecvf.com/content_ICCV_2017/papers/Zhao_Deeply-Learned_Part-Aligned_Representations_ICCV_2017_paper.pdf

2. Part-aligned bilinear representations

微软亚洲研究院视觉计算组提出一种利用双线性池化来组合人体姿态以提取行人表征。

代码:

https://github.com/yuminsuh/part_bilinear_reid

论文:

http://openaccess.thecvf.com/content_ECCV_2018/papers/Yumin_Suh_Part-Aligned_Bilinear_Representations_ECCV_2018_paper.pdf

视频目标检测

1. Deep feature low

微软亚洲研究院视觉计算组提出的视频理解的网络结构,通过利用视频之间的光流信息来传递相邻帧之间的预测。

代码:

https://github.com/msracver/Deep-Feature-Flow

论文:

https://arxiv.org/abs/1611.07715

2. Flow-guided feature aggregation

微软亚洲研究院视觉计算组提出的解决视频中物体检测问题的框架,利用光流在帮助组合相邻帧的表征。

代码:

https://github.com/msracver/Flow-Guided-Feature-Aggregation

论文:

https://arxiv.org/pdf/1703.10025.pdf

目标跟踪

1. Deeper and wider Siamese networks

微软亚洲研究院多媒体搜索和挖掘组提出的更深更宽的孪生网络来解决目标跟踪问题。

代码:

https://github.com/researchmm/SiamDW

论文:

https://arxiv.org/abs/1901.01660

最近邻搜索

1. SPTAG

微软亚洲研究院系统组与微软必应组共同推出的一个可以处理上亿数据的索引建立以及搜索系统,已经用在微软必应产品里。

代码:

https://github.com/Microsoft/SPTAG

论文:

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.862.7975&rep=rep1&type=pdf
http://pages.ucsd.edu/~ztu/publication/cvpr12_knnG.pdf,

https://ieeexplore.ieee.org/iel7/34/4359286/06549106.pdf

2. Composite quantization

微软亚洲研究院视觉计算组提出的一种高效的紧致编码(哈希)算法。

代码:

https://github.com/hellozting/CompositeQuantization

论文:

http://proceedings.mlr.press/v32/zhangd14.pdf


CV项目推荐活动

欢迎大家文末留言推荐高质量的CV开源项目,截止到8月19号12点,点赞最高的开源项目推荐者,CV君将发50元红包。

留言需包含项目简介与开源地址,如:

项目简介:

Face Analysis Project on MXNet

地址:

https://github.com/deepinsight/insightface

ps.所有52CV粉丝均可参与推荐,但为防止羊毛党刷赞,该活动获奖用户仅限8月16日之前关注的粉丝,如点赞第前几名不符合条件,则名额顺延,谢谢理解。


CV细分方向交流群

52CV已经建立多个CV专业交流群,包括:目标跟踪、目标检测、语义分割、姿态估计、人脸识别检测、医学影像处理、超分辨率、神经架构搜索、GAN、强化学习等,扫码添加CV君拉你入群,

(请务必注明相关方向,比如:目标检测

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过验证还请见谅


长按关注我爱计算机视觉

有什么推荐的计算机视觉项目?来自微软亚研院的清单相关推荐

  1. 微软亚研院:如何看待计算机视觉未来的走向?

    本文分享自百度开发者中心微软亚研院:如何看待计算机视觉未来的走向? 先说一个现象:在深度学习的驱动下,计算机已经在多个图像分类任务中取得了超越人类的优异表现.但面对一些不寻常的图像,以"深度 ...

  2. 微软亚研院CV大佬代季峰跳槽商汤为哪般?

    整理 | 夕颜 出品 | AI科技大本营(ID:rgznai100) 近日,知乎上一篇离开关于MSRA(微软亚洲研究院)和MSRA CV未来发展的帖子讨论热度颇高,这个帖子以MSRA CV执行研究主任 ...

  3. 无需Grouping,中科大和微软亚研院提出Group-Free的三维物体检测方法,性能远超之前最好方法。...

    ©PaperWeekly 原创 · 作者|刘泽 学校|微软亚洲研究院实习生 研究方向|计算机视觉与深度学习 无需 Grouping,中科大和微软亚研院提出 Group-Free 的三维物体检测方法,性 ...

  4. 微软亚研院创研论坛CVPR2020分享会 圆桌会议 内容小记

    微软亚研院创研论坛CVPR2020分享会 圆桌会议 内容小记 今天观看了微软亚研院举办的 创研论坛 CVPR2020 论文分享会,分享会邀请了计算机视觉领域多个子领域的大佬们分享已发表的CVPR202 ...

  5. 传微软亚研院停招国防七子+北邮实习生,18所「实体清单」高校也在劫难逃?...

      转载于 新智元   编辑:桃子 时光 snailnj [新智元导读]听说微软亚洲研究院要停招国防七子及北邮学生了?根据北邮人论坛上讨论,事实却是如此.那么,究竟为何? 一觉醒来,着实大睁眼. 网传 ...

  6. 微软亚研院:CV领域2019年重点论文推荐

    点击我爱计算机视觉标星,更快获取CVML新技术 微软亚洲研究院是国内顶级CV研究机构,众多CV黑科技的诞生地,2020年始,亚研院盘点了2019年CV领域重点论文,大部分附有开源代码,希望对大家有帮助 ...

  7. 微软亚研院提出用于语义分割的结构化知识蒸馏 | CVPR 2019

    作者 | CV君 来源 | 我爱计算机视觉 今天跟大家分享一篇关于语义分割的论文,刚刚上传到arXiv的CVPR 2019接收论文<Structured Knowledge Distillati ...

  8. 微软亚研院20周年独家撰文:数据智能的现在与未来

    文:微软亚洲研究院软件分析组 来源:雷锋网 摘要:今年是微软亚洲研究院(MSRA)20周年,站在这个大节点上,MSRA副院长张冬梅以及她的团队写了这篇有关数据智能的文章,对该领域的发展和未来进行梳理. ...

  9. NeurIPS 2020 | 微软亚研院论文摘录之强化学习GAN篇

    编者按:12月6日至12日,国际人工智能顶级会议 NeurIPS 2020 在线上举办.相比前几年,NeurIPS2020 无论是论文的投稿数量还是接收率都创下了记录:论文投稿数量创历史最高记录,相比 ...

最新文章

  1. Google Test(GTest)使用方法和源码解析——模板类测试技术分析和应用
  2. 接口是什么意思_程序员天天用却不懂得冷知识,这两句口诀,让你理解RESTful接口...
  3. ACM入门之【图论习题】
  4. KMP算法的来龙去脉
  5. tensorflow计算图_简单谈谈Tensorflow的运行机制
  6. OpenGL Multi Texture多重纹理的实例
  7. 使用Express在Node.js中实现非常基本的路由
  8. 关于PHPExcel 导出下载表格,调试器响应乱码
  9. 【rabbitmq】Queueingconsumer被废止后老代码如何做的解决方案
  10. python解释器的使用
  11. 什么是垃圾回收(转)
  12. POJ 2686 Traveling by Stagecoach
  13. 设计模式——终结者模式
  14. 归纳遇到的一些参考文献的格式问题
  15. 搭建一套直播平台需要多少钱
  16. 手机拍证件照的工具哪个好用
  17. 射频和无线技术入门--传统技术--7
  18. [MacOS] 出现 Permission denied 解决办法
  19. oracle的left join和inner join的区别
  20. C++ 打印pid和tid

热门文章

  1. spring ioc原理_这70 道Spring高频面试题,你不好奇吗?
  2. python剪刀石头布_如何用python写剪刀石头布
  3. java代码限制短信发送次数_java如何实现发短息限制日发送次数代码
  4. java符号引用 直接引用_java虚拟机的符号引用和直接引用
  5. python中的zip是什么意思_python中zip是什么函数
  6. python组件化软件github_GitHub - 872409/wepy: 小程序组件化开发框架
  7. 计算机网络英文题库,强烈推荐计算机网络英文试题库(附答案)chapter.doc
  8. 【debug】requests.exceptions.ChunkedEncodingError: (‘Connection broken: IncompleteRead(0 bytes read)‘
  9. oracle恢复RAC到单机
  10. python面向对象编程98讲_谈面向对象的编程(Python)