伊瓢 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

FACEBOOK人工智能实验室何凯明博士领衔的Mask R-CNN喜提ICCV 2017最佳论文后,吸引了大量业内研究者的兴趣。

10个月后,FAIR官方公布了源代码,以及基于Caffe 2的开源物体检测平台Detectron。

但是,再好的“黑科技”也有人吐槽啊,比如,MIT的周博磊博士就曾经在知乎爆料,FAIR的实习生们对不常使用的Caffe 2一直叫苦不迭;

还有人翘首以盼官方PyTorch版本;

还有人想起TensorFlow成熟的可视化工具和文档,看着Caffe 2就开始思考人生……

“Caffe 2,从安装到放弃……”

还好最近,量子位发现有人做出了Mask R-CNN的PyTorch版本:



开源代码的贡献者是印度理工学院的小哥哥Sai Himal Allu。



 作者Sai Himal Allu

Mask R-CNN

不过说到这里,还是需要先介绍一下前面提到的目标检测大杀器Mask R-CNN。

Mask R-CNN可以说是从目标检测领域R-CNN系列的四代目了,FACEBOOK人工智能实验室(FAIR)团队以何凯明(Kaiming He)和Ross Girshick(RBG)为首的一众目标检测大佬不断更迭了许多个版本:

  • R-CNN:对每个候选区域进行特征提取,能提升一定的效率;

  • Fast R-CNN:一张图像上使用一次AlexNet,然后再得到不同区域的特征的新方法,比R-CNN快了200多倍;

  • Faster R-CNN:Fast R-CNN的升级版,训练时间和测试时间缩短十倍;

  • Mask R-CNN:像素级目标检测,不仅给出其边界框,并且对边界框内的各个像素是否属于该物体进行标记。



Mask R-CNN在MS COCO测试集的实例分割、边界框对象检测、以及人体关键点检测三项任务上,都取得了顶尖的成绩。

它的单模型边界框(bounding box)检测成绩,比上一代——Fatser-RCNN与ResNet-101和FPN结合所取得的,还要高3.6个百分点。

于是,Mask R-CNN一经推出,广受好评。



传送门全家桶

GitHub: A PyTorch implementation of the architecture of Mask RCNN, serves as an introduction to working with PyTorch
https://github.com/wannabeOG/Mask-RCNN

Mask R-CNN:
https://arxiv.org/abs/1703.06870

Detectron:
https://github.com/facebookresearch/Detectron

加入社群

量子位AI社群18群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot8入群;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot8,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)

实习生招聘

量子位正在招募活动运营实习生,策划执行AI明星公司CEO、高管等参与的线上/线下活动,有机会与AI行业大牛直接交流。工作地点在北京中关村。简历欢迎投递到quxin@qbitai.com

具体细节,请在量子位公众号(QbitAI)对话界面,回复“实习生”三个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

资源丨用PyTorch实现Mask R-CNN相关推荐

  1. Keras vs PyTorch vs Caffe:CNN实现对比

    作者|PRUDHVI VARMA 编译|VK 来源|Analytics Indiamag 在当今世界,人工智能已被大多数商业运作所应用,而且由于先进的深度学习框架,它非常容易部署.这些深度学习框架提供 ...

  2. 【深度学习】Keras vs PyTorch vs Caffe:CNN实现对比

    作者 | PRUDHVI VARMA 编译 | VK 来源 | Analytics Indiamag 在当今世界,人工智能已被大多数商业运作所应用,而且由于先进的深度学习框架,它非常容易部署.这些深度 ...

  3. Faster R CNN

    Faster R CNN 3 FASTER R-CNN 我们的Faster R CNN 由两个模块组成,第一个模块是 proposes regions 的全卷积网络,第二个是使用 proposed r ...

  4. 数据资源丨农民专业合作社专题数据库(文末有数据资源福利)

    01 农民专业合作社的定义 根据2007年7月1日实施的<中华人民共和国农民专业合作社法>第二条相关规定-- "农民专业合作社是在农村家庭承包经营基础上,同类农产品的生产经营者或 ...

  5. 虎年到,新年用Python与人工智能一起写春节对联 python+pytorch+Transformer+BiLSTM+ATTN+CNN

    艾薇巴迪大家好,虎年春节就要到了,首先在此祝大家新春快乐.虎年大吉. 用Python与人工智能一起写春联 前言 1.分析 2.配置对联项目 2.1.配置下载 2.2.数据预处理 2.3.训练 2.4. ...

  6. 物体检测丨从R-CNN到Mask R-CNN

    这篇blog是我刚入目标检测方向,导师发给我的文献导读,深入浅出总结了object detection two-stage流派Faster R-CNN的发展史,读起来非常有趣.我一直想翻译这篇博客,在 ...

  7. 重磅资源|Pytorch1.0版本的Mask R-CNN的Facebook的官方实现

    [导读]Facebook刚刚放出的基于Pytorch1.0版本的Faster R-CNN,Mask R-CNN的benchmark,比detectron更快,准确率更高. 项目地址: https:// ...

  8. 数据资源丨原始数据哪里找?这些网站要用好!(建议收藏)

    资料搜集是个相当繁琐与累的工作,也是投资入门的基本,良好的信息资料搜集能力有利于我们快速了解投资主体的基本情况,为后续的调研及一手资料的获得打下较好的基础. 目录 一.搜索引擎(重点掌握) 1.搜索关 ...

  9. FER2013人脸表情识别从零实现(Pytorch,FNN,CNN)

    学完了深度学习的理论和框架,接下来就是实践啦!相信大家在实践的时候都会去找各种的项目,本文是kaggle上面的一个深度学习小项目,目的是实现人脸表情的分类.接下来我将具体讲解实现过程,相信你只要学了深 ...

最新文章

  1. [Cocos2d-x For WP8]ActionManager动作管理
  2. matlba 正交基
  3. bootstrap缩小后div互相叠加_纯 JS 实现放大缩小拖拽踩坑之旅
  4. C语言 之建立静态链接库
  5. 真香,写代码神器!32寸曲面显示器免费送
  6. kubernetes(k8s)架构和组件,工作流程 ,资源
  7. 理解分布式一致性:Raft协议
  8. 别在Java代码里乱打日志了,这才是正确的打日志姿势!
  9. MySQL高级-SQL优化
  10. [BZOJ2049] [SDOI2008] 洞穴勘测
  11. AndroidTV开发7实现仿小米电视和各种盒子TV焦点放大缩小效果
  12. STM32入门之电路基础
  13. WebMagic抓取阿里司法拍卖信息
  14. SEGGER 的硬件异常 分析
  15. 仙童的ua741运算放大器内部电路
  16. 业界 | 数据科学家要先学逻辑回归?图样图森破!
  17. JSP报刊订阅管理系统
  18. 看我如何自制安全的远程控制工具
  19. uboot usb网卡分析
  20. 周子明:大道无疆,“驰”之以恒,在数字化时代纵横驰骋

热门文章

  1. 嘴上说着喜爱Java 9 ,身体却诚实地拥抱了Java 8
  2. 从冷战到深度学习,一文看懂机器翻译发展史
  3. TIOBE 2 月编程语言排行榜:VB 又有人要了,Go 一直在跌!
  4. iPhone X 再曝新 Bug:电话无法接听!
  5. 大佬 Python 对阵新秀 Julia ,谁能问鼎机器学习和数据科学?
  6. 马斯克澄清“我不是中本聪”,比特币创始人究竟是谁?
  7. 领英:经济图谱在中国,为人才就业勾画新版图
  8. 第 4 章 程序计数器
  9. javaweb中服务器响应,Java Web服务器响应与JSON
  10. linux重启mysql不动了,[转载]LINUX启动/重启/停上MYSQL的命令