感谢阅读腾讯AI Lab第44篇文章。本文将介绍“Tencent ML-Images”项目正式开源情况。

今日,腾讯AI Lab宣布正式开源“Tencent ML-Images”项目,该项目由多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101构成。

该项目的开源,是腾讯AI Lab在计算机视觉领域所累积的基础能力的一次释放,为人工智能领域的科研人员和工程师提供了充足的高质量训练数据,及简单易用、性能强大的深度学习模型,促进人工智能行业共同发展。

项目访问地址:

https://github.com/Tencent/tencent-ml-images

腾讯AI Lab此次公布的图像数据集ML-Images,包含了1800万图像和1.1万多种常见物体类别,在业内已公开的多标签图像数据集中规模最大,足以满足一般科研机构及中小企业的使用场景。此外,基于ML-Images训练得到的深度残差网络ResNet-101,具有优异的视觉表示能力和泛化性能,在当前业内同类模型中精度最高,将为包括图像、视频等在内的视觉任务提供强大支撑,并助力图像分类、物体检测、物体跟踪、语义分割等技术水平的提升。

本次正式开源,其主要内容包括:

  1. ML-Images数据集的全部图像URLs,以及相应的类别标注。因原始图像版权问题,此次开源将不直接提供原始图像,用户可利用腾讯AI Lab提供的下载代码和URLs自行下载图像。

  2. ML-Images数据集的详细介绍。包括图像来源、图像数量、类别数量、类别的语义标签体系、标注方法,以及图像的标注数量等统计量。

  3. 完整的代码和模型。腾讯AI Lab提供的代码涵盖从图像下载和图像预处理,到基于ML-Images的预训练和基于ImageNet的迁移学习,再到基于训练所得模型的图像特征提取的完整流程。项目提供了基于小数据集的训练示例,以方便用户快速体验该训练流程。项目还提供了具有极高精度的ResNet-101模型(在单标签基准数据集ImageNet的验证集上的top-1精度为80.73%)。用户可根据自身需求,随意选用该项目的代码或模型。

以深度神经网络为典型代表的深度学习技术已经在很多领域充分展现出其优异的能力,尤其是计算机视觉领域,包括图像和视频的分类、理解和生成等重要任务。然而,要充分发挥出深度学习的视觉表示能力,必须建立在充足的高质量训练数据、优秀的模型结构和模型训练方法,以及强大的的计算资源等基础能力之上。

各大科技公司都非常重视人工智能基础能力的建设,都建立了仅面向其内部的大型图像数据集,例如谷歌的JFT-300M和Facebook的Instagram数据集。但这些数据集及其训练得到的模型都没有公开,对于一般的科研机构和中小企业来说,这些人工智能基础能力有着非常高的门槛。

当前业内公开的最大规模的多标签图像数据集是谷歌公司的Open Images, 包含900万图像和6000多物体类别。腾讯AI Lab此次开源的ML-Images数据集包括1800万图像和1.1万多常见物体类别,或将成为新的行业基准数据集。

此外,基于ML-Images训练得到的ResNet-101模型,具有优异的视觉表示能力和泛化性能。通过迁移学习,该模型在ImageNet验证集上取得了80.73%的top-1分类精度,超过谷歌同类模型(迁移学习模式)的精度,且值得注意的是,ML-Images的规模仅为JFT-300M的约1/17。这充分说明了ML-Images的高质量和训练方法的有效性。详细对比如下表。

注:微软ResNet-101模型为非迁移学习模式下训练得到,即1.2M预训练图像为原始数据集ImageNet的图像。

腾讯AI Lab此次开源的“Tencent ML-Images”项目,展现了腾讯在人工智能基础能力建设方面的努力,以及希望通过基础能力的开放促进行业共同发展的愿景。

“Tencent ML-Images”项目的深度学习模型,目前已在腾讯多项业务中发挥重要作用,如“天天快报”的图像质量评价与推荐功能,其后台测试的日调用量已达1000万次。

如下图所示,天天快报新闻封面图像的质量得到明显提高。

左图为优化前,右图为优化后

此外,腾讯AI Lab团队还将基于Tencent ML-Images的ResNet-101模型迁移到很多其他视觉任务,包括图像物体检测,图像语义分割,视频物体分割,视频物体跟踪等。这些视觉迁移任务进一步验证了该模型的强大视觉表示能力和优异的泛化性能。“Tencent ML-Images”项目未来还将在更多视觉相关的产品中发挥重要作用。

自2016年腾讯首次在GitHub上发布开源项目(https://github.com/Tencent),目前已累积开源覆盖人工智能、移动开发、小程序等领域的57个项目。为进一步贡献开源社区,腾讯相继加入Hyperledger、LF Networking和开放网络基金会,并成为LF深度学习基金会首要创始成员及Linux基金会白金会员。作为腾讯“开放”战略在技术领域的体现,腾讯开源将继续对内推动技术研发向共享、复用和开源迈进,向外释放腾讯研发实力,为国内外开源社区提供技术支持,注入研发活力。

腾讯AI Lab正式开源业内最大规模多标签图像数据集相关推荐

  1. 研究做得好,贡献也要大!腾讯AI Lab正式开源业内最大规模多标签图像数据集...

    点击我爱计算机视觉标星,更快获取CVML新技术 人工智能的能源是什么?是数据!要问这个世界上谁拥有图片数据最多?谷歌?亚马逊?Flicker?腾讯?阿里巴巴?52CV君不知道,但我每天几乎都在微信和Q ...

  2. 腾讯 AI Lab 开源业内最大规模多标签图像数据集

    2018年9月10日,腾讯AI Lab宣布将于9月底开源"Tencent ML-Images"项目,该项目由多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最 ...

  3. 腾讯AI Lab开源业内最大规模多标签图像数据集(附下载地址)

    今日(10 月 18 日),腾讯AI Lab宣布正式开源"Tencent ML-Images"项目.该项目由多标签图像数据集 ML-Images,以及业内目前同类深度学习模型中精度 ...

  4. 业内最大规模多标签图像数据集开源 | GitHub资源

    允中 发自 凹非寺  量子位 报道 | 公众号 QbitAI 开源地址来了. 上个月,腾讯AI实验室宣布开源多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络Re ...

  5. 腾讯开源业内最大多标签图像数据集,附ResNet-101模型

    允中 发自 凹非寺  量子位 报道 | 公众号 QbitAI 鹅厂福利,又是开源. 最迟本月月底,腾讯AI Lab将开源"Tencent ML-Images"项目. 不仅要开源多标 ...

  6. 腾讯 AI Lab 正式开源PocketFlow自动化深度学习模型压缩与加速框架

    11月1日,腾讯AI Lab在南京举办的腾讯全球合作伙伴论坛上宣布正式开源"PocketFlow"项目, 该项目是一个自动化深度学习模型压缩与加速框架,整合多种模型压缩与加速算法并 ...

  7. AI一分钟 | 特斯拉再融46亿;腾讯AI Lab宣布开源多标签图像数据集

    ▌特斯拉再融 46 亿 近日,<证券日报>记者登录上海市工商行政管理局官网发现,特斯拉(上海)有限公司的注册资本已由 1 亿元增至 46.7 亿元,这意味着马斯克凭借特斯拉这匾金字招牌在上 ...

  8. 腾讯开源ML-Images,超越谷歌成业内最大多标签图像数据集

    策划编辑 | Vincent 作者 | 腾讯 AI Lab 采访 | Natalie 编辑 | Vincent AI 前线导读:2018 年 9 月 10 日,腾讯 AI Lab 宣布将于 9 月底开 ...

  9. 腾讯开源最大规模多标签图像数据集,刷新行业数据集基准

    ↑ 点击上方[计算机视觉联盟]关注我们 腾讯 AI Lab 公布的图像数据集 ML-Images,包含了 1800 万图像和 1.1 万多种常见物体类别,在业内已公开的多标签图像数据集中规模最大,足以 ...

最新文章

  1. java初始化一个链表_Java 链表(LinkNode)的简单操作:初始化,遍历,插入,删除等...
  2. AI 时代,还不了解大数据?
  3. Search Engine —— Regular Expression(Spider)
  4. 主机Ping扫描自动化工具
  5. 北大OJ(POJ 2808)校门外的树
  6. BZOJ1877:[SDOI2009]晨跑——题解
  7. ssis zip压缩文件_在SSIS中处理参差不齐的正确格式的文件
  8. SQLServer2008设置开启INTERNET远程连接
  9. JSON Assertion(JSON断言)
  10. redis实现订单过期取消
  11. 关于彻底卸载流氓 “趋势科技防毒网络版客户端”最详细步骤,亲测有效
  12. 教室多媒体计算机主频,多媒体教室配置和列表.doc
  13. IDEA+EmmyLua配置
  14. abb机器人伺服电机报闸是什么_ABB机器人伺服电机刹车失灵,抱闸卡死维修
  15. (转)如何成为一名优秀的程序员?
  16. kali2020.3安装openvas(gvm11)附gvm修改amdin密码以及gvm创建账号
  17. graph sage 翻译
  18. JAVA中webSockt一对一聊天
  19. Yahoo Programming Contest 2019 D - Ears
  20. 常见图文组合以及溢出隐藏

热门文章

  1. 来和小伙伴一起学习响应式网页设计吧
  2. EntityFramework 启用迁移 Enable-Migrations 报异常 No context type was found in the assembly
  3. JVM编译时和运行时状态
  4. 深入浅出之正则表达式(二)(转载)
  5. XML与JavaBean相互转换工具
  6. 中石油训练赛 - 手机号码(简单分块+思维)
  7. 深度linux安装postgresql_在 Linux 上安装 PostgreSQL
  8. EXE和SYS通信(ReadFile WriteFile DO_BUFFERED_IO) 缓冲区方式
  9. 原来!我在4年前就开始体验雾游戏了!
  10. ClickHouse 副本协同原理:ReplicatedMergeTree引擎