腾讯 AI Lab 开源业内最大规模多标签图像数据集
2018年9月10日,腾讯AI Lab宣布将于9月底开源“Tencent ML-Images”项目,该项目由多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101构成。
腾讯AI Lab此次公布的图像数据集ML-Images,包含了1800万图像和1.1万多种常见物体类别,在业内已公开的多标签图像数据集中规模最大,足以满足一般科研机构及中小企业的使用场景。此外,腾讯AI Lab还将提供基于ML-Images训练得到的深度残差网络ResNet-101。该模型具有优异的视觉表示能力和泛化性能,在当前业内同类模型中精度最高,将为包括图像、视频等在内的视觉任务提供强大支撑,并助力图像分类、物体检测、物体跟踪、语义分割等技术水平的提升。
以深度神经网络为典型代表的深度学习技术已经在很多领域充分展现出其优异的能力,尤其是计算机视觉领域,包括图像和视频的分类、理解和生成等重要任务。然而,要充分发挥出深度学习的视觉表示能力,必须建立在充足的高质量训练数据、优秀的模型结构和模型训练方法,以及强大的的计算资源等基础能力之上。
各大科技公司都非常重视人工智能基础能力的建设,都建立了仅面向其内部的大型图像数据集,例如谷歌的JFT-300M和Facebook的Instagram数据集。但这些数据集及其训练得到的模型都没有公开,对于一般的科研机构和中小企业来说,这些人工智能基础能力有着非常高的门槛。
当前业内公开的最大规模的多标签图像数据集是谷歌公司的Open Images, 包含900万训练图像和6000多物体类别。腾讯AI Lab此次开源的ML-Images数据集包括1800万训练图像和1.1万多常见物体类别,或将成为新的行业基准数据集。除了数据集,腾讯AI Lab团队还将在此次开源项目中详细介绍:
1)大规模的多标签图像数据集的构建方法,包括图像的来源、图像候选类别集合、类别语义关系和图像的标注。在ML-Images的构建过程中,团队充分利用了类别语义关系来帮助对图像的精准标注。
2)基于ML-Images的深度神经网络的训练方法。团队精心设计的损失函数和训练方法,可以有效抑制大规模多标签数据集中类别不均衡对模型训练的负面影响。
3)基于ML-Images训练得到的ResNet-101模型,具有优异的视觉表示能力和泛化性能。通过迁移学习,该模型在ImageNet验证集上取得了80.73%的top-1分类精度,超过谷歌同类模型(迁移学习模式)的精度,且值得注意的是,ML-Images的规模仅为JFT-300M的约1/17。这充分说明了ML-Images的高质量和训练方法的有效性。详细对比如下表。
注:微软ResNet-101模型为非迁移学习模式下训练得到,即1.2M预训练图像为原始数据集ImageNet的图像。
“Tencent ML-Images”项目的深度学习模型,目前已在腾讯多项业务中发挥重要作用,如“天天快报”的图像质量评价与推荐功能。如下图所示,天天快报新闻封面图像的质量得到明显提高。
此外,腾讯AI Lab团队还将基于Tencent ML-Images的ResNet-101模型迁移到很多其他视觉任务,包括图像物体检测,图像语义分割,视频物体分割,视频物体跟踪等。这些视觉迁移任务进一步验证了该模型的强大视觉表示能力和优异的泛化性能。“Tencent ML-Images”项目未来还将在更多视觉相关的产品中发挥重要作用。
腾讯 AI Lab 开源业内最大规模多标签图像数据集相关推荐
- 腾讯AI Lab开源业内最大规模多标签图像数据集(附下载地址)
今日(10 月 18 日),腾讯AI Lab宣布正式开源"Tencent ML-Images"项目.该项目由多标签图像数据集 ML-Images,以及业内目前同类深度学习模型中精度 ...
- 腾讯AI Lab正式开源业内最大规模多标签图像数据集
感谢阅读腾讯AI Lab第44篇文章.本文将介绍"Tencent ML-Images"项目正式开源情况. 今日,腾讯AI Lab宣布正式开源"Tencent ML-Ima ...
- 研究做得好,贡献也要大!腾讯AI Lab正式开源业内最大规模多标签图像数据集...
点击我爱计算机视觉标星,更快获取CVML新技术 人工智能的能源是什么?是数据!要问这个世界上谁拥有图片数据最多?谷歌?亚马逊?Flicker?腾讯?阿里巴巴?52CV君不知道,但我每天几乎都在微信和Q ...
- 业内最大规模多标签图像数据集开源 | GitHub资源
允中 发自 凹非寺 量子位 报道 | 公众号 QbitAI 开源地址来了. 上个月,腾讯AI实验室宣布开源多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络Re ...
- 腾讯开源业内最大多标签图像数据集,附ResNet-101模型
允中 发自 凹非寺 量子位 报道 | 公众号 QbitAI 鹅厂福利,又是开源. 最迟本月月底,腾讯AI Lab将开源"Tencent ML-Images"项目. 不仅要开源多标 ...
- 800万中文词,腾讯AI Lab开源大规模NLP数据集
参加 2018 AI开发者大会,请点击 ↑↑↑ 10 月19 日,腾讯 AI Lab 宣布开源大规模.高质量的中文词向量数据.该数据包含 800 多万中文词汇. 腾讯 AI Lab 表示,相比现有的公 ...
- 腾讯AI Lab开源世界首款自动化模型压缩框架PocketFlow:将深度学习装进口袋
来源:腾讯AI 实验室 腾讯AI Lab机器学习中心今日宣布成功研发出世界上首款自动化深度学习模型压缩框架--PocketFlow,并即将在近期发布开源代码.这是一款面向移动端AI开发者的自动模型压缩 ...
- 腾讯AI Lab开源大规模高质量中文词向量数据,800万中文词随你用
今日,腾讯AI Lab 宣布开源大规模.高质量的中文词向量数据.该数据包含800多万中文词汇,相比现有的公开数据,在覆盖率.新鲜度及准确性上大幅提高,为对话回复质量预测和医疗实体识别等自然语言处理方向 ...
- 优秀!腾讯AI Lab开源模型压缩与加速框架PocketFlow!
点击我爱计算机视觉标星,更快获取CVML新技术 PocketFlow,成熟高效的模型压缩与加速框架,经过腾讯内部AI技术商用实践检验,你值得拥有- 以下内容来自腾讯AI实验室(tencent_aila ...
最新文章
- Myeclipse中项目没有代码错误提示,jsp页面无编译迹象?如何解决
- Java 匿名类也能使用构造函数
- VS 2008 mfc 智能应用程序 调用 C# webservice.(二)(gsoap+wince)
- 关于argc和argv的输出
- 解析底层原理!Android开发者面试如何系统复习?帮你突破瓶颈
- 使用 docker 搭建 nginx+php-fpm 环境 (两个独立镜像)
- 拔刀剑服务器r87修复版,我的世界拔刀剑mod刀剑修复教程
- python中map函数返回值类型_Python函数精解:map函数
- 把dataset作为一个xml文件传给客户端
- 计算机网络-自顶向下方法(7th) 第四章 Review Questions 英文题目
- Android下的默认字体详解
- OpenWrt开发必备软件模块——网络管理(CWMP、SSH、QoS、SMTP、NTP、uHTTPd)
- 纯原生js自定义弹窗
- 开课通知 | 2021FPGA寒假班/就业班开课啦!
- windows录屏_Windows及苹果电脑录屏攻略
- input type=file选择图片按钮样式修改与图片预览
- 百度网盘不限速下载网页版
- Argument of type ‘‘ is not assignable to parameter of type ‘never‘.
- 数学界“诺奖”阿贝尔奖揭晓,颁给数学与计算机交叉学科,奖金约合575万元...
- 达人合作加持品牌布局,3.8女神玩转流量策略!
热门文章
- linux中使用CST时间
- Linux下查找nginx配置文件路径
- 计算机中音乐设备数字接口,一种计算机用声卡封存装置的制作方法
- 国内工业软件行业分析
- 自动驾驶产业链全梳理
- 2018牛客暑期ACM多校训练营第二场 - A题
- 金融数据分析(二)-------基本资本,金融衍生品,资本收益率
- Alpha冲刺(9/10)
- 移动端iPhone系列适配问题的一些坑
- basePath = request.getScheme()+://+request.getServerName()+:+r