腾讯AI Lab开源业内最大规模多标签图像数据集(附下载地址)
今日(10 月 18 日),腾讯AI Lab宣布正式开源“Tencent ML-Images”项目。该项目由多标签图像数据集 ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络 ResNet-101 构成。
该开源项目的主要内容包括:
1、ML-Images 数据集的全部图像 URLs,以及相应的类别标注。出于原始图像版权的考虑,此次开源将不直接提供原始图像,用户可利用我们提供的下载代码和 URLs 自行下载图像。
2、ML-Images 数据集的详细介绍,包括图像来源,图像数量,类别数量,类别的语义标签体系,标注方法,以及图像的标注数量等统计量。
3、完整的代码和模型。我们提供的代码涵盖从图像下载,图像预处理,基于 ML-Images 的预训练,基于 ImageNet 的迁移学习,到基于训练所得模型的图像特征提取的完整流程。该项目提供了基于小数据集的训练示例,以方便用户快速体验我们的训练流程。该项目还提供了非常高精度的 ResNet-101 模型(在单标签基准数据集 ImageNet 的验证集上的 top-1 精度为 80.73%)。用户可根据自身需求,随意选用该项目的代码或模型。
以深度神经网络为典型代表的深度学习技术已经在很多领域充分展现出其优异的能力,尤其是计算机视觉领域,包括图像和视频的分类、理解和生成等重要任务。然而,要充分发挥出深度学习的视觉表示能力,必须建立在充足的高质量训练数据、优秀的模型结构和模型训练方法,以及强大的的计算资源等基础能力之上。
腾讯 AI Lab团队将基于 Tencent ML-Images 的 ResNet-101 模型迁移到很多其他视觉任务,包括图像物体检测,图像语义分割,视频物体分割,视频物体跟踪等。
应用于“天天快报”新闻封面图像的质量得到明显提高
这些视觉迁移任务进一步验证了该模型的强大视觉表示能力和优异的泛化性能。“Tencent ML-Images”项目未来还将在更多视觉相关的产品中发挥重要作用。
开源地址:
https://github.com/Tencent/tencent-ml-images
【完】
2018 AI开发者大会
2018 AI开发者大会是一场由中美人工智能技术高手联袂打造的AI技术与产业的年度盛会!是一场以技术落地为导向的干货会议!大会设置了10场技术专题论坛,力邀15+硅谷实力讲师团和80+AI领军企业技术核心人物,多位一线经验大咖带你将AI从云端落地。
大会日程以及嘉宾议题请查看下方海报(点击查看大图)
腾讯AI Lab开源业内最大规模多标签图像数据集(附下载地址)相关推荐
- 腾讯 AI Lab 开源业内最大规模多标签图像数据集
2018年9月10日,腾讯AI Lab宣布将于9月底开源"Tencent ML-Images"项目,该项目由多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最 ...
- 腾讯AI Lab正式开源业内最大规模多标签图像数据集
感谢阅读腾讯AI Lab第44篇文章.本文将介绍"Tencent ML-Images"项目正式开源情况. 今日,腾讯AI Lab宣布正式开源"Tencent ML-Ima ...
- 研究做得好,贡献也要大!腾讯AI Lab正式开源业内最大规模多标签图像数据集...
点击我爱计算机视觉标星,更快获取CVML新技术 人工智能的能源是什么?是数据!要问这个世界上谁拥有图片数据最多?谷歌?亚马逊?Flicker?腾讯?阿里巴巴?52CV君不知道,但我每天几乎都在微信和Q ...
- 业内最大规模多标签图像数据集开源 | GitHub资源
允中 发自 凹非寺 量子位 报道 | 公众号 QbitAI 开源地址来了. 上个月,腾讯AI实验室宣布开源多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络Re ...
- 腾讯开源业内最大多标签图像数据集,附ResNet-101模型
允中 发自 凹非寺 量子位 报道 | 公众号 QbitAI 鹅厂福利,又是开源. 最迟本月月底,腾讯AI Lab将开源"Tencent ML-Images"项目. 不仅要开源多标 ...
- 800万中文词,腾讯AI Lab开源大规模NLP数据集
参加 2018 AI开发者大会,请点击 ↑↑↑ 10 月19 日,腾讯 AI Lab 宣布开源大规模.高质量的中文词向量数据.该数据包含 800 多万中文词汇. 腾讯 AI Lab 表示,相比现有的公 ...
- 腾讯AI Lab开源世界首款自动化模型压缩框架PocketFlow:将深度学习装进口袋
来源:腾讯AI 实验室 腾讯AI Lab机器学习中心今日宣布成功研发出世界上首款自动化深度学习模型压缩框架--PocketFlow,并即将在近期发布开源代码.这是一款面向移动端AI开发者的自动模型压缩 ...
- 腾讯AI Lab开源大规模高质量中文词向量数据,800万中文词随你用
今日,腾讯AI Lab 宣布开源大规模.高质量的中文词向量数据.该数据包含800多万中文词汇,相比现有的公开数据,在覆盖率.新鲜度及准确性上大幅提高,为对话回复质量预测和医疗实体识别等自然语言处理方向 ...
- 优秀!腾讯AI Lab开源模型压缩与加速框架PocketFlow!
点击我爱计算机视觉标星,更快获取CVML新技术 PocketFlow,成熟高效的模型压缩与加速框架,经过腾讯内部AI技术商用实践检验,你值得拥有- 以下内容来自腾讯AI实验室(tencent_aila ...
最新文章
- 兵团教师计算机水平考试免考条件,兵团职称计算机考试政策.doc
- IE8中HTTP连接数目的变化
- 应用上线前的“体检”,你知道需要检测哪些指标吗?
- bootstrap bootstraptable 固定列_1个Excel公式按条件自定义格式显示固定电话号码
- vue inheritAttrs、$attrs和$listeners使用
- liux 常用操作命令
- 如何为运行的 ARM Linux 启用 LAD2.3 版本的诊断扩展
- DTC精彩回顾—黄东旭《TiDB数据驱动的企业智能化转型新方向》丨PPT视频
- 云图说|初识华为云数据库GaussDB(for openGauss)
- float、定位、inline-block、兼容性需注意的特性总结
- 奇怪的比赛--蓝桥杯
- jdbc连oracle dns报错,近期处理的oracle问题汇总
- 为什么要使用英英词典?
- 桌面超简单小代码 bat形式
- tf data 常用操作
- matlab车牌匹配时读取,基于matlab+模板匹配的车牌识别(程序+照片+论文)
- 2.11 神奇的自定义画笔 [Ps教程]
- 堆的进化之旅5-Relaxed Heap松弛堆
- namenode 格式化 -format
- Portal Server搭建(wifidog安装)
热门文章
- 制作一个简单的linux
- SQL with NUll处理,Join系列,between,in对比exists以及少量题目
- 黄聪:穿过主机访问虚拟机中的SQL服务 FOR VMware NAT
- JDBC Driver常用连接方法列表
- Jupyter Notebook学习笔记
- Android:你好,androidX!再见,android.support
- BZOJ1391: [Ceoi2008]order
- 【bzoj1853】[Scoi2010]幸运数字 容斥原理+搜索
- 理解系统底层的概念是多么重要
- 【复盘】端端,棒棒哒!