今天上海交大的研究学者发文 MedMNIST Classification Decathlon: A Lightweight AutoML Benchmark for Medical Image Analysis ,公布了其收集整理的10个医学领域的图像数据集MedMNIST,旨在促进AutoML(自动机器学习)在医学领域的技术研究。

作者信息:

这10个数据集示例:

该数据集特点:

  • 利于研究教学:数据来自具有知识共享(CC)许可的多个开放式医学图像数据集,易于用于教育目的。

  • 标准化:将数据预处理为相同格式,无需用户了解任何背景知识

  • 多样性:涵盖了各种数据规模(从100到100,000)和任务(二分类/多类分类,有序回归和多标签学习)。

  • 轻量级:28×28的图像大小适合快速原型设计和试验多模态机器学习和AutoML算法。

该数据集相关统计:

可见覆盖了常见的医学影像数据源:病理图片、胸部X光、皮肤镜、超声、眼底摄影、OCT、CT等。

另外,作者提供了代码,在此10个数据集上进行了人工设计网络和常见AutoML工具设计的模型的评测,结果如下:

可见:

  • Google AutoML Vision 在大多数情况下都表现不错,但相比手工设计的 ResNet-18/50也有逊色的时候;

  • auto-sklearn 的表现一直很稳定的差 /sad;

  • AutoKeras 在数据量较大的数据集上表现很好,在数据量小时往往不佳。

总之,以上AutoML工具在MedMNIST面前没有完美胜出者,这也说明MedMNIST对于研究者来说是个好数据集。

最后附上项目主页:

https://medmnist.github.io/

论文地址:

https://arxiv.org/abs/2010.14925

Demo代码地址:

https://github.com/MedMNIST/MedMNIST

下载:

原数据地址国内无法下载,不过不用担心,在“我爱计算机视觉”公众号后台回复“MedMNIST”,即可收到论文、代码、数据打包下载链接。

END

备注:医学影像

医学影像处理识别交流群

医学影像CT、MRI、X光处理、分类、检测、分割等技术,

若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看,让更多人看到  

MedMNIST:上海交大发布医学影像领域的MNIST(附下载)相关推荐

  1. NIHCC发布迄今世界最大的CT医学影像数据集(附下载)

    点击我爱计算机视觉标星,更快获取CVML新技术 写在前面:这篇文章之前曾经发过,但最近频频有朋友问下载地址,其实52CV君早就把这个超大数据库下载并在百度云分享给大家啦(52CV是国内第一个报道此数据 ...

  2. IDC发布对话式人工智能白皮书|附下载

    来源:专知丨公众号 近日,全球著名的信息技术.电信行业和消费科技咨询公司IDC(国际数据公司, International Data Corporation)发布了<对话式人工智能白皮书> ...

  3. 【报告分享】短视频创作者作品发布时间研究报告-小葫芦(附下载)

    摘要:对于个人头部创作者来说,他们作品的点赞量往往会在一周中的周四.周五发布效果最佳.大概是临近周末,一周中重要的事也忙的差不多,因此他们把更多精力投入到了娱乐当中来.我们可以看到,在周日发布作品的数 ...

  4. GIS软件开发工具包TatukGIS Developer Kernel 发布 v11.3.0-Unstable1丨附下载

    2019独角兽企业重金招聘Python工程师标准>>> [最新TatukGIS Developer Kernel点击下载>>>] TatukGIS Develope ...

  5. 世界级版本控制工具Vault v10.0发布,多项功能改进|附下载

    2019独角兽企业重金招聘Python工程师标准>>> 版本控制工具Vault 版本更新至v10.0,增加了对SQL Server 2016,Visual Studio 2017等的 ...

  6. GIS软件开发工具包TatukGIS Developer Kernel 发布 v11.3.0-Unstable1丨附下载 1

    最新TatukGIS Developer Kernel下载地址:https://www.evget.com/product... TatukGIS Developer Kernel(DK)是一个用于开 ...

  7. 上海交大发布 MedMNIST 医学图像分析数据集 新基准

    来源 | HyperAI超神经 责编 | 晋兆雨 头图 | 付费下载于视觉中国 内容概要:医学图像分析是一个非常复杂的跨学科领域,近日上海交通大学发布了 MedMNIST 数据集,有望促进医学图像分析 ...

  8. 【深度学习】上海交大发布 MedMNIST 医学图像分析数据集 新基准

    By 超神经 内容概要:医学图像分析是一个非常复杂的跨学科领域,近日上海交通大学发布了 MedMNIST 数据集,有望促进医学图像分析的发展. 关键词:医学图像分析   公开数据集  令人头秃的医学图 ...

  9. TensorFlow发布语音识别入门教程,附1GB数据集代码

    原标题:TensorFlow发布语音识别入门教程,附1GB数据集&代码 机械鸡的鸡友经常问:如何开始入门深度学习语音和其他音频识别,例如关键字检测或语音命令. 虽然有一些伟大的开源语音识别系统 ...

最新文章

  1. 如何构建可解释的推荐系统?| 深度
  2. 一次数据库泄露的解决经历
  3. python的scramy架构_Python库: PrettyTable 模块
  4. chrome 插件开发心得
  5. Java中 equals() 和 == 的区别
  6. 寄云-Paas云服务体验
  7. windows安装包删了会有影响吗_win7系统删除系统更新安装包的详细教程
  8. log4j在web中的使用
  9. SSH框架的工作原理
  10. java跑酷游戏_HTML5游戏实战(1):50行代码实现正面跑酷游戏
  11. 《腾讯传》四、从寄生虫到蜕变上市—企鹅的成人礼
  12. Excel中快速填充产生连续的数字编号
  13. 上市公司股利分红数据(1991-2020)
  14. EndeavourOS移动硬盘安装
  15. ks值和auc值的关系
  16. win10计算机盘符如何,WIN10修改盘符怎么更改
  17. 解 ACM 题的能力真的代表编程能力吗?
  18. c语言的数据类型有什么 long int,C语言的三种整型数据类型:INT SHORT INT和LONG INT...
  19. 用户运营体系中,用户精细化运营闭环是怎样的
  20. 【论文阅读】(2017)The late acceptance Hill-Climbing heuristic

热门文章

  1. 自适应关于帧场编码问题
  2. Redis事务及持久化
  3. MyBatis框架 传参、事务、缓存(二级)
  4. MySQL之User(用户)和Privilege(权限)
  5. MySQL之DQL(查询)语句
  6. Golang笔记—面向对象编程
  7. [Editor][002][Emacs] 从零到高级的进阶 - 实践开发 - 帮助菜单主页
  8. 【环境搭建001】ubuntu 和 win7 在vm 下的文件夹共享实践
  9. java 图片合并_Java如何实现图片的叠加与拼接操作
  10. hbase 预写日志_HBase存储结构