原文:

Skin Cancer MNIST: HAM10000

a large collection of multi-source dermatoscopic images of pigmented lesions.

Training of neural networks for automated diagnosis of pigmented skin lesions is hampered by the small size and lack of diversity of available dataset of dermatoscopic images. We tackle this problem by releasing the HAM10000 ("Human Against Machine with 10000 training images") dataset. We collected dermatoscopic images from different populations, acquired and stored by different modalities. The final dataset consists of 10015 dermatoscopic images which can serve as a training set for academic machine learning purposes. Cases include a representative collection of all important diagnostic categories in the realm of pigmented lesions: Actinic keratoses and intraepithelial carcinoma / Bowen's disease (akiec), basal cell carcinoma (bcc), benign keratosis-like lesions (solar lentigines / seborrheic keratoses and lichen-planus like keratoses, bkl), dermatofibroma (df), melanoma (mel), melanocytic nevi (nv) and vascular lesions (angiomas, angiokeratomas, pyogenic granulomas and hemorrhage, vasc).

More than 50% of lesions are confirmed through histopathology (histo), the ground truth for the rest of the cases is either follow-up examination (followup), expert consensus (consensus), or confirmation by in-vivo confocal microscopy (confocal). The dataset includes lesions with multiple images, which can be tracked by the lesionid-column within the HAM10000_metadata file.

The test set is not public, but the evaluation server remains running (see the challenge website). Any publications written using the HAM10000 data should be evaluated on the official test set hosted there, so that methods can be fairly compared.

译:

皮肤癌患者:HAM10000

大量多源皮肤镜图像的色素病变。

人工神经网络用于色素沉着性皮损的自动诊断的训练由于皮肤镜图像数据集的小和缺乏多样性而受到阻碍。我们通过发布HAM10000(“具有10000个训练图像的人对机器”)数据集来解决这个问题。我们收集了不同人群的皮肤镜图像,通过不同的方式采集和存储。最后的数据集由10015张皮肤镜图像组成,可以作为学术机器学习的训练集。病例包括色素性病变领域所有重要诊断类别的代表性集合:光化性角化病和上皮内癌/博文病(akiec)、基底细胞癌(bcc)、良性角化样病变(日光性皮疹/脂溢性角化病和扁平苔藓样角化病,bkl),皮肤纤维瘤(df)、黑色素瘤(mel)、黑色素细胞痣(nv)和血管病变(血管瘤、血管角化瘤、化脓性肉芽肿和出血、血管病变)。

超过50%的病变是通过组织病理学(histo)证实的,其余病例的基本事实要么是随访检查(follow-up)、专家共识(consensition),要么是体内共焦显微镜(confocal)确认。数据集包含多个图像的病灶,这些图像可以通过HAM10000_元数据文件中的lesionid列进行跟踪。

测试集不是公共的,但评估服务器仍在运行(请参阅challenge网站)。任何使用HAM10000数据编写的出版物都应该在官方测试集上进行评估,这样就可以对方法进行公平的比较。

大家可以到官网地址下载数据集,我自己也在百度网盘分享了一份。可关注本人公众号,回复“2020101702”获取下载链接。

Skin Cancer MNIST(皮肤癌患者相关数据集)相关推荐

  1. 【深度学习】机器学习\深度学习常见相关公开数据集汇总(图像处理相关数据集、自然语言处理相关数据集、语音处理相关数据集)

    一.前言 1. 介绍 常来说,深度学习的关键在于实践.从图像处理到语音识别,每一个细分领域都有着独特的细微差别和解决方法. 然而,你可以从哪里获得这些数据呢?现在大家所看到的大部分研究论文都用的是专有 ...

  2. 【radar】毫米波雷达相关数据集(检测、跟踪、里程计、SLAM、定位、场景识别)总结(1)

    毫米波雷达相关数据集(检测.跟踪.里程计.SLAM.定位.场景识别)总结(1) Radar相关产品和链接 TI AWR2243 Arbe Phoenix Continental ARS 540 Ocu ...

  3. 将MNIST手写数字数据集导入NumPy数组(《深度学习入门:基于Python的理论与实现》实践笔记)

    将MNIST手写数字数据集导入NumPy数组(<深度学习入门:基于Python的理论与实现>实践笔记) 一.下载MNIST数据集(使用urllib.request.urlretrieve( ...

  4. 人工智能相关数据集分享(一)

    目录 NLP语料库数据集 爬虫类数据集 问答类数据集 情感分析类数据集 实体识别类数据集 CV类数据集 NLP语料库数据集 1.2016-2019新闻联播语料库(11.3MB) 2.中国对联数据集(2 ...

  5. 自动驾驶——车道线检测相关数据集整理

    自动驾驶视觉方向的分支车道线检测需要的相关数据集 暂时没有好好整理,先作个记录: 1.KITTI KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,主要于算法评测. KITTI数据 ...

  6. MICCAI 2020 Challenges相关数据集下载

    转载自 原文链接:https://blog.csdn.net/sinat_34686158/article/details/106918107 1 REFUGE2 2nd Retinal Fundus ...

  7. mnist手写数字数据集_mnist手写数据集(1. 加载与可视化)

    >>欢迎 点赞,留言,收藏加关注<< 1. 模型构建的步骤: 在构建AI模型时,一般有以下主要步骤:准备数据.数据预处理.划分数据集.配置模型.训练模型.评估优化.模型应用,如 ...

  8. 用Python实现BP神经网络识别MNIST手写数字数据集(带GUI)

    概述 计算机神经网络则是人工智能中最为基础的也是较为重要的部分,它使用深度学习的方式模拟了人的神经元的工作,是一种全新的计算方法.本文的目标就是通过学习神经网络的相关知识,了解并掌握BP神经网络的实现 ...

  9. matlab 对mnist手写数字数据集进行判决分析_Python神经网络编程:手写数字的数据集MNIST...

    识别人的笔迹这个问题相对复杂,也非常模糊,因此这是一种检验人工智能的理想挑战.这不像进行大量数字相乘那样明确清晰. 让计算机准确区分图像中包含的内容,有时也称之为图像识别问题.科学家对这个问题进行了几 ...

最新文章

  1. 《Linux命令行与shell脚本编程大全 第3版》Shell脚本编程基础---43
  2. 数据结构实验之栈与队列二:一般算术表达式转换成后缀式
  3. GFS - The Google File System
  4. Python 中三大框架各自的应用场景
  5. 使用视觉信息,为什么能把移动机器人的空间位置信息记录下来
  6. ClassFinal 加密 Java class文件工具
  7. autowired 静态方法使用_静态方法中调用Spring注入过程解析
  8. 使oracle支持dbo,Oracle.ManagedDataAccess.EntityFramework – ORA-01918:用户’dbo’不存在
  9. MySQL数据误删恢复
  10. 连载《国培计划》骨干教师的研修日志之七:N个老师的日志
  11. 你真的会用ls命令吗?--文件管理命令(ls命令详解)
  12. java用代码实现星期菜谱,基于jsp的家庭食谱管理-JavaEE实现家庭食谱管理 - java项目源码...
  13. shell学习-基础篇
  14. 永信至诚助“海南省首届网络安全大赛”决赛圆满收官
  15. LVOOP(一)、如何创建类、属性和方法
  16. 猫眼APP影院静态界面
  17. 怎么画动漫人物衣服衣纹
  18. C++练手小项目:职工工资信息管理系统
  19. 华为发布敏捷交换机备战大数据
  20. ChemDraw绘制苯甲酸钠的生成反应式的方法

热门文章

  1. unity 双屏,多屏幕显示
  2. 自学python后自己接单-详解 | Python学多久才能独立接单赚钱?一个月足够了!
  3. Python文字转换语音,抠脚大汉秒变撒娇萌妹
  4. JS操作word文档
  5. 2023第八届少儿模特明星盛典 小超模李迦曈 担任全球赛小主持人
  6. 设计模式五:原型模式
  7. 传大疆北美裁员1/3,离职高管透露内部斗争严重
  8. 简单的问卷调查发邮件程序
  9. HTML5+CSS3小实例:篮球弹跳动画
  10. 【低智版狗屁不通文章生成器】Python 基于一条语法随机生成简单中文句子的小练习