见过对植物图片数据集的,也见过对名人人脸数据集,但你见过专门针对「秃头党」进行分类和识别的吗?

一位印度学生 Ashish Jangra ,最近在 Kaggle 上发布了一个名为「Bald Classification Dataset」的数据集。

没错,就是这个「秃头」

据介绍,Bald Classification Dataset(秃头数据集)由 Ashish Jangra 于今年 5 月发布。

数据集中包含 20 万张光头人像的图像,分为测试集、训练集、验证集三个文件夹,每个文件夹也包括 Bald 和 NotBald 两种图像。

数据集样例截图

其中秃头人像数据集的来源,主要是欧美公众人物,包含政商界、娱乐圈、体育界人士。

Bald Classification Dataset

发布人员: Ashish Jangra

包含数量:20 万张秃头人像

数据格式:JPG

数据大小:1.3 G

发布时间:2020 年 5 月

下载地址:https://hyper.ai/datasets/12385

  数据集作者:发量惊人的印度小哥

发布者 Ashish Jangra 也是个停不下来的人。他是一位 95 后,2016 年开始就读于 Lovely Professional University(印度拉夫里科技大学)的计算机专业。

发量惊人的数据集作者,哼!

通过 Udacity、Coursera 和很多开源的课程,学习了 Python 和机器学习的知识。

还在 YouTube 上上传了自己的教学课程,包括 70 分钟的计算机视觉入门课程,和口罩人脸识别的最佳实践课程。

作者个人主页:https://ashishjangra.com/

  秃头数据集,怎么用?

数据集也下载好了,问题来了,怎么用?我们为大家简单设计了几个该数据集的使用场景:

  计算目标区域的「含秃率」 

通过训练秃头数据集,可以快速算出合影、视频、或区域街景中,目标区域中的「含秃率」。

可以得出一个区域里某类人群的作息规律、审美习惯、职业背景等等玄学相关因素,公司或学校也可以通过「含秃率」的统计,进行对年度贡献团队/实验室的评定参考。

  病理性脱发的病程判定 

在皮肤科、内分泌科、脱发专科门诊,协助医生进行病理性脱发的病程判定。

虽然医生也能一眼就看出来,但是有一个基于人工智能的判断结果,也可以让病人心服口服,不再倔强。

  植发医院的销售线索工具 

我们经常会在地铁、电梯内看到雍x植发、科X源的广告,相信这款工具也能有效地帮助植发机构,更快找到销售线索。

无论是在密集人群中发现目标群体,还是对比特定区域之间的目标群体密度,都可以进行尝试。

  如何下载该数据集?

除了可以访问原作者的 Kaggle 项目主页,我们还将整个数据集搬运回来了。

访问 https://hyper.ai 主页,搜索关键词秃头,或者直接访问  https://hyper.ai/datasets/12385 

都可以找到该数据集,支持通过直链、磁力链接、 BT 种子、REST API 等下载方式进行下载。

这么好的数据集,还不快快下载来看看?


推荐阅读

(点击标题可跳转阅读)

干货 | 公众号历史文章精选

我的深度学习入门路线

我的机器学习入门路线图

重磅

AI有道年度技术文章电子版PDF来啦!

扫描下方二维码,添加 AI有道小助手微信,可申请入群,并获得2020完整技术文章合集PDF(一定要备注:入群 + 地点 + 学校/公司。例如:入群+上海+复旦

长按扫码,申请入群

(添加人数较多,请耐心等待)

最新 AI 干货,我在看 

全网唯一秃头数据集:20 万张人像,网罗各类秃头相关推荐

  1. 用Python做了鉴黄模型,内含多20万张“不可描述”图片

    GitHub出现一个名为"NSFW Model"的项目.通俗一点来说,就是一个鉴黄模型. 这个模型,使用的数据来自前不久量子位介绍的那个数据集,内含多20万张"不可描述& ...

  2. 用Python做了鉴黄模型,内含多20万张“不可描述”图片!

    GitHub出现一个名为"NSFW Model"的项目.通俗一点来说,就是一个鉴黄模型. Python资源共享群:484031800 这个模型,使用的数据来自前不久量子位介绍的那个 ...

  3. celeba数据集_Kaggle最新秃头数据集Bald!含20万张图片,江湖传言刷到第一可防脱发()quot;...

    5月25日,来自印度最大私立大学拉夫里科技大学(LPU,Kalanwali, Haryana, India)的一名学生Ashish Jangra在Kaggle上发布了一个秃头数据集Bald Class ...

  4. GitHub上20多万张不可描述图片的数据集

    江湖一直有传闻:三流程序员写UI,二流程序员写框架,一流程序员写算法,顶级程序员穿女装. 现如今头发的稀疏程度也绝不再是判断对方是否一个高级程序员的标志,因为年纪轻轻秃头已经成为了一个不争气的现实.在 ...

  5. 63万张!旷视发布最大物体检测数据集Objects365 | 技术头条

    编辑 | 琥珀 来源 | AI科技大本营(id:rgznai100) 昨日,在旷视科技联合北京智源人工智能研究院举办的发布会上,旷视研究院发布了物体检测数据集 Objects365,包含 63 万张图 ...

  6. 密恐警告:超2000万张,全球最大的人眼图像数据集开源了

    涵盖 2D 和 3D 特征点.语义分割.3D 眼球注释以及注视向量和眼动类型等因素,德国图宾根大学的研究者创建了全球最大的人眼图像公开数据集--TEyeD. 机器之心报道,作者:杜伟 在当今世界,基于 ...

  7. 最大识车数据集:6.4万张车型参数完整标注,交通安防二手都能用

    2020-01-06 12:19:27 赖可 发自 凹非寺 量子位 报道 | 公众号 QbitAI 拥有一双火眼金睛,有一张汽车照片就可以报出型号.价格.各项参数-- 现在有了这个6.4万张的汽车图片 ...

  8. c语言 将url图片存到本地_一个22万张NSFW图片的鉴黄数据集?我有个大胆的想法……...

    如果你想训练一个内容审核系统过滤不合适的信息,或用 GAN 做一些大胆的新想法,那么数据集是必不可少的.例如图像鉴黄,我们需要使用卷积神经网络训练一个分类器,以区分正常图像与限制级图像.但限制级的图像 ...

  9. ECV2020开赛!识别火焰/头盔/后厨老鼠/摔倒,30万奖金,4万张数据集,等你来战!...

    7月20日,一年一度的极市计算机视觉开发者榜单活动(ECV 2020)开赛啦!还记得去年开发者榜单的盛况吗?今年极市开发者榜单战火重燃,共4万张的真实数据场景,免费云算力,瓜分30万奖励,更多惊喜等你 ...

最新文章

  1. 某游戏在华为鸿蒙,部分安卓游戏在华为鸿蒙 OS 上运行,被识别成使用 PC 端模拟器...
  2. 如何让小程序页面更顺滑_微信小程序|实现界面滑动切换
  3. 25台机器人=18名搬运工,我在徐福记工厂,围观了给旷视河图的落地现场
  4. Oracle可以处理LOB字段的常用字符函数
  5. Codeforces 861D - Polycarp's phone book 字典树/hash
  6. 乘法最快的算法计算机,人类史上最快乘法算法诞生
  7. Java 数组常用操作二(扩充、扩容、重复数据、动态数组、数组差集、数组交集、查找指定元素、判断是否相同、数组合并)
  8. 为什么 Web 前端开发不抛弃 HTML 和 CSS,用纯 JavaScript 开发?
  9. 5元的小乌龟吃什么_五月最适合吃这菜,5元一斤,两三天吃一次,鲜嫩正当时好美味...
  10. 扫地机器人滤网顺序_扫地机器人如何维护 扫地机器人维护技巧【介绍】
  11. org.springframework.beans.BeanUtils
  12. Glide 4.x添加自定义组件原理
  13. 漫谈 Clustering (3): Gaussian Mixture Model
  14. html颜色自定义器,可自定义颜色的jQuery颜色拾取器插件
  15. 互联网dmz区_DMZ区的概念和用途
  16. 项目上线质量如何评估
  17. Filecoin(FIL) 通过PHP生成 f1 开头的地址
  18. 进入web端进行来源判断后 自动跳转至wap端页面
  19. K-means(K均值)
  20. 黑白游戏逆向传奇实战:汇编,CE,OD,易语言,反外挂,网络安全

热门文章

  1. LeetCode实战:格雷编码
  2. 用 Python 快速制作海报级地图
  3. 龙芯架构应用迁移技术分享——搜狗输入法应用迁移
  4. RISC-V 正在成为芯片世界中的 Linux
  5. 自动驾驶关键环节:行人的行为意图建模和预测(上)
  6. 熬夜写代码,不如换女装入GitHub获上千Star?
  7. TensorFlow集成TensorRT环境配置
  8. 干货 | 大数据人工智能领域从菜鸟到高手晋级指南
  9. 美媒全球大学排名:清华超麻理跃居计算机专业第一
  10. 教你如何通过分析GC日志来进行JVM调优