前方高能预警,非战斗人士请火速撤离……

数据集1:https://github.com/EBazarov/nsfw_data_source_urls/tree/master/raw_data

在 raw_data 文件夹里,可以找到不同的 .txt 格式的文档,每个文档都含有一组 URL,以下是关于该数据集的一些统计信息:

159个 不同的类别
158.9331 万个 URL
下载并清洗后大约有 500GB,或者说有 130 万张 NSFW 图像

数据集2:https://github.com/alex000kim/nsfw_data_scraper

主要五大类

比较成熟的模型:

项目1:

项目地址:https://github.com/infinitered/nsfwjs

网页测试地址:https://nsfwjs.com/

该模型主要包括五大标签:

绘画(Drawing):无害的艺术,或艺术绘画。

变态(Hentai):色情艺术,不适合大多数工作环境下观看。

中立(Neutral):一般,无害的内容。

色情(Porn):不雅的内容和行为,通常涉及生殖器。

性感(Sexy):不合时宜的挑衅内容。

项目2:

项目地址 :https://github.com/devzwy/open_nsfw_android

该项目支持色情图片离线识别(离线鉴黄),基于TensorFlow实现。识别只需200ms,可断网测试,成功率99%,调用只要一行代码,从雅虎的开源项目open_nsfw移植,tflite(6M)为训练好的模型(已量化),该模型文件可用于iOS、java、C++等平台,Python使用生成的tfLite文件检测图片的速度远远快于实用原模型。

项目3:

项目地址:https://github.com/yahoo/open_nsfw

项目更多介绍:https://yahooeng.tumblr.com/post/151148689421/open-sourcing-a-deep-learning-solution-for

该项目是由雅虎开源,自动识别图像(包括令人讨厌的图像和成人图像)不适合(SFW)/不适合工作(NSFW)。雅虎建议大家在使用时选择自己的阈值,因为应用场景和对 NSFW 标准的理解可能会有差异,所以开发人员最好根据自己应用对 NSFW 的定义来设定评估值。

关于更多视频/图片鉴黄有哪些算法和开源库参考:
1.视频/图片鉴黄开源库
2.图像鉴黄算法综述

图像鉴黄的数据集及相关算法汇总相关推荐

  1. 遥感图像目标检测常用数据集及下载链接汇总

    1.TAS数据集 2.DIOR 3.LEVIR 4.DOTA 5.RSOD 6.UCAS-AOD 7.NWPU VHR-10 8.VEDAI 9.HRSC2016 1.TAS数据集 是为航空图像中的汽 ...

  2. 二叉树相关算法汇总(详细)

    二叉树基本知识 二叉树(Binary Tree)是n(n≥0)个有限元素的集合,该集合或者为空,或者由一个称为根(root)的元素及两个不相交的.被分别称为左子树和右子树的二叉树组成.当集合为空时,称 ...

  3. 链表相关算法汇总(详细)

    链表基础知识 链表是一种物理存储单元上非连续.非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接次序实现的.链表由一系列结点(链表中每一个元素称为结点)组成,结点可以在运行时动态生成.每个结点 ...

  4. 厉害了!一本正经地为单身狗推荐这个158万张图像的鉴黄数据集

    本文转自"机器之心"(almosthuman2014) 如果你想训练一个内容审核系统过滤不合适的信息,或用 GAN 实现一些大胆的想法,那么数据集是必不可少的.但限制级图像很难收集 ...

  5. 158万张图像的鉴黄数据集

    机器之心报道 如果你想训练一个内容审核系统过滤不合适的信息,或用 GAN 实现一些大胆的想法,那么数据集是必不可少的.但限制级图像很难收集,也很少会开源.在这个项目中,作者构建了一个大型高质量图像鉴黄 ...

  6. c语言 将url图片存到本地_一个22万张NSFW图片的鉴黄数据集?我有个大胆的想法……...

    如果你想训练一个内容审核系统过滤不合适的信息,或用 GAN 做一些大胆的新想法,那么数据集是必不可少的.例如图像鉴黄,我们需要使用卷积神经网络训练一个分类器,以区分正常图像与限制级图像.但限制级的图像 ...

  7. 一个22万张NSFW图片的鉴黄数据集?我有个大胆的想法……

    机器之心报道,机器之心编辑部. 如果你想训练一个内容审核系统过滤不合适的信息,或用 GAN 做一些大胆的新想法,那么数据集是必不可少的.例如图像鉴黄,我们需要使用卷积神经网络训练一个分类器,以区分正常 ...

  8. 某鉴黄师:“我并不幸福”,AI加持下CDN鉴黄又是何物?

    鉴黄师大概是属于最初怀有丰满的幻想, 却不料被一次次残暴的现实无情的摧残! 某知名互联网公司面向社会(年薪20万)招聘鉴黄师,每天的工作就是识别色情淫秽网站,即利用上班时间浏览黄网! 当很多人看到这种 ...

  9. Question | 标注下数据、训练个模型,商用的智能鉴黄有这么简单吗?

    "Question"为网易易盾的问答栏目,将会解答和呈现安全领域大家常见的问题和困惑.如果你有什么疑惑,也欢迎通过邮件(zhangyong02@corp.netease.com)提 ...

最新文章

  1. HttpClient连接池设置引发的一次雪崩
  2. java 项目保存日志到本地_Springboot项目使用Slf4j将日志保存到本地目录
  3. 带你了解线缆、WIFI、以太网协议和网络寻址
  4. Qt Creator应用3D效果
  5. oracle数据库表空间文件收缩实例
  6. 关于waf的一些随想
  7. 简析EDMX文件的构成 - CSDL、SSDL、MSL
  8. 这 3 种 DDD 分层架构的模式,你掌握了么?
  9. Power BI Desktop中的“提问”功能
  10. 3DMAX全景漫游制作渲染教程,超详细的教程。
  11. linux matconvnet编译,Windows/Linux平台下编译安装MatConvNet
  12. oeasy 教您玩转 linux 之 010302 火狐浏览器 firefox
  13. jquery与ajax实现增删改查
  14. 程序猿生存指南-41 冬日归乡
  15. Onenote无法登录报错显示0xE000078D解决方法
  16. Python菜鸟爬虫技巧
  17. 跨越13开启14--猿猿感想
  18. 两台电脑串口传输文件及调用opencv库编程显示图片和文本
  19. trifecta_ui安装
  20. RTl8188EUS无线网卡驱动编译,支持master模式

热门文章

  1. python动态爱心曲线_用Python来画一条动态心形曲线
  2. 李彦宏Vs周鸿祎:管理风格、领导准则之完全解剖
  3. Deep Splitting and Merging for Table Structure Decomposition 中文翻译 (表格结构识别)
  4. 小学计算机课动画制作的评课稿,根据小学信息技术学科特点进行有效评课
  5. 痞子衡嵌入式:蓝牙芯片厂商三强(QualcommCSR, TI, Nordic)产品一览
  6. Eclipse调试夜神模拟器
  7. C#使用MongoDB
  8. vscode自定义高亮霓虹灯效果主题
  9. 微信小程序怎么字体鼠标放上去变颜色?_PR视频怎么用,Arctime字幕软件添加字幕,双语字幕怎么添加?...
  10. TDSQL的安装教程(低配体验)