图像鉴黄的数据集及相关算法汇总
前方高能预警,非战斗人士请火速撤离……
数据集1:https://github.com/EBazarov/nsfw_data_source_urls/tree/master/raw_data
在 raw_data 文件夹里,可以找到不同的 .txt 格式的文档,每个文档都含有一组 URL,以下是关于该数据集的一些统计信息:
159个 不同的类别
158.9331 万个 URL
下载并清洗后大约有 500GB,或者说有 130 万张 NSFW 图像
数据集2:https://github.com/alex000kim/nsfw_data_scraper
主要五大类
比较成熟的模型:
项目1:
项目地址:https://github.com/infinitered/nsfwjs
网页测试地址:https://nsfwjs.com/
该模型主要包括五大标签:
绘画(Drawing):无害的艺术,或艺术绘画。
变态(Hentai):色情艺术,不适合大多数工作环境下观看。
中立(Neutral):一般,无害的内容。
色情(Porn):不雅的内容和行为,通常涉及生殖器。
性感(Sexy):不合时宜的挑衅内容。
项目2:
项目地址 :https://github.com/devzwy/open_nsfw_android
该项目支持色情图片离线识别(离线鉴黄),基于TensorFlow实现。识别只需200ms,可断网测试,成功率99%,调用只要一行代码,从雅虎的开源项目open_nsfw移植,tflite(6M)为训练好的模型(已量化),该模型文件可用于iOS、java、C++等平台,Python使用生成的tfLite文件检测图片的速度远远快于实用原模型。
项目3:
项目地址:https://github.com/yahoo/open_nsfw
项目更多介绍:https://yahooeng.tumblr.com/post/151148689421/open-sourcing-a-deep-learning-solution-for
该项目是由雅虎开源,自动识别图像(包括令人讨厌的图像和成人图像)不适合(SFW)/不适合工作(NSFW)。雅虎建议大家在使用时选择自己的阈值,因为应用场景和对 NSFW 标准的理解可能会有差异,所以开发人员最好根据自己应用对 NSFW 的定义来设定评估值。
关于更多视频/图片鉴黄有哪些算法和开源库参考:
1.视频/图片鉴黄开源库
2.图像鉴黄算法综述
图像鉴黄的数据集及相关算法汇总相关推荐
- 遥感图像目标检测常用数据集及下载链接汇总
1.TAS数据集 2.DIOR 3.LEVIR 4.DOTA 5.RSOD 6.UCAS-AOD 7.NWPU VHR-10 8.VEDAI 9.HRSC2016 1.TAS数据集 是为航空图像中的汽 ...
- 二叉树相关算法汇总(详细)
二叉树基本知识 二叉树(Binary Tree)是n(n≥0)个有限元素的集合,该集合或者为空,或者由一个称为根(root)的元素及两个不相交的.被分别称为左子树和右子树的二叉树组成.当集合为空时,称 ...
- 链表相关算法汇总(详细)
链表基础知识 链表是一种物理存储单元上非连续.非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接次序实现的.链表由一系列结点(链表中每一个元素称为结点)组成,结点可以在运行时动态生成.每个结点 ...
- 厉害了!一本正经地为单身狗推荐这个158万张图像的鉴黄数据集
本文转自"机器之心"(almosthuman2014) 如果你想训练一个内容审核系统过滤不合适的信息,或用 GAN 实现一些大胆的想法,那么数据集是必不可少的.但限制级图像很难收集 ...
- 158万张图像的鉴黄数据集
机器之心报道 如果你想训练一个内容审核系统过滤不合适的信息,或用 GAN 实现一些大胆的想法,那么数据集是必不可少的.但限制级图像很难收集,也很少会开源.在这个项目中,作者构建了一个大型高质量图像鉴黄 ...
- c语言 将url图片存到本地_一个22万张NSFW图片的鉴黄数据集?我有个大胆的想法……...
如果你想训练一个内容审核系统过滤不合适的信息,或用 GAN 做一些大胆的新想法,那么数据集是必不可少的.例如图像鉴黄,我们需要使用卷积神经网络训练一个分类器,以区分正常图像与限制级图像.但限制级的图像 ...
- 一个22万张NSFW图片的鉴黄数据集?我有个大胆的想法……
机器之心报道,机器之心编辑部. 如果你想训练一个内容审核系统过滤不合适的信息,或用 GAN 做一些大胆的新想法,那么数据集是必不可少的.例如图像鉴黄,我们需要使用卷积神经网络训练一个分类器,以区分正常 ...
- 某鉴黄师:“我并不幸福”,AI加持下CDN鉴黄又是何物?
鉴黄师大概是属于最初怀有丰满的幻想, 却不料被一次次残暴的现实无情的摧残! 某知名互联网公司面向社会(年薪20万)招聘鉴黄师,每天的工作就是识别色情淫秽网站,即利用上班时间浏览黄网! 当很多人看到这种 ...
- Question | 标注下数据、训练个模型,商用的智能鉴黄有这么简单吗?
"Question"为网易易盾的问答栏目,将会解答和呈现安全领域大家常见的问题和困惑.如果你有什么疑惑,也欢迎通过邮件(zhangyong02@corp.netease.com)提 ...
最新文章
- HttpClient连接池设置引发的一次雪崩
- java 项目保存日志到本地_Springboot项目使用Slf4j将日志保存到本地目录
- 带你了解线缆、WIFI、以太网协议和网络寻址
- Qt Creator应用3D效果
- oracle数据库表空间文件收缩实例
- 关于waf的一些随想
- 简析EDMX文件的构成 - CSDL、SSDL、MSL
- 这 3 种 DDD 分层架构的模式,你掌握了么?
- Power BI Desktop中的“提问”功能
- 3DMAX全景漫游制作渲染教程,超详细的教程。
- linux matconvnet编译,Windows/Linux平台下编译安装MatConvNet
- oeasy 教您玩转 linux 之 010302 火狐浏览器 firefox
- jquery与ajax实现增删改查
- 程序猿生存指南-41 冬日归乡
- Onenote无法登录报错显示0xE000078D解决方法
- Python菜鸟爬虫技巧
- 跨越13开启14--猿猿感想
- 两台电脑串口传输文件及调用opencv库编程显示图片和文本
- trifecta_ui安装
- RTl8188EUS无线网卡驱动编译,支持master模式
热门文章
- python动态爱心曲线_用Python来画一条动态心形曲线
- 李彦宏Vs周鸿祎:管理风格、领导准则之完全解剖
- Deep Splitting and Merging for Table Structure Decomposition 中文翻译 (表格结构识别)
- 小学计算机课动画制作的评课稿,根据小学信息技术学科特点进行有效评课
- 痞子衡嵌入式:蓝牙芯片厂商三强(QualcommCSR, TI, Nordic)产品一览
- Eclipse调试夜神模拟器
- C#使用MongoDB
- vscode自定义高亮霓虹灯效果主题
- 微信小程序怎么字体鼠标放上去变颜色?_PR视频怎么用,Arctime字幕软件添加字幕,双语字幕怎么添加?...
- TDSQL的安装教程(低配体验)