那个20多万“不可描述”照片的数据集,有人用它做了鉴黄模型 | Demo
三井 发自 凹非寺
量子位 报道 | 公众号 QbitAI
有人上手了!
近日, GitHub出现一个名为“NSFW Model”的项目。通俗一点来说,就是一个鉴黄模型。
这个模型,使用的数据来自前不久量子位介绍的那个数据集,内含多20万张“不可描述”图片。
同时,这个模型也被项目的贡献者做成了Demo。
既然有了Demo,那肯定是免不了测试一番……
Demo效果
Demo网站十分简单,进去之后能做什么一目了然。
上传图片之后,是自动给出结果,不需要点击其他按钮。但有时候不会给出结果…..还有待完善。
结果是数据集中提到的5种类别的可能性。分别是:hentai、sexy、neutral、drawings、porn。具体每个类别代表的意思,如下图所示:
好了,开始第一个测试:
这个图有71%的可能性是hentai;16%的可能性是porn。你觉得准吗?
再来一个:
71%的可能性是sexy。
但下面这个,就有点不好说了。
porn到了76%,19%是hentai。按照这个标准,《超体》别想正常上映了……
但整体上,这个模型还是能工作的,比如整个漫画,就很好的识别出来了,比如其他的一些,也能识别出来(但图片就不好放了)。
至于准确率怎么样,没法给出定论。如果你有兴趣,可以去体验下这个Demo。地址:
http://ai.midday.me/
话说话来,看到这个模型,你有没有想自己上手体验一下?GitHub有相关的开源代码。
请收好项目地址:
https://github.com/rockyzhengwu/nsfw
最后,数据集地址:
https://github.com/alexkimxyz/nsfw_data_scrapper
One More Thing
在Demo网站的下方,写了一句爱因斯坦的话:
Two things are infinite: the universe and human stupidity; and I’m not sure about the universe.
只有两样东西是无限的,就是宇宙,还有人类的愚蠢,不过我对前者还没什么把握。
作者系网易新闻·网易号“各有态度”签约作者
— 完 —
2018中国人工智能明星创业公司
加入社群
量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;
此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。
进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点「好看」吧 !
那个20多万“不可描述”照片的数据集,有人用它做了鉴黄模型 | Demo相关推荐
- 用python将照片做成数据集_那个20多万“不可描述”照片的数据集,有人用python做了鉴黄模型 | Demo...
有人上手了! 近日, GitHub出现一个名为"NSFW Model"的项目.通俗一点来说,就是一个鉴黄模型.学习Python中有不明白推荐加入交流群 号:864573496 群里 ...
- 用Python做了鉴黄模型,内含多20万张“不可描述”图片
GitHub出现一个名为"NSFW Model"的项目.通俗一点来说,就是一个鉴黄模型. 这个模型,使用的数据来自前不久量子位介绍的那个数据集,内含多20万张"不可描述& ...
- 用Python做了鉴黄模型,内含多20万张“不可描述”图片!
GitHub出现一个名为"NSFW Model"的项目.通俗一点来说,就是一个鉴黄模型. Python资源共享群:484031800 这个模型,使用的数据来自前不久量子位介绍的那个 ...
- GitHub上20多万张不可描述图片的数据集
江湖一直有传闻:三流程序员写UI,二流程序员写框架,一流程序员写算法,顶级程序员穿女装. 现如今头发的稀疏程度也绝不再是判断对方是否一个高级程序员的标志,因为年纪轻轻秃头已经成为了一个不争气的现实.在 ...
- 内含20万“不可描述”图片,这个数据集千万别在办公室打开
三井 发自 凹非寺 量子位 出品 | 公众号 QbitAI 近日,GitHub上悄然出现一个内含20多万张"不可描述"图片的数据集. 这份数据集一共将内容分为5类,分别是: hen ...
- Nature子刊:涵盖20多万个基因组的人体肠道微生物参考基因组集
Nature子刊:涵盖20多万个人体肠道微生物基因组的参考基因组集 A unified catalog of 204,938 reference genomes from the human gut ...
- 腾讯区块链专利申请量排名全国第一;摩拜超20.56万单车被破坏;Nginx 1.17.7发布 | 极客头条...
整理 | 郭芮 快来收听极客头条音频版吧,智能播报由标贝科技提供技术支持. 「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注 ...
- 人类面部表情数据集(12万张表情照片)
人类面部表情数据集(12万张表情照片) 一共有7类人类面积表情,分别是:悲伤.高兴.害怕.惊讶.平静.生气.厌恶.一个文件夹一类.表情识别模型训练的很好数据.一共有7类人类表情数据集,文件夹如下图所示 ...
- 地球上20张最惊人的照片_地球上30个惊人的自然景点
地球上20张最惊人的照片 30 Astonishing Nature Places on Earth 地球上30个惊人的自然景点 Frequently while traveling, you can ...
最新文章
- 为什么CSS使用假元素?
- python编程if语法-二、python 语法之变量赋值与if(if else)
- python动态语言解释_python是动态语言吗
- OSPF 形成邻居 关系的条件
- 计算智能-群智能算法-粒子群算法matlab实现
- 解决 Python pip 安装报错:Retrying (Retry(total=4, connect=None, read=None ...)) after connection
- linux-基本权限-chown-chod
- MySQL服务器变量一
- 计算机专业在沈阳有什么发展,985 计算机专业在全国 TOP10 在沈阳
- Git 历史记录内容对比
- python list切片步长
- 【程序的流程】—— 顺序 / 分支 / 循环
- 一个有很多QT免费应用例程的网站
- PHP 14:类的实例
- 软件破解技术之API替换
- Oracle Exadata初探
- postgresql chm格式手册
- 如何把视频生成二维码,手机扫一扫就可以看
- sar adc的常用指标(一)
- 苹果html 闪退,苹果打开软件闪退是怎么回事_苹果手机一打开软件就闪退如何解决-win7之家...
热门文章
- 程序员总被坑?这是GitHub上的一篇防骗指南
- 想搞定大厂面试官?4面阿里拿到P7Offer通用流行框架大全
- 利用开放定址法实现散列表的创建、插入、删除、查找操作_快速入门数据结构:散列表(上)...
- React中useEffect使用
- 华科大计算机跨考,华中科大计算机概况_跨考网
- oracle sqlplus ed,Uedit32与SQLPlus结合使用技巧-数据库专栏,ORACLE
- java调用其他程序吗_java本地方法如何调用其他程序函数,方法详解
- android高德地图自动缩放比例,【Android】高德地图 缩放级别及像素以及地图上的点转化成屏幕上的点...
- linux程序没有对日志文件写的权限_好程序员云计算培训分享Linux文件权限简单说明...
- Vue父组件访问子组件属性和方法、父子组件双向绑定(两种方法)