NEW

关注剁手日记视频号

最新视频→【暮云白版DJI Pocket 2来啦】

来源|大数据文摘

文|Mickey

去年3月份,韩国N号房一事被曝光,黑产集团用裸照威逼利诱女性、幼童,对受害者实施性剥削的产业链终于公之于大众,在Telegram上的聊天室发布这些性剥削画面供会员观看并收取会费,66名与N号房事件有关人士被捕,主犯也最终被判入狱。

韩国警方所掌握线索的被害女性多达74人,其中16人为未成年人,最小年龄受害者为年仅11岁的小学生。

以N号房为代表的性侵事件涉事人数之庞大,韩国并非孤例,Telegram也绝不是窝藏黑色产业链的唯一技术平台。每天,无数无法找到来源的虐童视频、图片被上传至互联网,并跨国进行交易。

找到这些隐藏在照片背后的犯罪分子,除了追踪技术,还需要各国法规及定则程度的一致性。目前,由于不同国家和地区对这类敏感图像和视频分类的方式很不相同,不同国家查获的内容很难共享,存在大量重复工作,受害者也非常难以定位搜寻。

01

标记15万数据,英国分析师团队建立儿童性虐图像元数据库

一个分析师团队正在尝试建立起一个儿童性虐图像元数据库,在不同国家共享,以打破这种僵局。

在英国剑桥郡,互联网观察基金会办公室(Internet Watch Foundation’s office in Cambridgeshire,下称IWF)建立起了一只21 人团队,他们每天都会花费数小时浏览包含儿童性虐待的图像和视频。

仅去年一年,该团队就标记出了 153,383 个带有儿童性虐待图像链接的网页,一个庞大的数据库正在逐渐建立。

而这只是第一步,IWC的最终目的是,希望这个数据库可以在国际上共享,并在数据库的基础上训练智能算法,自动归类相关违禁图片,以阻止虐童图片的全球扩散。

为了达到目的,这个21人的团队每天都在经受常人无法忍受的“痛苦”。除了浏览大量虐待、暴力、黄色视频和图像,发现照片或视频片段时,IWF的数据分析师还需要对其进行评估和标记。到目前为止,这些分析师主要会检查相关音视频材料属于ABC三个等级中的哪一种。这些分组主要基于英国的法律和儿童性虐待的量刑指南中广泛规定的虐待类型。例如,最严重的类别 A 中的图像包括严重的针对儿童的犯罪,使用这些分类可以计算被判有罪的人应被判刑多长时间。除了确定性虐待内容是否属于英国的三个群体之外,其分析师现在还在他们的报告中添加了多达 20 条不同的更详细信息。

02

打破各国打击性虐犯罪数据孤岛

目前,全球性虐图片和视频量级仍在增加。去年,非营利性国家失踪和受虐儿童中心收到了2140 万份来自科技公司的虐待内容报告,美国法律要求这些公司报告他们发现的内容。这是有记录以来最多的一年,报告包含 6540 万张图片、视频和其他文件。

尽管虐待儿童材料的报告有所增加,但面临的一大挑战是世界各地不同的报告流程和标准。由于方法的不同,很难全面了解在线儿童性虐待的真实规模。总部位于美国的非营利组织国际失踪和受虐儿童中心 2018 年的一项法律审查发现,118 个国家/地区拥有“足够”的儿童性虐待物质法律,62 个国家/地区的法律不充分,16 个国家/地区没有。一些法律不健全的国家没有定义儿童性虐待,其他国家没有研究技术如何用于犯罪,还有一些国家没有将虐待内容音视频材料定为犯罪。

另外,由欧盟资助的国际警务组织国际刑警组织和 ECPAT International(一系列民间社会组织)进行的研究发现,比较有关儿童性虐待内容的信息存在“重大挑战”,这阻碍了寻找犯罪嫌疑人的努力。受害者。2018 年 2 月的报告说: “这种情况因使用不同的分类方法来归类受害者特征和受害经历而变得复杂,这使得研究之间无法进行有意义的比较。”

03

将图像与各国法律自动匹配,判定图片是否违法

IWF希望通过这个数据库,来消除各国的一些差异。该组织构建了名为 Intelligrade 的哈希软件,以自动将图像和视频与澳大利亚、加拿大、新西兰、美国和英国的规则和法律相匹配。这一变化应该意味着减少重复的分析工作,并使科技公司更容易优先处理严重的滥用图像和视频。

各国根据图像中发生的情况和所涉及儿童的年龄对图像施加不同的权重。IWF将所有照片和视频都被赋予了一个哈希值,本质上这是一个代码,然后将其与世界各地的科技公司和执法机构共享。这些哈希值可以直接用于检测和阻止再次上传到网络的已知虐待暴力内容。

IWF的秘密武器是元数据。这是关于数据的数据——它可以是图像中包含的内容、人员、方式和时间等精细信息。

元数据是调查人员的强大工具,因为它使他们能够发现人们行为中的模式并分析其更多可能。元数据的最大支持者之一是侦查,这比具体的图片信息更有价值。

休斯说,IWF创建的数据库中为每个图像和视频创建了相关的元数据量。查看的每个新图像或视频都可以比以往任何时候进行更详细地进行评估。“我们决定是否会提供关于描述年龄的颗粒度、在描述图像中发生的事情以及确认性别方面的颗粒度,”休斯说。

IWF 希望其这一数据库和智能系统能够帮助解决各国联合打击性虐视频传播的一些问题。IWF通讯主管艾玛·哈迪说,之前的学术研究侧重在法律方向的努力——各国努力制定相同的禁止儿童性虐待的法律,这是一个非常难以实现的政治挑战。“从数据库和技术入手,能够填补法律协调方面的巨大空白,”哈迪说。IWF 现在正在研究更多国家,以推广这一数据库和技术工具。

“我们相信能够更好地共享数据,让更多人以有意义的方式使用数据,而不是所有人都只在自己的小孤岛中工作。”

素材来源:

https://www.wired.com/story/new-system-crack-down-child-sex-abuse-images/

https://www.iwf.org.uk/?gclid=Cj0KCQjw0K-HBhDDARIsAFJ6UGjWoAKz0X6M2l-eCUbAw_PTW3Cm6JJNvrvFFOdceOw3VhxnkjHaHxUaAjkQEALw_wcB


RECOMMEND

网易智能有12个不同垂直领域社群等你来

添加智能菌微信:kaiwu_club

扫码了解更多

全球首个大规模虐童图像数据库!标记15万图像、20类信息,自动判断图片是否违法​...相关推荐

  1. 中国率先发布全球首份车路协同技术白皮书!清华百度联手,突破自动驾驶规模落地瓶颈...

    鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 如果抛出这样一个问题:在自动驾驶领域,中国有啥与众不同? 不少业内人士都会给出这样一个答案:车路协同. 你若尚不了解这是怎样的技术,现在,一 ...

  2. 台湾2018年虐童通报5.9万件 社会安全网被疑虚设

    中新网1月17日电 据台湾<联合报>报道,台湾近期虐童事件频传,台湾照顾管理协会理事长张淑慧2019年1月16日表示,不少受虐个案根本没进入保护体系,孩子不可能第一次被打,台湾卫福部门推动 ...

  3. 阿里推全球首家人工智能服饰店,随时“翻阅”50万淘宝红人穿搭锦囊

    摘要: 2018年7月4日,阿里工程师们在香港落地了全世界第一家人工智能服饰店--"FashionAI 概念店"("时尚之心概念店").除了线下,在线上,未来淘 ...

  4. 阿里推全球首家人工智能服饰店,随时“翻阅”50万淘宝红人穿搭锦囊 1

    直男到底懂不懂美?对于这样的世纪难题,淘宝给出了答案.2018年7月4日,阿里工程师们在香港落地了全世界第一家人工智能服饰店--"FashionAI 概念店"("时尚之心 ...

  5. 【3万患者11万图像14类病理】NIH公开大规模胸部X光数据集

    胸部X光检查是最常见而且最具成本效益的医学影像检查之一.但是,胸部X光检查的临床诊断很具挑战性,有时被认为比胸部CT成像更难诊断.过去一些有前景的工作已经被报道过,特别是最近在结核病(TB)分类方面的 ...

  6. 宝存科技推出全球首款大量商用级别的高性能Open-Channel SSD

    上海2018年8月14日电 /美通社/ -- 8月7-9号,在美国加州 Santa Clara (圣克拉拉),上海宝存信息科技有限公司 (Shannon Systems) 携全新升级固态闪存产品亮相& ...

  7. 阿里+法大大,全球首个基于区块链技术的邮箱存证产品登陆云市场

    法大大存证邮专注为阿里邮箱用户提供在线电子存证服务:通过电子存证,可以安全有效的存储证据,确保证据的真实性.公正性和有效性,现在只要16元/账户 ·月! 法大大存证邮 有没有想过,企业商务沟通中应用最 ...

  8. 2021云栖大会丨阿里云发布第四代神龙架构,提供业界首个大规模弹性RDMA加速能力

    简介:10月20日,2021年杭州栖大云会上,阿里云发布第四代神龙架构,升级至全新的eRMDA网络架构,是业界首个大规模弹性RDMA加速能力. 10月20日,2021年杭州栖大云会上,阿里云发布第四代 ...

  9. 15寸计算机显示器,苹果确认15寸RMBP支持全球首款5K显示器

    苹果在今年4月发布了OS X 10.10.3,并开启了Retina 5K iMac和2013款Mac Pro对戴尔双线缆5K显示器的支持,不过当时没有任何苹果笔记本支持这款显示器. 苹果确认15寸RM ...

最新文章

  1. mysql gfs2_Mysql_HA+IP_SAN+Clvmd+GFS2
  2. 原生js实现preAll和nextAll方法
  3. 移动端https抓包那些事--初级篇
  4. 路由守卫-vue切换路由登录判断、条件判断
  5. python闭包的应用场景_简单谈谈Python中的闭包
  6. php scandir sftp,CentOS 下使用SFTP实现网站自动生成FTP账号,实现Chroot功能
  7. 基于JAVA+SpringMVC+Mybatis+MYSQL的校园餐厅系统
  8. Java — InputStream.read(),response.getOutputStream(),OutputStream().write【IO流】
  9. Atitit.每周末总结 于每周一计划日程表 流程表 v8 Ver history V8 add stock chk -------------import Stock chk.. 上周遗漏日
  10. 电脑罗盘时钟html怎么设置成桌面,抖音最火的罗盘时钟桌面壁纸使用教程
  11. win10浏览器加载很慢_win10系统打开网页速度慢的排除原因及解决方法
  12. Visual Studio2013 调试报错:该文件没有与之关联的程序来执行该操作。请安装应用,若已经安装应用,请在“默认应用设置...
  13. sql登录名和用户名_通过分配角色和权限来移动或复制SQL登录名
  14. 两台codesys设备之间通过modbus TCP通讯案例
  15. 持续更新|有关最强绘画AI--Midjourney资料收集大全
  16. 经典分割线 html分割线
  17. java并查集_一个非常实用而且精妙的算法-并查集(java语言实现)
  18. Jlink或者stlink用于SWD接口下载程序
  19. 计算机专业的,颜值很高是一种怎样的赶脚?
  20. python tomorrow多线程应用

热门文章

  1. substratum android8,如何在没有root的情况下在Android Oreo上安装Substratum主题
  2. [转]爱因斯坦·毕加索——空间、时间和动人心魄之美
  3. 操作系统原理实验(3):操作系统的基石中断与异常
  4. 什么P图软件可以换发型?照片换分享软件分享
  5. ioremap、phys_to_virt和mmap
  6. vue-项目使用过程中遇到的一些问题
  7. JAVAFX如何在文本框内插入图片
  8. (转)艾宾浩斯遗忘曲线复习计划表
  9. 记录用retinaNet执行DDSM代码中的问题(求精度的过程中出现的错误)
  10. 洗地机什么牌子最好?洗地机品牌排行榜前十名