不同于色情信息,处理低俗信息的一个难点在于,人们对于低俗的判断标准具有一定的主观性。

刺猬公社 | 石灿

2月20日,今日头条方面宣布了“灵犬”全面升级的消息。除了反色情低俗,新版“灵犬”还加入了反暴力谩骂和反标题党能力。

至此,“灵犬”的检测服务,已覆盖了主要的低俗低质内容类型。

刺猬公社(ID:ciweigongshe)了解,这是上线近一年后,“灵犬”迎来的首个重大更新版本。数据显示,截至目前,“灵犬”使用人次已经突破240万。这也是国内首款反低俗信息小程序。

检测内容健康程度

这款小程序脱胎于今日头条反低俗算法模型,用于鉴定低俗信息。用户将文字或者文章链接放置到搜索框内,即可查询该条信息的健康程度。

据了解,“灵犬”这类技术模型,不仅可以为普通网民所用,用以净化网络空间,同时也有助于平台内容创作者的内容改进。

不同于一般平台对低俗低质内容通常采取人工投诉、事后删除的办法,“灵犬”作为技术手段,能够有效帮助平台将内容质量检测的机制前置,帮助创作者自查内容是否触发色情低俗、暴力谩骂和标题党等因素。

不过,在文字检测上,“灵犬”团队规定,用户输入的字数必须超过10个字才能进行检测。

对此,“灵犬”团队给出了解释:用户给的上下文、语境等信息越充分,机器判断的准确度就会越高。

在2018年3月份,刺猬公社曾参与过“灵犬”的内测,在“灵犬”上检测了“你饿不饿我下面给你吃”几个字,数据显示,该内容健康指数为51%,不及格。

2019年2月20日,刺猬公社再次检测,该内容的健康概率指数为19%,命中反色情低俗模型,“不应获得算法推荐”。

这是什么意思呢?

“灵犬”就像一个内容审核系统,这个系统集纳了被评定为色情低俗内容的所有关键词,一旦“你饿不饿我下面给你吃”触碰到关键词,该内容将会被提取、分词和语义识别,然后根据设定的规则,输出对应的分数、评级和结论。

中国传媒大学网络法与知识产权研究中心主任王四新教授说,在网络上如果色情低俗内容不被过滤,很容易被当做“产业”进行开发,有商业资本助推,有利可图,在某些国家允许,但在我国不允许,《刑法》对涉及制作、复制、出版、贩卖、传播淫秽物品有明确罪项规定。

他还介绍说,在我国,传播淫秽色情内容,被依法处置的情况很多。此外,还有虚假宣传、谣言……的传播者也会被进行处罚。

但处理低俗信息依旧有难度,“灵犬”团队曾称,不同于色情信息,处理低俗信息的一个难点在于,人们对于低俗的判断标准具有一定的主观性;色情信息很直接,低俗信息偏隐晦,对于像“灵犬”这种机器就更难了。

今日头条的做法是,把低俗的标准分为两个层次:几乎所有人看来都会一致同意的标准底线,和因人而异的主观判断。有些检测标题,因人而异,仁者见仁智者见智。

不过,今日头条方面也称,“灵犬”新版本发布的背后,伴随着“灵犬”打击低俗低质能力的提升。反色情低俗、反暴力谩骂模型,整体识别准确率约为85%,反标题党模型识别准确率约为90%。这些技术模型每天仍在持续优化迭代。

国内外都在治理低俗低质内容

近年来,互联网新闻信息、互联网音频、网络直播等互联网文化内容领域,都成了监管部门的重点关注目标,监管部门也出台了不少的监管政策,以规范行业行为。

去年10月,“傅首尔”“紫竹张先生”“有束光”“万能福利吧”“野史秘闻”“深夜视频”“唐纳德说”等9800多个自媒体账号被全网处置。这源于国家网信办会同有关部门,针对自媒体账号存在的一系列乱象问题,开展的集中清理整治专项行动。

在这次网信办的通报中,主要在以下5个方面出了问题,这5大问题也足以值得自媒体人深度警惕:

1、有的传播政治有害信息,恶意篡改党史国史、诋毁英雄人物、抹黑国家形象;

2、有的制造谣言,传播虚假信息,充当“标题党”,以谣获利、以假吸睛,扰乱正常社会秩序;

3、有的肆意传播低俗色情信息,违背公序良俗,挑战道德底线,损害广大青少年健康成长;

4、有的利用手中掌握大量自媒体账号恶意营销,大搞“黑公关”,敲诈勒索,侵害正常企业或个人合法权益,挑战法律底线;

5、有的肆意抄袭侵权,大肆洗稿圈粉,构建虚假流量,破坏正常的传播秩序。

在此基础上,国家网信办又依法约谈了腾讯微信、新浪微博等自媒体平台,对其主体责任缺失,疏于管理,放任野蛮生长,造成种种乱象,提出严重警告。腾讯微信、新浪微博相关负责人表示将认真接受群众和舆论监督,自查自纠,积极整改,严格管理。

随后,微博发布公告,表示将认真接受群众和舆论监督,自查自纠,积极整改,严格管理。微信平台则发文回应称,将加强对政治有害信息、色情低俗、谣言、标题党、抄袭侵权等违规内容的打击和清理,为用户提供一个更健康的阅读空间。

国家网信办有关负责人指出,自媒体绝不是法外之地。近年来,国家网信办依据《网络安全法》相继出台《互联网新闻信息服务管理规定》《互联网用户公众账号信息服务管理规定》等法规性文件,对具有媒体属性和可对公众发布信息的账号及平台作了明确规定。从趋势上看,自媒体管理已经纳入法治化、规范化、制度化轨道。

而今日头条在去年7月和10月,通过自查、用户举报等方式,处罚了近万个违规账号。

今日头条发布公告称,因侵犯版权而受到平台处罚的头条号账号,主要包括搬运、篡改和歪曲等行为:一是未经许可转载、摘编整合或歪曲篡改新闻作品;二是通过“洗稿”方式抄袭剽窃、篡改删减原创作品;三是未经授权复制、表演、通过网络传播他人影视、音乐、摄影、文字等作品,或以合理使用为名对他人作品删减改编。

由此可见,治理低俗低质内容不仅仅是一个平台的事情,而是整个行业的事情。放眼世界,Facebook也因为低俗低质内容而头疼,去年10月份,Facebook直接对发布低俗低质的账号动刀,一下子删除了该平台上559个页面和251个违反垃圾消息规则的帐号。这些网页和帐号使用假帐号来获取点赞和共享,并引诱用户点击欺骗性网站链接,后者大多涉及政治内容。

Twitter也对该同类型内容进行技术提示,Twitter在消息中的链接中添加“可能敏感”标签。据美国科技博客Gizmodo报道,Twitter的媒体政策显示,该公司将“移除有可能被认为是敏感的内容,例如裸露、暴力或医疗流程。”

据新浪科技报道称,业内人士认为,Twitter早就应该推出这项功能,帮助家长控制儿童所看到的内容,以免他们点击不适当的链接。

据王四新介绍,国外社交媒体对低俗低质内容的整治也在不断加强,即便西方国家有制度安排等原因在言论面前做支撑,但近十年来,仇恨、种族、暴力等问题越来越突出,相关言论也在社交媒体上散播,他们需要对其进行治理。

“这种方法在未来肯定会大行其道”

2018年11月,今日头条CEO陈林在生机大会上表示,在鼓励优质内容、打击低质内容已经成为全球内容平台的共同议题时,今日头条将开放技术模型,和行业一起提高平台生态标准。开放给社会公众,也是希望能通过开放平台技术,促进全行业发展。“灵犬”此次全面升级,无疑验证了这一点。

据了解,目前,今日头条在平台内容治理方面,除了配备“灵犬”,还有其他反色情、反标题党、反虚假信息、反低质内容等数百个技术模型。与此同时,今日头条投入了上万人专业审核编辑团队,致力于结合人工、技术手段,保障平台内容健康。

面对低俗低质内容,整个社会都在出谋划策。2018年10月31日,《经济日报》发表新闻评论建议,要靠技术来提升低俗内容的识别效率。互联网企业要善用包括大数据、人工智能等新技术,与时俱进地更新内容判定标准,细化审核标准,并升级群发检测算法。只有依靠技术不断完善“游戏规则”,才能让违规内容难以“钻空子”,同时更充分地在版权上保护原创内容,也能防范低俗账号以微博、微信等平台为跳板,将用户导向外部空间再提供违规内容。

这个建议正在被像今日头条这样的互联万公司实践。财经国家周刊编委、新媒体资深从业者王新一评价说,今日头条的slogan是“信息创造价值”,而灵犬则是通过检测出有害的信息来创造价值。内容平台需要两手抓,一方面促进平台产生更多优质信息,一方面尽量减少低俗低质内容的出现。

“企业主动利用这种技术手段来做好内容审核工作是一个不错的方法。”王四新说,其他互联网公司也在利用大数据技术做安全审查工作,比如滴滴用技术防御乘客可能遇到的乘车危险。

而知乎在这方面也有实践。据36氪报道,在2016年,知乎上线了机器人瓦力。瓦力的任务,是识别并处理那些不友善、辱骂、阴阳怪气、答非所问、色情内容以及知乎不鼓励的用户爆照。

这种趋势在近两年逐渐明显了起来,越来越多的企业主动或被动去探讨更灵活、更及时、更有效的技术模型,人工成本会降低。王四新预测,“这种方法在未来肯定会大行其道”。

对行业和社会来说,是好事。

rost反剽窃检测系统_色情、低俗信息没得治?今日头条这款检测工具,240万人都在用!...相关推荐

  1. AI如何反低俗?今日头条推内容检测工具“灵犬”3.0,首次公开其技术原理

    安妮 发自 北三环西路 量子位 出品 | 公众号 QbitAI 男默女泪.不看不是中国人.看完惊呆.身份惊人.不看吃亏.癌症凶手--这些标题党文章的惯用词汇,还熟悉吗. 昨天(7月30日),今日头条发 ...

  2. 补丁 检测系统_大云制造 | BCLinux For ARM64 V7.6操作系统正式发布

    友情提示:全文3000多文字,预计阅读时间10分钟 概述 大云企业操作系统(BC-Linux,BigCloud Enterprise Linux)是中移(苏州)软件技术有限公司借助开源社区优势,通过定 ...

  3. 用python做视觉检测系统_教你用 Python 做一个物体检测系统

    在本文中,我们将了解物体检测技术是什么以及可以用来解决此领域问题的几种不同方法,接着深入研究在Python中如何构建我们自己的对象检测系统.在本文结束时,您将拥有足够的知识来独自迎接不同的物体检测挑战 ...

  4. python目标检测答案_你好,这里有一份2019年目标检测指南

    译者|Arno 来源|medium 目标检测(Object detection)是一种计算机视觉技术,旨在检测汽车.建筑物和人类等目标.这些目标通常可以通过图像或视频来识别. 目标检测在视频监控.自动 ...

  5. 西门子atch指令详解_西门子PLC,STL语句指令大全,有语句注释,一般人都收藏...

    大家写PLC程序,尤其用到STL语言是不是一边写代码,一边放个巨大的PDF,100多页.用到那个翻页半天,罗里吧嗦.今天把西门子90几个STL语句表,全部整理发给大家.有语句注释,收藏备用吧. 指令( ...

  6. js解析二维码_最新最全阿里巴巴,今日头条,腾讯Flutter面试真题全解析(狂虐不止)...

    阿里巴巴,今日头条,腾讯Flutter面试真题全解析.你只有去过大厂,才知道大厂的面试有多难,这个难度不是你能够想象得到的.所以说如果想去做这方面的工作,建议把以下内容好好准备一下(其实也就是多看一些 ...

  7. ctrl+下箭头无法到最底端_设计院10年精选,最常用的CAD命令,绘图牛人都在用...

    CAD设计牛人都在用!设计院绘图师傅10年汇总,最常用的命令口诀分享给你,以后绘图再不用麻烦度娘.同事,你轻松玩转CAD设计,用得到的伙伴记得转发. 1)Di计算图形长度 2)re重新绘制,涉及到放大 ...

  8. 姿态检测 树莓派_怎样在树莓派上轻松实现深度学习目标检测?

    原标题:怎样在树莓派上轻松实现深度学习目标检测? 雷锋网按:本文为 AI 研习社编译的技术博客,原标题 How to easily Detect Objects with Deep Learning ...

  9. 安卓最新系统_太吝啬?一加只给两款手机升级安卓最新系统

    ↑↑↑点击上方蓝字订阅每日最新热点手机资讯 近日,谷歌推出最新的Android 11 Beta,谷歌的"亲儿子"Pixel 2.Pixel 2 XL.Pixel 3.Pixel 3 ...

最新文章

  1. 《『若水新闻』客户端开发教程》——20.程序打包发布
  2. skb_shinfo(skb)-dataref 含义
  3. ImportError: cannot import name ‘python_2_unicode_compatible‘
  4. ReactiveCocoa基础
  5. 16进制数用空格分开 tcp_面试时,你是否被问到过TCP/IP协议?
  6. 使用JavaFX AnimationTimer
  7. python注销代码_django用户注册、登录、注销和用户扩展的示例
  8. stretchblt 模糊_拼多多直播不显示画面?直播画面模糊怎么调整
  9. [hashmap|空间换时间] leetcode 1 两数之和
  10. Thinking in Java 4th(Java编程思想第四版)文档、源码、习题答案
  11. 在python的解释器中使用函数_浅析Windows 嵌入python解释器的过程
  12. [引]VS2005 主题(Theme)和外观(skin)帮助文档:主题和外观概述
  13. python求解最大子序列乘积问题,子序列可连续也可不连续
  14. Qt编写地图综合应用14-离线地图下载
  15. 【ZZULIOJ】1047: 对数表
  16. python艺术分形数_Python分形框计数 – 分形维数
  17. 计算机单位换换算,时间单位换算表与计算机单位换算
  18. 《见识》----吴军博士,读书笔记
  19. QT:模仿腾讯会议(低配版)
  20. android 5.1 flash,Flash Player for Android 4.0 and 5.1 以上版本(提供下載)

热门文章

  1. 留个坑,不知道为什么sqlite3要求组权限才能执行db:migrate,而可以直接执行db:......
  2. 论文的事情终于可以告一段落了
  3. 案例实操-Top10热门品类
  4. 大数据系统如何提供抗击疫情信息
  5. 在html中解决数字四舍五入,JavaScript四舍五入及精度丢失问题
  6. mysql 备份的权限_Mysql 数据库备份权限
  7. 数学建模学习交流论文写作课件
  8. php解决01背包问题,PHP动态规划解决0-1背包问题实例分析_PHP教程
  9. matlab图片包微盘,如何用Matlab绘制二维图形资料下载
  10. php pdo $_GET,PHP PDOStatement::getColumnMeta讲解