一、 内容审核行业痛点

随着移动互联网的发展,大众内容消费和自我表达的需求不断升级,以PGC为主的各类在线平台投众所好,提供UGC(用户生产并发布的内容)的功能,而聚焦UGC建立的平台也在不断涌现,催生了“人人都是创作者时代”的到来。百花齐放的UGC,从文字到文字+图片,再到文字+图片+视频+直播,内容多元,形式丰富,并呈现出爆发式增长,然而在“繁荣”的背后,内容的良莠不齐,也给平台带来了极大的内容审核挑战。

监管部门为了约束内容乱象,规范平台运营,也在不断完善相关的法律法规。近期,国家网信办又开启了网络“有偿删帖”问题和“软色情”信息专项整治、移动应用程序信息内容乱象专项整治等多项行动,希望通过规范化管理与专项整治行动,促进互联网内容生态的健康发展。


UGC的内容量呈指数级增长且形式多样,尤其是图片、视频、语音等非结构化数据的内容识别难度很高,传统的敏感词匹配方式能难有效识别风险内容。如果平台还完全依靠人工审核来监管内容的话,不仅要付出巨额的人力成本,审核效率、应急能力等都面临巨大挑战,甚至还会面临着生存危机,毕竟某某平台被约谈、责令整改、产品下架、永久关停等消息屡见不鲜。


二、 内容审核面临挑战


三、 内容审核解决方案

天净通过对海量数据的深度学习,再结合算法对特定场景建立相应的分析模型,进行文本、图片、语音、视频内容识别,结合产生内容的账号、设备、IP的行为以及全球风险库,精准识别色情、涉政、违禁、暴恐、广告等内容风险,实现高效、准确、全面覆盖的内容审核过滤。


四、 内容审核应用场景


五、 内容审核产品功能

天净智能文本识别:

文本识别存在多样性、复杂性等特点,从基础的变体字、形容词代称粉饰,到上万种领导人名及虚假广告变体等,时刻考验着内容识别系统的“聪明”程度。基于对自然语言的深入研究,通过深度学习的机器学习技术,对千亿级海量样本库、百万级违规词库、上万种变体类型进行多模型训练,对存量内容精准排查。并实时动态监测违规态势,比如网信办近日启动的“有偿删帖”问题和“软色情”信息专项整治行动,天净智能文本识别产品能够实现违规词库秒级更新、增量模型小时级更新,以应对网络舆情随时可能新增的内容违规风险。

天净智能图片识别:

通过计算机视觉深度学习算法与海量图片样本,训练出多种复杂的识别模型,如色情识别模型、暴力恐怖识别模型、敏感人脸识别模型、以及一些不良场景,比如抽烟、喝酒、吸毒、赌博等场景识别。并通过多个模型,对图片中的文本、logo等进行全方位识别,以确保图片识别的高准确率与召回率。

天净智能音频识别:

一般语音识别在电台、语音消息、视频直播等场景中都有用到,且涉及到不同语种以及一些特殊化的语音识别。天净智能音频识别采用基于ffmpeg的音频信息动态转码技术、基于深度学习的语音识别技术和智能特色语义分析技术,能够对绝大部分音频格式进行多场景、多维度地检测与识别,包括涉政、涉黄、辱骂、广告导流等诸多类型内容,其独创的娇喘识别技术,能够识别娇喘、呻吟等特殊声音违规内容。天净智能音频识别准确率高,处理速度快,检测场景广泛,能够极大降低人工审核成本,提升音频内容质量。

天净智能视频识别:

视频审核是一种综合性较强的审核模式,它不仅包括文本识别、图像识别、音频识别,在直播场景下,还涉及在线实时视频审核。而这种复合型视频审核方式也是AI技术可智能替代人审最直接、最高效的途径。智能视频识别基于业界领先的图片深度识别引擎、语音识别引擎、文本检测模型以及视频语音编解码技术,能够精准识别视频画面、语音、字幕、标题中出现的涉黄、涉恐、政治敏感内容、欺诈广告等违规违法内容,解放人工审核,极大提升产品的用户体验。

六、 内容审核产品优势

复杂模型体系,违规识别高准确

基于先进的人工智能技术,深度融合各类模型,构建复杂模型体系,避免单一模型的误杀和漏杀,违规识别高准确。

全内容形态识别体系,提供一站式解决方案

千亿级海量样本库,百万级违规词库,上万种变体类型,数百种语义标签;丰富多样的语音识别功能,360度检测视频画面、声音、文字、字母、水印、logo等内容,极大降低业务风险及平台损失。

违规态势实时追踪,实现产品快速迭代升级

实时监测音频舆情趋势,动态追踪违规态势,增量模型小时级更新,产品快速迭代升级。

超强弹性服务,承载海量智能内容审核请求

全球多集群部署,秒级弹性扩容,每日承载数亿级内容审核请求。

七、 数美科技业务优势

除了构建复杂的模型体系,数美科技还将账号与用户行为画像深度结合,进一步提升内容识别的精准性。以广告导流内容为例,为了促进流量转换,相同内容发布的频率会很高,而且会运用大批量的账号密集发布,呈现出与一般用户不同的行为特征。账号与行为层面的识别,既是对内容识别的辅助,又能够从源头防御违规内容的产生。

从用户行为层面到内容和场景的违法违规内容识别,数美科技建立的全栈式AI内容风控,其实是建立了一个多维防御空间来帮助客户识别违规内容与欺诈用户,助力客户防范业务风险,避免平台的损失。

数美科技 | 关于智能内容审核,这些你都了解吗?相关推荐

  1. 数美科技的智能文本审核能为社交行业带来什么价值 | 数美人工智能研究院

    移动互联网打破了传统门户网站的交流屏障,社交软件则架起了信息之间无障碍沟通的桥梁. 根据<2019年社交行业研究报告>显示,目前市面上的社交软件一共有6000多个,包括内容社交.工具社交. ...

  2. 数美科技:智能时代怎么样构建金融反欺诈体系

    由CIO时代学院主办的"第十五期金融CIO论坛"在北京举行,数美科技受邀出席,并发表了题为"智能时代金融反欺诈服务"的演讲. 数美科技认为,随着互联网金融的崛起 ...

  3. 数美科技风控前沿| AIGC需要什么内容风控基建?ChatGPT本“人”有话要说

    ChatGPT的风从11月发布之日起吹到现在. 这是一款聊天机器人软件,和"前作"们相比,它变得更像一个"人"了,能完成最简单快速的资料检索和整合,也能进行一定 ...

  4. 好声方可入人心,数美科技智能音频审核方案为音频内容消费保驾护航

    语音,是人天然的沟通形式.相比起文字,语音所包含的顿挫.情感.语气.音量能够传递出更加直接和真切的信息.在历史中,人对传输语音也充满了渴望,从书信到电话.电台.唱片.磁带.光盘,人总是在用更前沿的技术 ...

  5. 数美科技直播短视频行业未成年人保护解决方案:全方位护航未成年人视听娱乐安全

    数字信息爆炸的时代,直播.短视频凭借趣味性.强互动.碎片化.陪伴性等特点,成为最受人们欢迎的娱乐方式之一,许多未成年人也沉浸在由一场场直播和一个个短视频构建出的虚拟世界中无法自拔. 直播.短视频平台为 ...

  6. 数美科技斩获36氪“WISE 2020数据智能最佳解决方案”

    日前,中国主流新商业媒体36氪发布了"WISE 2020企服金榜"榜单,数美科技凭借AI在线业务风控技术实力,与丰富的行业实践技术积累,荣获"数据智能最佳解决方案&quo ...

  7. 数美科技CTO梁堃:怎么样构建全栈式智能风控体系,在线业务安全的挑战与实践

    日前,由雷锋网鲸犀频道与腾讯"千帆计划"共同举办的"CCF-GAIR全球人工智能与机器人峰会"在深圳盛大召开.在"如何利用SaaS赋能企业转型升级&q ...

  8. 数美科技荣获《银行家》“十佳智能风控管理创新奖”

    9月24日,由<银行家>杂志社主办的"中国金融创新论坛暨 2021中国金融创新成果线上发布会"在北京举办.会上同步揭晓了"2021中国金融创新奖"获 ...

  9. 数美科技CEO唐会军获聘中国演出行业协会第二届内容评议委员会专家

    近日,数美科技CEO唐会军获聘为中国演出行业协会网络表演(直播)分会第二届内容评议委员会专家,主要负责参与中国演出行业标准的制定和完善.网络主播黑名单的评审及行业研究等工作,助力提高行业内容风控安全水 ...

最新文章

  1. 设计模式学习笔记(一)之工厂模式、单例模式
  2. iphone实现下拉列表(iOS开发 )
  3. 善于 调用Windows API
  4. HDU 5869 Different GCD Subarray Query 树状数组 + 一些数学背景
  5. html:(11):address和code标签
  6. php 去除重复的值,php数组怎么去除重复值?
  7. 深入理解Linux内核01:内存寻址
  8. C++ ---------- map的使用
  9. Django_3_路由
  10. html form表单提交验证
  11. 项目在linux下运行情况,Linux系统下部署项目的设置方法
  12. oracle怎么查看索引表空间,oracle查看索引、表空间
  13. PHP常用函数速查表(转载)
  14. 网卡驱动离线安装经验,避坑指南
  15. 2022年首次升级:静态代码测试工具Helix QAC 2022.1 新版本功能快讯
  16. Node-RED使用指南:7:配置与设定总结:其他配置
  17. iOS 如何实现 AppStore 中App 的自动下载
  18. js插值法的使用_初学js插入节点appendChild insertBefore使用方法
  19. Redis的list,set,zset类型应用及排行榜的实现
  20. 【原创】《麦肯锡入职培训第一课》读书感悟

热门文章

  1. 随心所“语”之 3B大战:robots协议问题
  2. 青岛新媒体运营教程:三步浅谈活动运营,拆解策划实施
  3. Android stuido 解决Caused by: android.view.InflateException: Binary XML file line #8: Binary XML file
  4. 游戏开发与设计中的“3C”是指什么?
  5. 一直搞不懂SIMNOW网站的逻辑
  6. GUC-11 线程池
  7. 20条公司绝对不会告诉你的潜规则
  8. Python居然能破解传说中的摩斯密码?“有内鬼,终止交易”
  9. 2006年德国世界杯分组对阵图
  10. 简单家乡风景静态HTML网页设计作品 DIV布局家乡介绍网页模板代码 DW个人网站制作成品 web网页制作与实现