5G 商用后,音视频内容生产得到了极大繁荣,网民们的注意力也被各类短视频、直播、音视频社交等平台吸引,这些 UGC 平台显然已成为了新的流量聚集地。但当流量不再是问题,UGC 平台的音视频内容合规性问题变得日益凸显。

音视频内容审核的行业困境

日前,多家互联网应用的音视频业务被曝出涉黄、涉暴、涉政、违禁等不良内容。平台成了间接作恶工具,面临约谈、整顿、关停等违规处理,这给企业造成了难以估量的损失。而对音视频平台来说,针对海量内容逐一审核绝非易事,目前主要面临两大行业难题:

首先,审核效率低下。平台作为网络服务提供者,视频内容大部分来自于用户上传,当用户达到一定基数,每天百万甚至千万的视频内容,客观上给审核带来了极大困难。

其次,有害信息难以发现。对于娇喘呻吟、辱骂语音识别、垃圾广告,以及涉政、暴恐、特殊 LOGO 等不良内容,不仅量大而且类型不一,从中排查这些危险因素,需要较高的技术手段才能完成。

为解决行业痛点,帮助客户从源头发现并杜绝这类不良信息,互联网通信云厂商融云提供的音视频审核服务,可高效精准的自动识别违规内容,保障平台业务的稳定运营。尤其当平台有对消息及音视频有双重审核需求时,融云可帮助企业一站式审核图、文、音、视“全”内容,有效解决多类型、海量信息难以甄别的问题。同时,也帮客户节省了对接第三方审核公司的商务沟通成本,以及研发适配所耗用的成本,为开发者及各互联网平台构筑起绿色通信的护城河。

多维度音视频审核能力,为不同业务场景提供安全保障

目前,融云提供的音视频审核功能主要应用在 1v1、1v多通话场景,会议场景以及直播场景。融云的客户在使用 CallLib SDK 或 RTCLib SDK 实现音视频通话、线上会议或直播等类型应用后,可以把每个参与人的音频、视频数据发送至审核服务,进行内容审核。

当企业开通审核功能后,融云支持音视频流自动审核,审核结果会通过融云的回调服务发送到开发者的应用服务器。具体来说,融云媒体服务器(RTC Server)会把收到的音视频流转码成审核服务需要的格式(RTMP)来送审,不需要开发者转码或者截帧再去送审。在启动审核任务后,融云会按照一定的周期或在命中拦击事件时把审核结果回调给用户,帮助用户方便的解析出审核结果,开发者可以根据审核结果决策是否需要断开直播间主播推流,比如可以踢出主播或封禁主播。

图 1 融云音视频审核服务架构

在音频审核功能方面,融云提供涉政语音识别、娇喘语音识别、国歌识别、色情语音识别、辱骂语音识别、垃圾广告识别六大审核维度。基于 Bi-GRU、Attention 模型、NAR 模型,构建混合深度神经网络模型等多个先进手段,精准识别各类场景中涉政人物、政治事件、反动分裂、恐怖主义等百余种类型涉政音频,精准识别声音中含有娇喘、呻吟、耳骚、喊麦等违规音频,对于音频中含有色情、低俗、污秽、语爱等涉黄内容也绝不放过。

在视频审核功能方面,融云提供涉政视频识别、色情视频识别、暴恐视频识别、广告视频识别、垃圾广告识别、Logo 水印识别。尤其可以实时精准识别和拦截各类场景的手机号、微信、QQ、微博、网址、二维码等各种变体垃圾广告内容,并通过高精度 Logo 水印检测识别技术,支持竞品 Logo 检测、涉政 Logo 检测,维护客户品牌形象。

融云音视频审核四大优势:精准、灵活、全面、稳定

根据开发者的使用调查反馈,融云的音视频审核服务最大的特点是精准,除了审核能力精准,还能迅速精准的定位问题源头,缩短了问题排查的时间;同时,审核模式灵活,支持灵活筛选审核对象,比如对指定房间,甚至指定用户的送审,可添加个性化的审核维度,最重要的是产品功能性能稳定,可用性 99.9%,可应对高并发的使用场景。此外,支持长达半个月的测试时间,让客户有充分的时间熟悉、了解相关功能,让使用无后顾之忧。

具体来说,融云音视频审核服务具备四大技术优势:第一,从服务架构上看,深度融合 CNN、RNN、GAN、TDNN、LSTM 等模型,违规识别准确率高;第二,违规态势实时追踪,可实时监测舆情趋势,动态追踪违规态势,增量模型小时级更新,帮助产品快速迭代升级;第三,全方位识别数百种涉政暴恐图片、数十种色情图片、各式各样的变体广告图片等违规内容,极大降低平台监管风险;第四,超强弹性服务,全球多集群部署,可秒极弹性扩容,因此每日可承载数亿级的海量音视拼审核请求。

复合的审核服务,打造一站式“全”内容审核能力

在实际应用中,融云针对图、文、音、视”的“全”内容,提供双重审核服务,将 IM 即时通讯审核与音视频审核功能叠加,构成“联防联控”的一站式内容审核云服务产品,结合融云反垃圾与内容安全经验,构筑体系化、专业化的审核系统,全面保障客户通信云业务安全运行。

图 2 融云 IM 内容审核服务

融云的 IM 内容审核服务主要包括文本过滤、图片过滤、音视频文件过滤三类功能。其中,融云的文本过滤具有多语种识别能力,支持中文(简繁体)、维语、藏语、英语、日语等。拥有毫秒级的响应速度,通过机器学习、智能算法、语义分析等多维度对数据解析,识别准确率可达 95% 以上。

融云的图片过滤能力基于融云海量样本库,识别准确率达 90% 以上,并且支持水印,倾斜,扭曲,异体等多种变形文字的提取识别,从而提高垃圾图片过滤的准确率。同时还可承受单日千万级图片数据的处理,支持数据高峰时段弹性扩容,检测结果毫秒级返回。

融云的音视频文件过滤能力可承载日均千万级数据处理,检测结果秒速返回;并支持场景化定制,多种模型组合训练,供手机号画像、IP画像等多并提维度判定,识别准确率可达 98%。

综上,融云能够精准过滤文本、图片、音视频消息及音视频流中的不良信息,帮助客户有效规避运营风险,保证内容平台的健康安全,并且该服务提供机器审核和人工审核的双重保障,用户可根据自身情况同时使用,也可任选其一。

结语

由于各行各业通信云应用对绿色通信都存在迫切的需求,融云的音视频审核专门针对在音视频通信中,对内容有安全过滤和设防需求的客户而设。同时,音视频审核功能与其图文审核功能叠加复核,可全面过滤以及精准识别所有通信形式中的内容,构成了一个审核闭环的防护体系,在解决企业对通信内容安全痛点的同时,让业务运行省心、省力,省成本。

高效灵活保障业务安全的音视频审核什么样?相关推荐

  1. 抖音视频审核不通过,可能你触碰以下红线丨国仁网络

    大家好!欢迎来到国仁网络短视频创作学院,你是不是也曾遇到过这样的场景,视频发布时被告知视频审核不通过,是什么原因呢?视频审核规则是什么规则呢? 今天就跟你说一说哪些平台红线不能碰. 一:抖音平台红线 ...

  2. 消防部队应急通信保障---多链路聚合通信系统音视频图传方案详解

    近年来,灭火救援工作呈现出突发性强.技术要求高.处置难度大.作战时间长等特点,尤其是跨区域协同作战越来越频繁,作为综合应急救援队伍的主力军,公安消防部队往往需要公安消防部队调集多个队伍联合作战,作战方 ...

  3. 淘系的音视频编辑方案:非线性编辑引擎

    在经历移动设备的更新换代,网络速度的持续提升和费用降低,手机用户已经经历了从文字阅读到图片浏览再到视频观看的内容消费的变革后,淘系音视频技术如何灵活根据需求做出技术创新与变革. 非编定义 非编是非线性 ...

  4. 透析阿里云视频云「低代码音视频工厂」之能量引擎——vPaaS视频原生应用开发平台

    简介:支撑15分钟上线高品质专属音视频平台 为满足企业用户极速搭建高品质专属音视频业务的需求,阿里云视频云的"低代码音视频工厂"应运而生,但极速而高品质的平台搭建诉求,需要用全新的 ...

  5. 音视频应用驶入快车道 开发者如何快速追赶这波技术红利?

    受访人 | 融云CPO 任杰 作者 | June 图片来源 | 视觉中国 毋庸置疑,随着5G时代的到来,实时音视频技术将会上升到一个全新的高度. 5G时代发生巨变的远远不止网速,凭借5G网络的高带宽, ...

  6. 技术实践 | Android 设备音视频兼容性适配

    导读:WebRTC 是一个非常优秀的项目, 可以支持 Web.iOS.Android.Mac.Windows.Linux 在内的所有平台的 API,保证了 API 在所有平台的一致性.然而 WebRT ...

  7. 【免费活动】字节跳动背后的音视频技术揭秘

    音视频技术在近几年呈现突飞猛进的发展,一方面满足了企业对于业务高速增长的需求,另一方面也为业务的发展创造了更多的可能性. 活动介绍 10月29日 | 北京 LiveVideoStack将联合火山引擎的 ...

  8. 中关村科金李超:多元融合成为音视频技术发展新风向

    近年来,随着5G.云计算.人工智能等技术的日臻完善,行业数字化转型进入深水区,音视频技术在各种应用场景下全面开花. 银行业,作为关系到国计民生的重要行业,历来是数字化转型的排头兵.因此,在银行业的众多 ...

  9. 华为云发布实时音视频行业加速器,为企业解决技术与商业双重难题

    本文分享自华为云社区<华为云发布实时音视频行业加速器,为企业解决技术与商业双重难题>,作者:技术火炬手. 戴口罩.做核酸.亮健康码--持续了两年多的疫情,悄然间改变了所有人的日常生活,同时 ...

最新文章

  1. 顶尖学者加盟!两所C9高校,获强援!
  2. python【蓝桥杯vip练习题库】BASIC-18 矩形面积交(线段交)
  3. python3.5怎么安装pip-python3.5版本安装pip3
  4. Modern C++ Design 学习笔记-第3章
  5. 吴恩达《卷积神经网络》精炼笔记(3)-- 目标检测
  6. pip报 No module named ‘pip‘ 错误
  7. php游客随机代码,php生成随机码的一段代码
  8. springboot update数据_SpringBoot整合Mybatis+Druid+数据库(注解版)
  9. 操作系统概念第七章部分作业题答案
  10. 微软官方出的各种dll丢失的修复工具
  11. 计算机二级的图片尺寸,2021计算机二级照片是几寸 大小千万要记住咯
  12. android安全静态分析,[分享]发几个Android静态和动态分析的小技巧
  13. unity控制物体移动和转向
  14. linux上的社交软件,瞧瞧社交app-瞧瞧下载v1.6.0-Linux公社
  15. 搜狗输入法低版本导致谷歌浏览器上传下载时崩溃
  16. 国际上公认的IT证书
  17. 程序员都是这样关机的
  18. 大白话btree和b+tree
  19. SSL数字证书(三)使用 openssl 生成证书
  20. C++生理周期(枚举)

热门文章

  1. 第四章 GDI、控件------结束语
  2. 计算机属于建筑专业吗,建筑学专业属于文科、理科还是工科?
  3. python五子棋游戏from tkinter import_使用Python的tkinter库,做简单的五子棋游戏
  4. 三国志战略版:四大阵营武将总结——蜀国篇
  5. 心田花开一二年级看图写话高分写作技巧教程
  6. 盖茨写给中国人的明信片
  7. 【流放之路-第三章】
  8. U3D模拟暗黑泰瑞尔翅膀物理运动效果
  9. 读《平凡的世界》后感 (二)
  10. 语音识别(Speech Recognition)综述