随着互联网服务的不断深化,产品营销的形式从传统文本、长图文,增加到短视频、直播等新媒介形态,展现形式愈加丰富的同时,也为营销宣传内容合规审核带来了诸多难题。

  • 如何解决与日俱增的审核量与合规审核人员有限之间的矛盾?

  • 如何提升审核效率,满足业务部门快速发布需求?

  • 对于音视频、直播,如何对这些新媒介形式实现高效高质量的审核?

基于上述挑战,蚂蚁数科推出了全栈式智能内容合规审核平台产品。该产品基于AI智能技术及专业内容审核规则沉淀,向金融、互联网、政企、传媒等行业客户提供一站式智能内容合规审核解决方案,可助力机构有效降低营销合规风险。

此前,蚂蚁集团基于内部解语花平台与博时基金共建的基金内容合规智能审核系统荣获第八届证券期货科学技术奖优秀奖和2021年度深圳市金融创新奖三等奖。该审核系统具备高度自主知识产权,处于国内外领先水平。

一、产品能力

合规专家人力有限,越来越无力支撑海量内容的人工审核,且人工风险排查存在排查标准不统一,风险挖掘不深入,评审结果无沉淀等一系列问题。

蚂蚁智能审核产品基于人工智能技术及专家经验的解读和沉淀,提供了一站式的营销合规风险管控解决方案,将监管要求进行数字化转译,通过程序化手段实现快速的机审策略配置;同时提供了统一审核服务接入,支持文本、图片、语音、视频、直播、文件等全媒体格式的营销宣传内容识别,结构化内容特征,进行规则推理,完成风险决策和处置。

多媒体内容识别

支持全媒体格式处理,适用于企业级推销产品或服务的文字、图片、音频、视频、直播或其他内容展示形式,以实现针对用户可感知的应用页面、营销宣传、金融产品信息、销售行为过程等内容的全媒体格式的智能审核。

智能内容审核

合规专家会将自己的审核经验总结成规则或违规风险点,基于特定审核场景,融合各类算法模型构建复杂且精准的策略体系,打造感知引擎-认知引擎-决策引擎为核心的多媒介金融风险精细化审核引擎,达成以机器审核代替人工审核的目标。

二、技术内幕

1.多媒体内容识别

在内容审核的过程中,针对不同的内容往往需要采用不同的处理方式来达到审核的目的。日常遇到的内容包括营销广告、产品页面文案、启动屏、IM、电销、直播、超链接、氛围图、弹窗、信息流、PUSH、短信、邮件等各种面向消费者的信息展示形式,这些内容大多以各种素材类似一张图片/一段音频/一段视频等方式承载。内容处理中心服务于审核前的内容预处理环节,即从这些素材中提取出需要审核的信息,进行内容转换、抽取、压缩等。

1.1基础能力建设:

o 文件处理:提供文件内容抽取、文件类型转换、文件生成图片等多种文件处理功能。

o 图片处理:提供图片压缩、智能切割、图像增强、降噪处理等多种图像处理能力。

o 音视频处理:提供音视频转码,视频抽帧,音频文件提取,语音ASR、增强、降噪等多种能力。

1.2 复杂处理流程编排:为了应对灵活多变的内容处理流程,内容处理中心支持自定义内容处理流程编排,针对不同场景通过自定义脚本的方式实现内容处理节点的灵活编排。譬如为了满足复杂监管要求,当视频中语音涉及产品业绩介绍时,视频页面应当播放业绩展示板,通过自定义脚本的方式实现视频抽音频后,识别其中关键内容,再抽取对应时间图片,进行联合送审。

2.智能内容审核及规则编排

为识别更复杂且隐蔽的金融风险问题,提升合规风险识别的准确率和召回率,我们建设了感知&认知&决策三层漏斗式处理引擎。同时建立统一算法能力接入平台,实现原子算法能力业务无感插拔。最后在调用节点的输入输出之间加入了工程能力介入,如灰度图等,以增强算法模型的识别能力。

与天生具备自然属性的概念不同,监管合规概念是由社会活动的演进而出现,再由相关监管部门进行定义与规范的,专家会将自己的审核经验总结成规则或违规风险点,机审则需要对这些规则进行算法实现,规则生产配置的过程其实就是将一项项专家经验转换成机审能力的过程。在这个过程中,规则数量大,需要覆盖的场景多,为每条规则研发一个脚本工作量大,后期维护成本高昂。

同时在研发规则脚本时,发现很多规则是有相似的处理逻辑的,且具备一定顺序性,由此提炼原子能力,设计出一套规则的编排方案,快速实现业务规则,同时在规则发生调整时可快速切换组合方式,同时可以基于简单的配置化,做到业务的快速接入和使用。

3.模型迭代优化

审核中算法模型的优化迭代更新依赖大量的标注样本。在内容合规领域,没有成熟、直接可用的样本集,强依赖合规专家经验的持续输入,然而合规专家打标的人力成本和时间成本都非常高昂,因此如何降低打标成本是内容合规领域的重中之重。围绕着这个问题,我们采用了小样本学习、主动学习、噪声学习等技术,在打标环节筛选高质量的样本,节省专家时间的同时使算法模型达到业务要求的精度,提高人在回路体系的效率。

以小样本学习为例,我们使用大规模预训练语言模型,使用NLP的prompt(模板填充)模式,结合半监督学习,充分利用未打标样本,能够在样本量减少一半的情况下,模型效果保持不变。在特定任务中,样本量能减少到原先的1/5。在这套框架下,“人”、“数据”、“模型”三者是互相提升的,数据在整个回路里从未标注变成强标注,人从对审核规则有初步理解变成审核方面的专家,模型从无监督到强监督。

三、落地案例

博时基金-蚂蚁智能审核样板间 丨通过AI技术,实现基金产品销售素材智能化审核服务

蚂蚁智能审核产品一直以来致力于为用户提供智能内容合规审核能力,与行业共建合规规则库,持续优化更新。在基金产品宣传材料方面,博时基金引入了蚂蚁集团智能合规审核服务,构建博时基金内容管理与智能审核平台。 智能审核能力提升了合规审核效率,降低合规风险,大幅优化了业务-合规审核流程。内容管理平台提供营销素材存储、管理、复用、共享服务,助力不同素材需求方快速获取审核通过的定稿素材,提升营销品宣效率。

博时基金与蚂蚁共建的智能审核系统还具备以下两大特点:

技术创新点:基于深度神经网络框架,运用大规模预训练、多模态识别、人在回路算法等技术构建了国内领先的金融合规模型集群,将合规专家经验转化为智能审核能力,解决了复杂语境下的准确率和审核效率问题。

业务创新点:围绕内容生命周期,部署全流程的合规管理应用场景,并创造性实现了人机结合应用界面,创新实现视频直播类智能合规审核,从“0到1”的突破。

目前蚂蚁集团智能合规内容审核产品已开始向基金、保险、银行等金融机构推广落地。

四、未来展望

目前,智能审核产品已经广泛应用在包括蚂蚁保、蚂蚁基金、网商银行、博时基金等多家机构,持续帮助机构定位与洞察合规业务风险,提升业务协同效率。同时蚂蚁智能审核产品现已向金融机构提供商业化服务,期待与更多机构共建行业合规规则库,开展合规领域大模型的构建和应用实践,进一步提升智能化水平。

后续我们会持续分享蚂蚁集团智能合规内容审核能力演进过程中的落地与思考,欢迎大家提出任何意见与建议。

如有兴趣,可以联系:gengliu.gl@antgroup.com

蚂蚁智能内容合规产品,提供一站式营销合规管控解决方案相关推荐

  1. 机器人分拣技术与产品提供商“三维通”获2000万元Pre-A轮融资...

    2月15日消息,智能分拣技术与产品提供商深圳市三维通机器人系统有限公司宣布完成2000万元Pre-A轮融资,由中集睿德信领投,力合创投跟投,其天使轮投资方为松禾远望.未来三维通计划推进共建和共享分拣中 ...

  2. c primer plus第六版电子版_【财经】京东超市PLUS有机联盟:有机品牌提升一站式营销解决方案...

    10月28日,"京东超市有机联盟"正式升级为"京东超市&PLUS有机联盟",围绕固定活动.固定阵地.固定品质三大方向,为有机品牌提供一站式营销解决方案. ...

  3. 智能数据引擎Dataphin重磅发布,提供一站式的技术管理能力

    2019独角兽企业重金招聘Python工程师标准>>> 摘要: 面对各行各业日趋强烈的大数据建设.管理及应用诉求,2018年2月28日MWC大会,阿里云重磅推出了智能数据构建与管理平 ...

  4. 景联文科技提供一站式智能安防数据采集标注解决方案

    1.智能安防近期发展 智能安防是人工智能与信息技术结合的关键领域,对于城市与民生发展有着重要意义.通过生物识别.行为监测等技术手段,广泛应用于城市道路监控.车辆人流监测.公共安全防范等领域. 随着中国 ...

  5. 备战“双11”,阿里云为企业提供一站式资源保障服务

    简介:阿里云弹性计算将上线资源保障服务,通过智能化资源诊断.推荐.资源预定及授权候补为用户提供一站式自助化资源保障服务,兼顾灵活,经济的同时还能获得时刻的确定性保障,为业务顺畅前行保驾护航. 报名体验 ...

  6. 【知识图谱】知识图谱数据库提供一站式全域行业数据融合

    知识图谱数据库为金融 AI 革新贡献最前沿的力量,该平台运用大数据.知识图谱数据库.人工智能等技术服务于金 融行业,可提升金融机构合规和风控能力,从而帮助实现行业人工智能.在对公业务中,知识图谱数据库 ...

  7. 数美科技 | 关于智能内容审核,这些你都了解吗?

    一. 内容审核行业痛点 随着移动互联网的发展,大众内容消费和自我表达的需求不断升级,以PGC为主的各类在线平台投众所好,提供UGC(用户生产并发布的内容)的功能,而聚焦UGC建立的平台也在不断涌现,催 ...

  8. 一文看懂“业务定制智能客服”的产品设计_团员分享_@苍狼剑歌

    前言:本文作者是"AI产品经理大本营"团员@苍狼剑歌,现任某一线大厂AI产品经理.另外,文末还有2个"hanniman读者专属福利",1)优惠券 for 三节课 ...

  9. 腾讯智能钛工业 AI 平台:一站式工业 AI 平台方案 | 百万人学AI评选

    2020 无疑是特殊的一年,而 AI 在开年的这场"战疫"中表现出了惊人的力量.站在"新十年"的起点上,CSDN[百万人学AI]评选活动正式启动.本届评选活动在 ...

最新文章

  1. R语言WVPlots包可视化克利夫兰点ClevelandDotPlot、并按照分类变量排序进行可视化克利夫兰点ClevelandDotPlot
  2. js文件夹上传到服务器,js 上传img到服务器
  3. 夏侯南溪搭建目标检测模型——数据读取篇
  4. php在线考试系统详细步骤
  5. c# hdf5 写string_关于C#中读取HDF4文件数据的说明
  6. hutool excel导出
  7. 查词根词缀特别好的网站
  8. MongoDB 添加、查询(条件查询、排序、分页、返回指定字段)、修改、删除数据、聚合aggregate
  9. 遇到长GC停顿、CPU满载、内存泄露、JVM崩溃等高频问题,看这里!
  10. 计算机it知识,IT行业-计算机基础知识总结
  11. Bean Validation数据校验和分组校验
  12. 研究型论文_CICIDS2017 数据集中基于异常的入侵检测系统的机器学习基准测试(英文论文)
  13. 谈谈分布式服务治理框架 Dubbo 重大升级
  14. 计算机初级职称答辩题,中小学职称评选答辩问题集锦
  15. 程序员955不加班名单
  16. VMWare workstation 和 player区别
  17. 如何确保按时交付项目? 有哪些实用方法
  18. Python3,为了给女神暗送秋波,我默默的写了一个图片字符画生成器,真香。
  19. python实战小项目,多线程百度云盘下载,突破限速,超越迅雷超高速下载
  20. css 视频播放列表,jquery结合CSS实现的多样式多视频列表连播效果源码

热门文章

  1. Word 自动更新编号(插入题注、交叉引用)
  2. 跳跃表 skipList 跳表的原理以及golang实现
  3. 中文汉字翻译为相应的拼音
  4. 学习博士答辩之后的感想:
  5. 【58沈剑架构系列】一分钟了解负载均衡的一切
  6. 如何保持较长时间的专注
  7. 【C/C++】scanf,printf 函数
  8. Linux,Centos下 Tomcat8 修改jvm内存配置的新方法
  9. kubernetes 核心术语
  10. 计算机组成与系统结构(课程设计)