一、什么是声纹识别?

声纹识别,也叫做说话人识别,是一项根据语音波形中反映说话人生理和行为特征的语音参数,来识别语音说话者身份的技术。由于每个人的发声器官(舌、牙齿、喉头、肺、鼻腔)在尺寸和形态方面不尽相同,因此声纹也就成为一种鉴别说话人身份的识别手段。

二、声纹自动识别技术

目前声纹鉴定技术分为专家鉴定和自动识别两大领域。

专家鉴定方面,主要采用语音学分析方法,应用语音学及统计分析技术,通过语音工作站测量、分析说话人的语音声学特征(如声源特征、发音时的声道形状特征、发音时的口腔及双唇特征以及语音信号时变频谱特征等),然后采用统计判别方法对说话人语音是否同一作出判定。语音学分析法是目前国内外司法领域说话人普遍采用的方法,我国开展声纹鉴定的机构绝大多数均采用此方法。

声纹自动识别也称语音信号处理法,其基本原理是由系统对说话人语音的特征参数进行分离提取和线性或非线性处理,建立语音模型,然后由系统运算进行模式匹配,确定出与其最接近的若干已知说话人语音,得出相似度的结果,其结果是多选的。还可以进一步细分为说话人辨认( Speaker Identification)和说话人确认( Speaker Verification)

声纹特征的唯一性可以用来唯一确定一个用户的身份,是人体重要的生物特征之一。近年来随着互联网的发展,电信诈骗案件呈现井喷趋势,声纹特征在公共安全领域的应用价值日益凸显。

为了解决这些困难,公安部面向全国推广声纹技术,与指纹库、DNA库类似,声纹库建设是一项有着重要实战价值的工作,具体表现在声纹特征具有非接触式采集的优点,和已有DNA库、指纹库相结合,可形成立体生物特征库,建成后直接为多警种服务,是利用高科技手段在侦破案件和诉讼活动中应用的一个新的增长点,将能有效提高公安机关侦查破案的效率和能力,成为落实科技强警的重要实践之一,各地公安机关均在努力提升声纹信息的实战应用效能,加强公安机关声纹技术的应用工作,因此声纹数据库建设的工作,迫在眉睫。

三、声纹数据库的建设过程和应用场景

声纹数据库的建设过程和典型的应用场景为:首先,基于标准的声纹信息采集流程,对被采集人员的声纹进行采集入库,这中间涉及到标准声纹采集(通过标准声纹采集设备采集的语音)和非标准声纹采集(如微信语音、电信运营商通话语音等)。

当声纹数据库建设完成后,即可以基于声纹数据库做声纹识别1:1身份确认、声纹识别1:N嫌疑人排查、多场景跨通讯识别等应用,典型的应用模式是:当获得检材后,基于声纹检索技术,从声纹库中获得与检材声纹最相似的前若干候选(列表),将这些候选(列表)提交给鉴定专家进行进一步的声纹鉴定以确定目标人或为案件侦查提供重要线索。

四、声纹库建设需要注意的内容

(1)声纹采集设备的研制及标准的制定

首先必须确保入库声纹的质量。通过科学、系统的研究来制定针对自然人的声纹信息标准采集流程,研制声纹采集的标准设备,并建立可操作的声纹采集标准流程,形成公共安全行业标准,确保采集入库的每个声纹能够发挥应有的价值。

(2)高性能声纹检索引擎的研发

高性能声纹检索引擎是声纹库建设及价值发挥的核心。应用人工智能、大数据、云计算等新技术建设高精度声纹比对检索引擎,提供高质量、高效率的海量声纹快速检索、比对碰撞、综合研判等应用服务。

(3)两级联动声纹库管理系统的研制

声纹库管理系统是声纹库建设的重要工作,采取部、省两级架构进行建设,并作为刑侦信息专业应用系统的子系统接入。省级声纹库与部级声纹库通过公安专网完成数据接入,实现声纹数据的上报下发与业务联动。

(4)被采集人员声纹信息的采集选用

“公安部刑事技术产品质量监督检验中心”检测合格的采集设备,开展数据采集工作,并依据标准的规范接口上报声纹数据库,努力提升声纹数据入库规模,这是一项需长期持续的工作。

五、快商通 - 首批满足公安部《声纹采集终端要求》的声纹识别技术厂商

声纹数据库建设是集成了现代化声纹技术、信息技术和科学管理的公安业务基础性工作,能够为处置重大突发事件、侦破重大、疑难案件提供特殊而重要的技术支撑,是一项专业技术性强、应用领域广、建设难度大的系统工程。

因此,国家对声纹采集设备的要求非常高,需满足公安局发布的《声纹数据采集终端系统参数和项目要求》,包括功能要求、技术参数要求、验收要求、技术培训要求以及质量保修期和售后服务要求。

快商通成立于2009年,以声纹识别等智能生物识别、自然语言处理等人工智能技术为核心,投入声纹识别研发超过6年。以李海洲教授领衔的团队,包括来自声学所、新加坡国立大学、清华大学、厦门大学、剑桥大学等全球顶级名校的众多博士和硕士。

快商通是国家声纹识别和自然语言处理技术与应用标准化研究基地唯一承建单位,中国标准化研究院战略合作单位,公安部第一研究所战略合作单位。是国内声纹识别和自然语言处理技术的行业标准制定者。

(1) BioVoice 2.0 标准声纹采集设备

快商通推出的 BioVoice 2.0 标准声纹采集设备,是专门为公安应用场景研发的标准声纹采集设备,是首批通过公安部刑事技术产品质量监督检验中心检测的声纹采集终端。

BioVoice 2.0 采用智能化麦克风集群,支持单向/全向拾音、多种文本采集方式。配套集采集、多标签入库、分类存储、实时检索功能于一体智能化声纹采集系统,可连续性创建采集,批量入库,缩短多人采集入库时间成本,保证声纹信息采集内容的完整性和真实性,提高声纹采集的质量和效率。一次语音录入即可采集到符合公安机关声纹建库要求的高质量声纹数据,为声纹鉴定和比对提供坚实的基础。

快商通 BioVoice 2.0 标准声纹采集设备满足公安部《声纹数据采集终端技术要求》,对接快商通智能声纹识别引擎、智能声纹鉴定专家工作站等,可以轻松实现声纹识别1:1身份确认、声纹识别1:N嫌疑人排查、声纹辨认等功能。同时可以进行实时比对和声纹鉴定。仅凭一通电话录音或微信语音即可快速确定嫌疑人和缩小侦查范围。

(2)“猎擎”声纹数据库系统

“猎擎”声纹数据库系统是一款对声纹数据进行储存、管理和应用的数据管理系统。可用于辖区声纹数据质量管理、重点人员声纹库建设、身份查询与核验、刑事案件侦破、反电信诈骗、声纹大数据分析等场景,助力公安有效遏制与打击犯罪,降低犯罪率,构建和强化安全的社会公众环境。

“猎擎”声纹数据库系统搭配快商通自主研发的声纹识别引擎,荣获世界权威声纹大赛 NIST SRE 2018大中华区第一、全球第三的佳绩!声纹识别引擎提供1:N大库检索比对,支持千万库容建设,是目前市面上唯一支持亿级规模库实时检索比对的声纹识别系统,检索时间小于1s,声纹识别准确率超过99%,适应不同的语音检材类型,语音信息来源支持标准化采集、手机、网络软件、固定电话、录音笔等采集方式、或声音文件导入。在不同噪声环境、文本类型、跨信道等条件下算法性能稳定。

浅谈公安部声纹数据库的建设与应用相关推荐

  1. python库声纹_什么是声纹数据库?

    声纹数据库系统,也称声纹库,是一款对声纹数据进行储存.管理和应用的数据管理系统.在声纹技术的应用中,要实现声纹比对,就需要有参照声纹,用采集到的未知声音与声纹库中的巨量声纹进行比对,从而确定未知声音的 ...

  2. 声纹采集终端在公安部声纹库建设中的意义

    一.什么是声纹识别? 声纹识别,也叫做说话人识别是一项根据语音波形中反映说话人生理和行为特征的语音参数,来识别语音说话者身份的技术.由于每个人的发声器官(舌.牙齿.喉头.肺.鼻腔)在尺寸和形态方面不尽 ...

  3. lisp医院化验系统_浅谈医院化验室信息系统(LIS)的建设

    浅谈医院化验室信息系统( LIS )的建设 贲海权 [期刊名称] <中国新通信> [年 ( 卷 ), 期] 2015(000)023 [摘要] 伴随数字化信息系统在现代社会的逐渐普及,该系 ...

  4. .net mysql和php mysql数据库连接_浅谈PHP连接MySQL数据库的三种方式

    本篇文章给大家介绍一下PHP连接MySQL数据库的三种方式(mysql.mysqli.pdo),结合实例形式分析了PHP基于mysql.mysqli.pdo三种方式连接MySQL数据库的相关操作技巧与 ...

  5. 浅谈BIM技术在“智慧工地”建设中的应用

    浅谈BIM技术在"智慧工地"建设中的应用 随着信息技术的不断发展,建筑行业的信息化程度不断提高,BIM技术在建设行业得到了广泛的推广和应用,同时,伴随着大数据时代的到来,智慧城市的 ...

  6. 浅谈企业中台商业模式及建设思路

    浅谈企业中台商业模式及建设思路 文章目录 浅谈企业中台商业模式及建设思路 前言 企业中台的定义和能力 企业中台的商业故事 企业中台的商业模式 构建企业中台时不同的企业初衷 企业中台的价值主张 企业中台 ...

  7. 浅谈目前主流NoSql数据库

    浅谈目前主流NoSql数据库,编程学习资料点击免费领取 前言 无意翻资料发现目前好多noSql数据库,但是工作中貌似并没有接触到,很好奇他们的区别,所以就有了这篇文章.(整合了网上许多大佬的文章,如有 ...

  8. 浅谈DM达梦数据库体系结构概念

    浅谈DM达梦数据库体系结构概念 DM逻辑结构 DM和Oracle一样也分数据库和实例,两者的概念也基本一致. 但是不同点在于:达梦是单进程.多线程,而oracle是多进程的. DM这种对称服务器构架在 ...

  9. 浅谈小程序开源业务架构建设之路

    导读:本文首先引入百度小程序开源生态介绍,随后在发展道路中遇到厂商浏览器合作场景,引出小程序分发保障的痛点和挑战,接着分别从分发通路.能力检测.能力匹配以及能力干预方面详细探讨了具体的方案和设计,最后 ...

最新文章

  1. python 程序开机自启动,亲测可用
  2. Visual Studio 2008 中使用插件Extjs提示的方法
  3. 皇室战争:第27赛季调整出炉,共涉及16张卡牌,暗巫要凉?
  4. 数学趣题——魔幻方阵
  5. Hadoop不适合哪些场景 哪些场景适合?
  6. 在Qt Creator中添加OpenCV库
  7. csharp:Compare two DataTables to rows in one but not the other
  8. 2012.4.20总结
  9. mac 查看端口的使用情况
  10. MindNode 5 for Mac(思维导图)中文版
  11. 基于深度学习的视频质量分析 深度学习视频质量诊断 图像质量诊断
  12. 自动升级程序连接不了服务器就,windows2012部署wsus更新服务器和使用设置
  13. 带通滤波器幅频特性曲线图_滤波器知识,你所要的,都在这里
  14. C++ __builtin_系列函数
  15. 小米米家冰箱对开门尊享版 540L 评测
  16. 基础数学知识(一)——拉格朗日乘子法
  17. jquerykindeditor文本编辑器插件
  18. 乔布斯和盖茨的历史性对话(转录)
  19. 无参考图像评价指标NIQE——自然图像质量
  20. matlab曲线加颜色,matlab学习之绘制参数曲线,添加辅助线以及颜色设置

热门文章

  1. linux按照目录大小降序排列,Linux du命令查看文件夹大小并按降序排列
  2. 短视频直播平台第三方特效SDK接入教程(完整版)
  3. 微信朋友圈点赞测试用例
  4. 性能测试七种常用方法,以及四大应用领域
  5. 存储服务器在监控中的作用,监控项目中存储服务器IPSAN云存储方案的优劣势对比...
  6. SpringBoot的幕后推手,分布式架构演进+相关笔记参考
  7. js输出sb (!(~+[]) + {})[--[~+][+[]] * [~+[]] + ~~!+[]] + ({} + [])[[~!+[]] * ~+[]] 图解
  8. The word ‘localhost‘ is not correctly spelled 这个问题怎么解决
  9. C#练习题答案: 字母战争 - 核打击【难度:3级】--景越C#经典编程题库,1000道C#基础练习题等你来挑战
  10. 自学编程,十年磨一剑