人工智能Java SDK:声纹识别
声纹识别
所谓声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,
人在讲话时使用的发声器官–舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。
声纹识别(Voiceprint Recognition, VPR),也称为说话人识别(Speaker Recognition),有两类,
即说话人辨认(Speaker Identification)和说话人确认(Speaker Verification)。前者用以判断某段语音是若干人中的哪一个所说的,
是“多选一”问题;而后者用以确认某段语音是否是指定的某个人所说的,是“一对一判别”问题。不同的任务和应用会使用不同的声纹识别技术,
如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。不管是辨认还是确认,都需要先对说话人的声纹进行建模,这就是所谓的“训练”或“学习”过程。
sdk基于PaddlePaddle实现声纹识别模型。使用的是中文语音语料数据集,这个数据集一共有3242个人的语音数据,有1130000+条语音数据。
SDK包含的功能
- 声纹特征向量提取
- 声纹相似度计算
运行例子 - VoiceprintExample
运行成功后,命令行应该看到下面的信息:
...
# 音频文件 a_1.wav, a_2.wav是同一个人
[INFO ] - input audio: src/test/resources/a_1.wav
[INFO ] - input audio: src/test/resources/a_2.wav
[INFO ] - input audio: src/test/resources/b_1.wav# 声纹 512维特征向量
[INFO ] - a_1.wav feature: [-0.24602059, 0.20456463, -0.306607, ..., 0.016211584, 0.108457334]
[INFO ] - a_2.wav feature: [-0.115257666, 0.18287876, -0.45560476, ..., 0.15607461, 0.12677354]
[INFO ] - b_1.wav feature: [-0.009925389, -0.02331138, 0.18817122, ..., 0.058160514, -0.041663148]# 相似度计算
[INFO ] - a_1.wav,a_2.wav 相似度: 0.9165065
[INFO ] - a_1.wav,b_1.wav 相似度: 0.024052326
目录:
http://www.aias.top/
Git地址:
https://github.com/mymagicpower/AIAS
https://gitee.com/mymagicpower/AIAS
人工智能Java SDK:声纹识别相关推荐
- 人工智能Java SDK:文字识别(OCR)工具箱
文字识别(OCR)工具箱 文字识别(OCR)目前在多个行业中得到了广泛应用,比如金融行业的单据识别输入,餐饮行业中的发票识别, 交通领域的车票识别,企业中各种表单识别,以及日常工作生活中常用的身份证, ...
- 声纹识别demo_声纹识别 iOS SDK 文档
# 声纹识别 iOS SDK 文档 # 1.简介 声纹识别(Voiceprint Recognition),是一项提取说话人声音特征和说话内容信息,自动核验说话人身份的技术.MSC SDK 声纹识别( ...
- 中国移动灵犀云声纹识别SDK(android)使用指南
随着智能家居概念的火热,语音交互这一新时代的人机交互方式再度掀起了热潮.移动互联网应用在设计开发时也纷纷考虑加入语音识别功能,带给用户除传统键盘或触控交互方式外的更便捷交互体验.中国移动近日推出的&q ...
- 快商通获吴文俊人工智能奖,坚持自然语言处理及声纹识别算法攻坚
坚持AI算法前沿技术攻坚,厦门快商通科技股份有限公司获中国智能科学技术最高奖! "吴文俊人工智能科学技术奖"被誉为"中国智能科学技术最高奖",代表人工智能领域的 ...
- java代码实现声纹识别_govpr--golang实现的gmm-ubm算法的说话人识别(声纹识别)引擎...
简介 govpr是golang 实现的基于 GMM-UBM 说话人识别引擎(声纹识别),可用于语音验证,身份识别的场景. 目前暂时仅支持汉语数字的语音,语音格式为wav格式(比特率16000,16bi ...
- linux搭建声纹识别,声纹识别SDK-FreeSR
FreeSR (A Free Library for Speaker Recognition),免费的声纹识别/性别识别SDK,支持Android/Windows/Linux等平台. https:// ...
- 声纹识别demo_声纹识别 · JD NeuHub API Documents
声纹识别 一.接口描述 1. 功能描述 声纹识别基于说话人的声音提供说话人确认功能. 2. 能力说明 声纹识别API提供说话人注册以及说话人确认的功能.用户可以先用声音进行注册,再根据声音进行说话人确 ...
- 一文看懂“声纹识别VPR” | AI产品经理需要了解的AI技术概念_团员分享_@cony
前言:声纹识别是AI领域中一个看似很小.但其实有机会在近期落地,且比较有意思的细分方向:本文作者是"AI产品经理大本营"团员@cony ,她总结了AI产品经理"最必要& ...
- 讯飞声纹识别(简单基础)
讯飞声纹识别(简单基础) 注册登录科大讯飞的开发者平台,创建应用,拿到对应的APPID,下载声纹识别的sdk,下载下来的文件中有sample例子,可以参考例子中的demo做自己应用的开发. 根据dem ...
最新文章
- 用 Label 控制 Service 的位置 - 每天5分钟玩转 Docker 容器技术(106)
- idea启动springboot卡_写给新手看的 Spring Boot 入门学习指南
- “/”和“\\”和feof();
- had oop 链接mysql_php – 将MySQL连接查询与OOP和对象相关联的最佳实践方法
- mysql数据库充值网站程序_MySQL数据库安装
- java获取数组穷举_请教一下两个数组各取一个元素生成新的数组的穷举算法设计?...
- github上java_GitHub上Java的Bloom Bloom实现
- 【计算机网络复习】1.2.2 OSI参考模型
- java 数据库备份 linux,java邮件打包在linux备份数据库练习
- 【java】强悍!Java 9 中的9个新特性
- CCF201703-5 引水入城(100分题解链接)
- 关于游戏中的材质系统
- JAVA程序员,你读过这些书吗?
- APMServ中Apache启动失败解决方法大全
- Xcode No certificate for team ‘xxx‘ matching ‘iPhone Developer: xxx (xxx)‘
- 五狂徒盖伦过来插眼 准备边学边写 Egret 游戏
- UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb5 in position 0: invalid start
- 老鼠流和大象流:如何检测和监控周期性流量
- 《程序员防近视指南》学习笔记全
- Tomcat对Servlet规范的Filter及Listener实现
热门文章
- Kafka 与 RabbitMQ 如何选择使用哪个?
- Python----列表
- lwip --- (十六)TCP建立流程
- RL(Chapter 4): Gambler’s Problem
- 注册页面案例-世纪佳缘
- 魔兽名字显示服务器,魔兽世界怀旧服服务器名称
- python opencv 读取mov文件
- gnutls_handshake() failed: A TLS packet with unexpected length was received
- 【我的OpenGL学习进阶之旅】着色器编译器和程序二进制码
- win10 nginx部署前端项目(静态资源服务器和HTML)