语音识别

项目名称:智能手表语音识别系统

**项目描述:**儿童智能监控语音识别手表,可以实现人机沟通,紧急呼救报警等功能。

**职责描述:**1.使用scipy,numpy,读取和绘制音频数据

2.使用傅里叶解析算法进行音频滤波

3.使用正弦算法进行音频合成

4.使用梅尔频率倒谱系数算法提取音频特征;

5.创建隐马尔科夫模型用该模型的score值比较,进行语音识别。

项目3 土地变更县级外业调查软件的语音识别系统

项目描述:
在土地变更的县级外业调查阶段,一般处于冬季,气候寒冷,本项目的语音识别模块可识别操作人员语音语义,帮助操作人员完成相关操作。
项目职责:
数据预处理,读取音频数据,使用梅尔频率倒谱系数算法提取音频特征;
模型构建,使用马尔科夫模型为每个训练样本创建模型保存其主要特征;
将测试数据与每个样本的模型进行皮氏距离得分比较,得分最高的即为其类别。
项目效果:
通过本模型的应用,使得外业设备的操作更简便,提高了调查的时间效率。

项目名称:机车运行语音识别系统

项目描述:创建语音识别器,可识别操作人员语音语义,完成机车运行相关操作。
职责描述:1、使用scipy.io.wavfile,numpy,matplotlib 读取和绘制音频数据;
2、使用快速傅里叶变换进行音频滤波,将信号映射到频域
3、使用正弦算法进行音频合成
4、使用梅尔频率倒谱系数算法提取音频特征;
5、创建隐马尔科夫模型用该模型的score 值比较,进行语音识别。

应用市场的语音搜索

开发方案: linux+python3.6.4+keras

负责模块:语音识别,语义提取

项目描述:在应用市场里面添加语音搜索功能,提高用户体验

​ 1)使用keras构建神经网络(cnn+lstm+ctc)

​ 2)处理采集音频并进行分段输入到训练好的模型,汇总得到的文本信息,

​ 使用已训练好的HMM模型对语义进行提取,然后直接调用后台的搜索接口

​ 3)根据用户模型对搜索到的应用进行排序后传给前端来展示

项目2:智能家电语音识别

项目简介:智能家电语音识别系统,能够识别人的语音,与人交互

个人职责:

\1. 数据集采集、创建模型、训练、测试等

\2. 音频合成

所用技术:

\1. 通过傅里叶变换,将声音信号从时间域映射到频率域

\2. 通过梅尔频率倒谱系数(MFCC)生成能量矩阵

\3. 创建隐马尔可夫模型,根据模型的score值比较,寻找最优预测模型

\4. 音频合成利用反向傅里叶变换即将音符从频率域映射到时间域

项目1:2017.04 – 2018.04 19课堂在线教育直播平台

**项目描述:**19课堂直播课抛开传统的面对面授课模式,借用互联网通过视频,音频打造一个更加开放的以学生为中心的老师在线教学、学生及时互动的教学形式。不受地域限制,保证学员能够随时随地听课。主要模块包括:用户登录注册、直播教学、推荐课程、浏览用户数据统计分析等。

**个人职责:**优化19课堂在线教育直播平台包括增加语音识别模块,浏览用户及评论信息数据的统计分析。

**所用技术:**1.利用自适应滤波法,将直播中的语音降噪处理,形成纯净的语音信号;

2.对语音信号中的有声片段和无声片段进行分割,再针对有声片段的语音特征进行识别;

3.利用pandas,numpy对浏览用户及其评论信息数据进行预处理,分析用户特征和评论倾向,预测用户喜好;

4.利用matplotlib形成数据可视化,获得分析结果。

项目名称:服务语音机器人

项目简介:

智能语音机器人通过对客户点对点问答的形式来精准快速的捕捉客户需求并给出

合理的答复,来辅助人工电话客服以更加经济高效的方式为客户提供服务,人工

电话客服能够集中精力为客户提供更高价值的服务,从而实现电话客服精准服务

化高了客户的体验度并节约了运营成本

**个人职责:**数据处理、音频特征矩阵的获取、建立语音识别模型

所用技术:

1、利用scipy.io.wavfile,numpy,matplotlib.pyplot读取和绘制音频数据

2、使用numpy.fft (快速傅里叶变换)进行音频滤波,将信号映射到频域并进行降噪处理

3、使用python_speech_features.mfcc获取梅尔频率倒谱系数(MFCC)矩阵 提取音频特征

4、创建隐马尔科夫模型hmmlearn.hmm. GaussianHMM,运用该模型的score值比较,进行语

音识别

项目2: 语音控制无人机视频取证2 个月

项目描述: 在一些取证较为困难的地方(地势)或不方便人员现场取证(偷拍取证)这
些因素极大影响办案效率,语音控制无人机视频取证可以很方便的解决这些
问题,不仅简单易用,在保护办案人员人身安全的前提下,提高办案效率
职责描述: 1 使用scipy.io.wavfile 的read 读取音频文件,得到采样率和每个采样点的值
2 通过语音特征提取器python_speech_features 的MFCC 处理,返回MFCC
矩阵(梅尔频率倒谱矩阵)
3 使用hmmlearn.hmm 的GaussianHmm 构建隐马模型
4 将mfcc 交给模型训练,最后对训练好的模型验证音频mfcc 的得分(score)

智能家电语音识别 5个月

项目介绍:识别简单的语音指令,如开关灯、音乐播放等
个人职责:数据集划分、建模、训练、测试等
所用技术:1. 通过wavfile读取音频文件,并拆分输入与标签

  1. 通过python_speech_features中梅尔频率倒谱系数(MFCC)方法生成能量矩阵
  2. 创建隐马尔可夫(GaussianHMM)模型,根据模型的score值比较,寻找最优预测模型

四、项目名称:儿童智能语音小助理

项目简介:可以识别用户的语音并提供相应的服务
个人职责:负责创建语音识别器,达到语义识别的目的。
所用技术:
1.使用scipy.io.wavfile,numpy,matplotlib.pyplot 读取和绘制音频数据;
2.使用numpy.fft (傅里叶解析算法)进行音频滤波;
3.使用正弦算法进行音频合成;
4.使用python_speech_features.mfcc(梅尔频率倒谱系数算法) 提取音频特征;

5.创建隐马尔科夫模型hmmlearn.hmm. GaussianHMM,运用该模型的score 值
比较,进行语音识别。

二、项目名称:智能客服系统

项目简介:通过用户输入的问题自动进行语义分析为客户寻找相似的问题和答案
个人职责:参与对语义分析模型的建立
所用技术:
1.负责对客户提出的问题进行词干的提取和语义的识别
2.建立词袋矩阵对特征值进行提取
3.建立词频逆文档矩阵来对模型进行语义分析,利用聚类对其进行语义识别

一、项目名称:智能在线天气系统

项目简介:此系统可以识别用户的语音命令并提供给用户相应的天气信息服务
个人职责:将识别的语句进行语素分解、词干提取、词性还原,并建立模型来识别语句的
内容。
所用技术:
1.利用nltk 工具将语音识别的语句进行语句分析;
2.建立词袋模型及词频逆文档频率(TF-IDF)矩阵对文本进行特征提取
3.建立模型对语句语义进行分类识别

项目名称 音乐播放器 智能输入语音识别系统

应用环境
Linux + Python + Pycharm + Numpy + Sklearn + Scipy
负责模块
数据预处理 语音 识别 + 语义提取
项目描述
项目描述 ::
将收集来的语音数据,通过将收集来的语音数据,通过梅尔频率倒谱系数梅尔频率倒谱系数获取语音内容密切相关的获取语音内容密切相关的1313个特殊频率所个特殊频率所对应的能对应的能
量分布
量分布,,作为声音的特征,将声音的特征通过由作为声音的特征,将声音的特征通过由隐马尔可夫学习模型识别器隐马尔可夫学习模型识别器所构建的语音识别模型,获所构建的语音识别模型,获取语音中的相关语义,使用不同的音频对模型进行训练和调试,形成取语音中的相关语义,使用不同的音频对模型进行训练和调试,形成相关的语义袋。相关的语义袋。当用户再次传入当用户再次传入语语音通过模型的识别语音音通过模型的识别语音获取语义获取语义,再利用,再利用朴素贝叶斯中的多项式核模型朴素贝叶斯中的多项式核模型,对所获取的语义进行匹配,将,对所获取的语义进行匹配,将正确结果返回给用户正确结果返回给用户
项目职责
项目职责::
  1. 获通过梅尔频率倒谱系数获取声音的特征获通过梅尔频率倒谱系数获取声音的特征,并利用不同的语音模型进行调试,并利用不同的语音模型进行调试
  2. 通过通过JiebaJieba分词器构建语义袋,并对新输入的语义进行整合分词器构建语义袋,并对新输入的语义进行整合
    项目

项目三: 摹考官(NLP+语音识别)

项目描述:随着公司上市,服务提升,公考人员课程之后的模拟面试需求剧增,人工模拟面试已不能满足需求,
故需研发一款模拟面试的语音识别系统,旨在提高效率,智能做出点评;
职责描述:语句文本的处理,读取音频数据及预处理,建立模型,优化模型,完成语音识别的功能;
所用技术:1、使用结巴分词进行中文分词和词性标注;
2、忽略停用词并获取词袋模型和词向量;
3、获取TF-IDF,并基于多项分布的朴素贝叶斯进行文本分类和Topic 提取;
4、使用Scipy.io.wavfile,Numpy,OS 等模块,读取音频数据;
5、使用同维卷积做滤波;
6、使用FFT 得出梅尔频率倒谱系数(MFCC)矩阵;
7、基于MFCC 矩阵循环创建GaussianHMM 模型,对比模型得分,并用得分最高模型做测试。

语音识别项目简历收集-----机器学习(仅供参考)相关推荐

  1. 项目线上问题应急处理规范(不同公司流程规范不一样,仅供参考)

    前言:整理了一下项目线上问题应急处理规范,仅供参考! 1.1线上报障流程 1.2.目的 为了明确线上事件的报告.应急响应和处理机制,确保能以快速.高效.准确的应急处理能力来保证各类系统的正常运转,当发 ...

  2. c 语言ktv项目,KTV夜总会包厢里常玩的几种游戏,当然还有更多更好的娱乐项目,仅供参考...

    很多人到KTV夜总会是为了一展歌喉,但也有一部分人其实对于唱歌并不感兴趣,他们喜欢的是KTV夜总会里面的氛围,喝喝酒,唱唱歌,玩玩游戏.不论是朋友相聚,还是客户应酬,互动性的游戏总能有助于活跃气氛,加 ...

  3. 【java】 ssm+ssh原生态框架(仅供参考)

    以前刚学框架的时候自己搭建的两个框架,一个是Struts2+Spring+Hibernate-(SSH),还有一个就是Spirng+SpringMVC+Mybatise-(SSM), 其中SSH项目中 ...

  4. 高考志愿填报APP靠谱吗?大数据仅供参考不能依赖

    6月24日,在众多考生的等待中,陕西2019年高考分数线公布.分数线公布后,对于考生和家长来说,最重要的事情就是填报高考志愿了.针对这种需求,一些指导高考志愿填报的APP应运而生.今天南京软件开发公司 ...

  5. 地址解析(仅供参考与学习)<Java>

    地址解析步骤如下: 1.检查是否存在省份 2.如果存在省份,将会检查省份是否明确标注省,自治区,市(直辖市),特别行政区的关键字,如果不存在,将会自动拼接上,便于后边正则匹配 3.检查市级地区是否明确 ...

  6. 软件测试流程规范简介(不同公司流程规范不一样,仅供参考)

    前言:整理了一下软件测试流程规范简介,仅供参考! 一.流程图概述 二.测试启动阶段(需求分析) 参与软件需求评审.技术评审,以测试的角度分析需求的可测性,可构思将来对测试进行的方法.原则等.更重要的是 ...

  7. 2020年数学建模国赛C题Demo【准确率只有61%,仅供参考】

    2020年数学建模国赛C题Demo[准确率只有61%,仅供参考] MPai下载链接:www.mpaidata.com 关注公众号:[万灵数据]可以看很多很多建模资料噢 附件数据下载:https://m ...

  8. 海康威视web插件层级遮挡问题,仅供参考

    关于海康威视web插件层级遮挡问题的解决方法,仅供参考,不包解决 其实在开发包里的最关键的文件就是webVideoCtrl.js 我遇到的问题是因为embed标签的显示层高于div出现遮挡情况 解决方 ...

  9. 中国高校与研究院所计算机学科分专业点评(本贴内容仅供参考!)

    [2014/4/13:近5年来中科院系统经历了一些较大的变化,如人员流动,实验室更名等,以下部分内容未能因此更新,故可能失效甚至有较大误导,请大家自己注意辨别,有问题请向现任版主和中科院学生了解.时间 ...

最新文章

  1. 设计模式复习-解释器模式
  2. NodeJS学习笔记—1.CommonJS规范
  3. android百度地图画圆,android百度地图半径画圆
  4. 计算机学院学生会宣传稿,计算机与信息工程学院学生会
  5. Axios和Ajax处理后台返回文件流实现文件下载(图片和Excel)
  6. javascript变量说明
  7. Android微信支付爬坑
  8. PostmanCn: Postman中文版
  9. 人工智能,机器学习, 深度学习框架图
  10. 腾讯视频没有了html分享代码,腾讯视频代码在哪里 腾讯视频嵌入网页的方法-电脑教程...
  11. 2. 表的操作:创建表、修改表、列约束和表约束、数据操作、删除表
  12. 二叉树的先序创建、前中后序遍历(递归)C++
  13. SpringBoot+Vue项目线上教学平台
  14. Python使用随机森林预测泰坦尼克号生存
  15. IDEA修改注释字体
  16. 当一个测试工程师准备找工作,需要准备什么?
  17. 云台控制协议总结(VISCA/PELCOD/PELCOP)
  18. 使用光标查询10部门的员工姓名和工资,并打印 使用光标查询员工姓名和工资,并打印
  19. win7英雄联盟登陆显示无法连接服务器,如何解决Win7玩英雄联盟无法连接到服务器...
  20. Qt 中获取屏幕的绝对坐标

热门文章

  1. 水洼数目(dfs万能模板)
  2. 纪念胡新宇君(转载)
  3. iOS获取汉字拼音首字母的方法
  4. SSL证书申请流程是怎么的?
  5. sed 在行首或者行尾添加文本
  6. 西南科技大学 Python程序设计 摩斯密码解密
  7. 一个扫雷小游戏带你初识VUE3和typescript
  8. 2021年1月23日松果出行一面
  9. PHP的Imagick拓展安装
  10. 隐藏隧道通信:HTTP/HTTPS 代理转发