python从语音生成语谱图

文章目录

  • python从语音生成语谱图
    • 生成语谱图的过程
    • 引入必要的库
    • 语音生成语谱图
    • 结果图
      • 语音信号的原始数据
      • 语音信号转为语谱图

生成语谱图的过程

参考文档

预增强
汉宁加窗
补零
FFT
Reshape

引入必要的库

import os
import cv2
import numpy as np
import soundfile as sf
import matplotlib.pyplot as plt
from cough_detector.utils.bd_spectrogram import *

语音生成语谱图

def gen_spectrogram_image(audio_path, save_path):"""step = 10window = 20shape = (161, 198):param audio_path::return:"""audio_test, sample_rate = sf.read(audio_path)# preemphasiscoeff = 0.95audio_test = audio_test[1:] - coeff * audio_test[:-1]spec = spectrogram_from_wav(audio_test, 16000, step=10, window=20)spec = (spec - np.min(spec)) / (np.max(spec) - np.min(spec)) * 255.0img = np.array(spec, dtype=np.uint8)# 中值滤波对频谱进行去噪img_median = cv2.medianBlur(img, 3)# print(np.shape(spec))# debug# plt.figure(1)# plt.imshow(img_median)# plt.show()cv2.imwrite(save_path, img_median)return img_median

结果图

语音信号的原始数据

语音信号转为语谱图

python从语音生成语谱图相关推荐

  1. 不调包绘制音频语谱图并批量生成语谱图

    什么是语谱图 语谱图(Spectrogam)是表示语音频谱随时间变化的图形,其实是一个二维的图像,但却能表示三个维度的信息,横坐标表示时间,纵坐标表示频率,颜色的深浅来映射能量的大小.任一给定频率成分 ...

  2. 使用神经网络中的卷积核生成语谱图

    主题思想: 正交基函数, sin,cos 是通过网络训练得到的参数. 使用一维卷积核直接对于原始音频,进行卷积生成语谱图: 使用一维卷积核生成语谱图特征, 不同于以往的方式,正是因为这些正交基函数是通 ...

  3. python实现绘制信号序列语谱图

    python实现绘制信号序列语谱图 功能:绘制信号序列语谱图 代码: import numpy as np # 导入音频及绘图显示包 import librosa.display # 导入绘图工作的函 ...

  4. python计算wav的语谱图_Python实现电脑录音(含音频基础知识讲解)

    前言 今天开始进入近期系列文章的第一篇,如何用 Python 来实现录音功能. 在开始"造轮子"之前,个人一直强调一个观点,如果有些东西已经有了,不妨直接去 github 上搜,用 ...

  5. MATLAB实现实时录音,语音采集与读写用matlab实现录音以及语谱图的绘制.pdf

    <语音信号处理>仿真作业 院 系 电气与电子工程学院 专业班级 姓 名 学 号 指导教师 2020 年 3 月 作业题目:语音采集与读写 一.目的 (1)了解matlab 采集语音信号的原 ...

  6. 语音信号处理(四):生成语音信号的语谱图

    关于语谱图的简单介绍可以参考这篇文章 现代语音信号处理之语谱图(spectrogram) 下面对 ai d s t 这四个语音进行语谱图绘制 绘制代码如下 mkdir('***');%新建存放语谱图的 ...

  7. 使用Matlab绘制语音信号的语谱图

    本文绘制语音信号的语谱图主要使用了spectrogram函数,spectrogram是一个MATLAB函数,使用短时傅里叶变换得到信号的频谱图.当使用时无输出参数,会自动绘制频谱图:有输出参数,则会返 ...

  8. 记录通过librosa库进行语谱图的生成

    librosa官网 一. librosa的安装 pip3 install librosa ***注意:**librosa依赖很多其他东西,下载的时候需要开启代理,否则安装失败 二. 读取音频 说明: ...

  9. python求语音信号短时能量、短时过零率、语谱图

    python语音信号处理(二) 一.短时能量 短时能量主要用于区分浊音段和清音段,因为浊音时E(i)值比清音时大得多:区分声母与韵母的分界和无话段与有话段分界. 计算第i帧语音信号yi(n)的短时能量 ...

最新文章

  1. 【JOURNAL】城邦组诗之十二 - 心肠
  2. 实时监控Cat之旅~配置Cat集群需要注意的问题
  3. 页面级缓存@ OutputCache
  4. C#新手该如何规划学习【学习路线指南】
  5. 试图将驱动程序添加到存储区_云存储——终于等到你,还好没放弃
  6. 使用Memory Analyzer tool(MAT)分析内存泄漏(二)
  7. 2019年春第八周作业
  8. The host '192.168.174.130' is unreachable. the host may be down..............
  9. 三种视觉软件框架开发源码集合 三套 halcon视觉框架
  10. Vue 之 下载本地资源文件
  11. Excel宏的介绍及应用
  12. B站小UP主抽奖简易解决方案
  13. pytorch——weights_init(m)
  14. ei会议论文录用但不参加会议_同一个EI会议录用的文章一定全部都进EI吗?
  15. 长沙一佳一教育科技有限公司:短视频如何制作
  16. GOCAD如何导出voxet
  17. 从信号处理的角度研究毫米波联合雷达通信
  18. 计算机学科学年论文方向,计算机学年类论文选题 计算机学年论文题目怎么拟...
  19. 磁盘被格式化了的文件恢复办法
  20. 2015年百度之星程序设计大赛 - 资格赛:1002列变位法解密

热门文章

  1. python随机森林库_随机森林库:R和Python中的不同结果
  2. 计算机ip配置不正确怎么办,电脑ip地址不对该怎么办
  3. vos2009 校验版本超时_开源多云应用平台 Choerodon猪齿鱼发布0.14版本
  4. php 上传进度条api,php如何实现上传进度条
  5. linux nload_Linux nload命令
  6. 检查 ubuntu 版本_如何检查Ubuntu版本–快速简便的方法
  7. java功能模块_Java 14功能
  8. wordpress评论框_如何通过过滤和阻止它们来抵御WordPress垃圾评论
  9. tomcat配置重定向_在Tomcat上配置SSL以及从HTTP到HTTPS的设置自动重定向的步骤
  10. sql 计数_SQL不同,SQL计数不同,SQL选择不同