VS语音信号处理(1) C语言读取WAV语音文件文件头数据

  • 前言
  • 一. 工程实现
  • 二. 结果
  • 三. 小结

前言

语音识别相关算法一般在MATLAB上进行仿真验证与实验,在工程上一般还是在VS中进行实现落地,本系列将介绍语音信号处理在C语言中的一系列应用,后期将以此为基础,再落地移植到嵌入式平台。

语音文件的格式多种多样都存在不同的标准,在WAV格式的语音文件中主要包含两个部分:文件头与语音数据,本文将介绍读取WAV语音文件的文件头数据。WAV格式语音文件数据标准如下图所示。

即前44位位文件头数据,44位之后为语音数据。

一. 工程实现

// ExtractData.h
// 读取wav格式语音文件文件头数据
// date:2022-4-27 22:44:36
// author : C.S#ifndef _EXTRACTDATA_H_
#define _EXTRACTDATA_H_#include <stdint.h>typedef struct tagWAVHEADER {uint8_t   ChunkID[4];     // 文档标识。       大写字符串"RIFF",标明该文件为有效的 RIFF 格式文档。uint32_t  ChunkSize;      // 文件数据长度。   从下一个字段首地址开始到文件末尾的总字节数。该字段的数值加 8 为当前文件的实际长度。uint8_t   Format[4];      // 文件格式类型。   所有 WAV 格式的文件此处为字符串"WAVE",标明该文件是 WAV 格式文件。uint8_t   FmtChunkID[4];  // 格式块标识。     小写字符串,"fmt "。uint32_t  FmtChunkSize;   // 格式块长度。     其数值不确定,取决于编码格式。可以是 16、 18 、20、40 等。uint16_t  AudioFormat;    // 编码格式代码。   常见的 WAV 文件使用 PCM 脉冲编码调制格式,该数值通常为 1。uint16_t  NumChannels;    // 声道个数。       单声道为 1,立体声或双声道为 2。uint32_t  SampleRate;     // 采样频率。       每个声道单位时间采样次数。常用的采样频率有 11025, 22050 和 44100 kHz。uint32_t  ByteRate;       // 数据传输速率。   该数值为:声道数×采样频率×每样本的数据位数/8。播放软件利用此值可以估计缓冲区的大小。uint16_t  BlockAlign;     // 数据块对齐单位。 采样帧大小。该数值为:声道数×位数/8。播放软件需要一次处理多个该值大小的字节数据,用该数值调整缓冲区。uint16_t  BitsPerSample;  // 采样位数。       存储每个采样值所用的二进制数位数。常见的位数有 4、8、12、16、24、32。uint8_t   DataChunkID[4];uint32_t  DataChunkSize;
} WAVHEADER;#endif  // #ifndef _EXTRACTDATA_H_
// ExtractData.cpp
// 读取wav格式语音文件文件头数据
// date:2022-4-27 22:44:36
// author : C.S#include <stdio.h>
#include<iostream>
#include<fstream>
#include<stdlib.h>
#include "ExtractData.h"#define  W  128             //每次读写文件的数据量  int     FileSet = 0;                //定义一个整型变量, 用于保存fseek函数的返回值
int     FileEnd = 0;                //整个文件的字节数
int     FileLength = 0;             //文件的数据长度。(注:每2个字节作为一个数据 )
short   InputData[W];               //文件读写数据缓冲区  WAVHEADER    FileHeader;            //存文件头的结构体void showWavHead(WAVHEADER Header) {printf("ChunkID: %c%c%c%c\t", Header.ChunkID[0], Header.ChunkID[1], Header.ChunkID[2], Header.ChunkID[3]);printf("ChunkSize: %u\t", Header.ChunkSize);printf("Format: %c%c%c%c\n", Header.Format[0], Header.Format[1], Header.Format[2], Header.Format[3]);printf("FmtChunkID: %c%c%c%c\t", Header.FmtChunkID[0], Header.FmtChunkID[1], Header.FmtChunkID[2], Header.FmtChunkID[3]);printf("FmtChunkSize: %u\t", Header.FmtChunkSize);printf("AudioFormat: %d\t", Header.AudioFormat);printf("NumChannels: %d\t", Header.NumChannels);printf("SampleRate: %u\t", Header.SampleRate);printf("ByteRate: %u\t", Header.ByteRate);printf("BlockAlign: %d\t", Header.BlockAlign);printf("BitsPerSample: %d\n", Header.BitsPerSample);printf("DataChunkID: %c%c%c%c\t", Header.DataChunkID[0], Header.DataChunkID[1], Header.DataChunkID[2], Header.DataChunkID[3]);printf("DataChunkSize: %u\n", Header.DataChunkSize);
}int main() {FILE *Ifp, *txt;    //定义文件读写指针 Ifp = fopen("456.wav", "rb");    /*以只读方式打开wav文件*/txt = fopen("456.txt", "w");/* 获得文件字节数,fseek函数将文件内部指针指向文件末尾,ftell函数获取文件内部指针相对于文件头的偏移量,rewind函数将文件内部指针指向文件头 */fseek(Ifp, 0L, SEEK_END);FileEnd = ftell(Ifp);printf("total file size: %d bytes \n", FileEnd);rewind(Ifp);// 读取文件头,并打印部分信息,wav格式的文件头一般是44个字节,后面是音频数据fread(&FileHeader, 1, sizeof(WAVHEADER), Ifp);showWavHead(FileHeader);// 读取数据。这里的数据大小是2字节,按照实际格式改。while循环每次读写 W 个数据量,for循环写最后剩余的FileLength = FileEnd / 2;while (FileLength >= W) {fread(InputData, sizeof(short), W, Ifp);for (int i = 0; i < W; i++) {fprintf(txt, "%d\n", InputData[i]);}FileLength -= W;}fread(InputData, sizeof(short), FileLength, Ifp);for (int i = 0; i < FileLength; i++) {fprintf(txt, "%d\n", InputData[i]);}char  *buf;long filesize;filesize = ftell(Ifp);//ftell求文件指针相对于0的便宜字节数,就求出了文件字节数buf = (char *)malloc(sizeof(char)*filesize);//开辟空间给缓存数组fread(buf, 1, (filesize - 44), Ifp);//每次读一个字节到buf,同时求读的次数return 0;
}

二. 结果

三. 小结

WAV格式语音数据文件头数据中包含许多关键的语音文件信息如:

// 文档标识。 大写字符串"RIFF",标明该文件为有效的 RIFF 格式文档。

// 文件数据长度。 从下一个字段首地址开始到文件末尾的总字节数。该字段的数值加 8 为当前文件的实际长度。

// 文件格式类型。 所有 WAV 格式的文件此处为字符串"WAVE",标明该文件是 WAV 格式文件。

// 格式块标识。 小写字符串,"fmt "。

// 格式块长度。 其数值不确定,取决于编码格式。可以是 16、 18 、20、40 等。

// 编码格式代码。 常见的 WAV 文件使用 PCM 脉冲编码调制格式,该数值通常为 1。

// 声道个数。 单声道为 1,立体声或双声道为 2。

// 采样频率。 每个声道单位时间采样次数。常用的采样频率有11025,16000 , 22050 和 44100 Hz。

// 数据传输速率。 该数值为:声道数×采样频率×每样本的数据位数/8。播放软件利用此值可以估计缓冲区的大小。

// 数据块对齐单位。 采样帧大小。该数值为:声道数×位数/8。播放软件需要一次处理多个该值大小的字节数据,用该数值调整缓冲区。

// 采样位数。 存储每个采样值所用的二进制数位数。常见的位数有 4、8、12、16、24、32。

通过读取文件头数据信息,就可以得知语音文件数据的大多数格式信息,下一篇将介绍分段读取WAV语音文件中语音数据部分的实例。

VS语音信号处理(1) C语言读取WAV语音文件文件头数据相关推荐

  1. 如何用C语言编写wav读取函数,C++读取WAV音频文件的头部数据的实现方法

    C++读取WAV音频文件的头部数据的实现方法 前言: 在这里分享一下自己的心得,希望和大家一起分享技术,如果有什么不足,还请大家指正.写出这篇目的,就是希望大家一起成长,我也相信技术之间没有高低,只有 ...

  2. VS语音信号处理(2) C语言分段读取WAV语音文件语音数据

    VS语音信号处理(2) C语言分段读取WAV语音文件语音数据 前言 一. 工程实现 二. 结果 三. 小结 前言 语音识别相关算法一般在MATLAB上进行仿真验证与实验,在工程上一般还是在VS中进行实 ...

  3. c语言 文件 long double 读取,读取*.wav音频文件

    1.wav音频文件的格式 wav文件由文件头和采样数据2部分组成. 文件头又分为RIFF(Resource Interchange File Format).WAVE文件标识段 和 声音数据格式说明段 ...

  4. c语言读文件编译,C语言读取wav文件的问题,请大侠,编译问题。

    已结贴√ 问题点数:20 回复次数:5 C语言读取wav文件的问题,请大侠,编译问题. 代码如下:#include #include LRESULT CALLBACK WndProc (HWND, U ...

  5. python音频频谱_Python 读取WAV音频文件 画频谱的实例

    Python 读取WAV文件 import wave import struct from scipy import * from pylab import * #读取wav文件,我这儿读了个自己用p ...

  6. C语言解析WAV音频文件

    转载:http://www.cnblogs.com/LexMoon/p/wave-c.html 1.C语言解析WAV音频文件 代码地址: Github : https://github.com/Cas ...

  7. python用os.system打开wav文件_使用python读取wav格式文件

    ** 使用python读取wav格式文件 ** - 基本概念 [采样频率] 即取样频率, 指每秒钟取得声音样本的次数.采样频率越高,声音的质量也就越好,声音的还原也就越真实,但同时它占的资源比较多.由 ...

  8. 读取*.wav音频文件

    1.wav音频文件的格式 wav文件由文件头和采样数据2部分组成. 文件头又分为RIFF(Resource Interchange File Format).WAVE文件标识段 和 声音数据格式说明段 ...

  9. python语言可以处理数据文件吗_Python语言读取Marc后处理文件基础知识.pdf

    Python语言读取Marc后处理文件基础知识 基于 python 的焊接后处理 知识要点:  Python 语言  Python 模块功能  PyPost 后处理模块  PyPost 模块函 ...

  10. C语言读取wav文件

    参考代码: wav音频文件格式解析 代码的思路是编写wave.h,根据wav文件结构定义struct.大佬的执行结果为 然而我在运行代码的时候遇到的问题: 可以看到fmt长度为18,然而还是按照16来 ...

最新文章

  1. Debian | 软件安装升级点滴记录
  2. 快搜浏览器_郑秀晶因腿粗再上热搜:怎么减肥才能不反弹?
  3. python函数式编程之functools、itertools、operator详解
  4. SAP C4C里收藏了的客户,在什么地方能够快捷打开
  5. android 自定义顶部,Android自定义实现顶部粘性下拉刷新效果
  6. python 爬虫抓取网页数据导出excel_如何用excel实现网页爬虫
  7. 【毕业设计】基于单片机的指纹识别考勤系统 - 物联网 stm32
  8. 黑苹果声卡驱动成功后声音出现卡顿的解决办法
  9. 工业物联网解决方案,工业物联网原创监控平台如何搭建
  10. 【读书笔记】《读懂孩子的心》——重新了解完整的自己
  11. matlab 彩色图片分解,MATLAB 彩色图像分割
  12. VoIP的落地通信模型和要考虑几个大的方面问题及基本概念和交互流程整理
  13. Partitioning big graph with respect to arbitrary proportions in a streaming manner 菜鸟解读
  14. 面试官问:MySQL锁与事物隔离级别你知道吗?
  15. 博图HMI仿真无法连接实际PLC进行监控
  16. 摄影构图学83年绝版_点评2张粉丝投稿,有1处共同错误,3个摄影技巧“变废为宝”...
  17. 常用触摸屏驱动 android
  18. android智能手机编程考试答案,Android智能手机编程形考作业
  19. 读书笔记-精准努力-勇敢地直面问题
  20. QT实现抖音网红表白软件

热门文章

  1. AE 2021最新最全插件滤镜大全一键安装版下载 After Effects 2021插件合集WIN一键安装版 支持AE 2021
  2. FLUENT算例 —— Turbulent Pipe Flow (LES) 圆管湍流流动(大涡模拟)
  3. AI头发笔刷_5G大量PS笔刷AI笔刷打包下载(超过1000款笔刷)
  4. PMP®考试通过率多少
  5. 现金支票打印模板excel_Word如何批量打印奖状?按下这个键,1分钟生成1000张
  6. 五个免费的pdf转换器,轻松解决pdf怎么转换成word
  7. 【每天一个 Linux 命令】tree命令
  8. 计算机系统分析师高级试题及答案,2013年计算机软考系统分析师试题及答案1
  9. Windows DLL 注入技术
  10. oracle rman异地备份,rman异地备份与恢复测试