音频和视频的基础知识及计算
音频(audio)
声音信号,即相应于人类听觉可感知范围内的频率。多媒体中使用的是数字化音频 。采样后的声音以文件方式存储后,方可进行声音处理。声音文件有多种格式,目前常用的有:
无损格式,例如WAV,FLAC,APE,ALAC,WavPack(WV),cda
有损格式,例如MP3,AAC,Ogg Vorbis,Opus
计算公式 音频大小(字节)= (采样频率 * 采样精度 * 声道数) / 8 * 时间 (秒)
采样频率 也称为采样速度或者采样率,定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数是采样周期或者叫作采样时间,它是采样之间的时间间隔。通俗的讲采样频率是指计算机每秒钟采集多少个信号样本。
采样精度 采样精度是指通过采集声音的动态范围来反映度量声音波形幅度的精度。
采样精度决定了记录声音的动态范围,它以位(Bit)为单位,比如8位、16位。8位可以把声波分成256级,16位可以把同样的波分成65,536级的信号。可以想象,位数越高,声音的保真度越高。
样本大小是用每个声音样本的位数bit/s(即bps)表示的,它反映度量声音波形幅度的精度。例如,每个声音样本用16位(2字节)表示,测得的声音样本值是在0~65535的范围里,它的精度就是输入信号的1/65536。样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的质量越低,需要的存储空间越少。
声道数
略
音频剪裁和压缩
采样率就是44.1KHz
比特率就一般是128kbps kb是大小,ps是每秒,/s . 所以一个mp3的大小就是128460=30720kbp=3.07M
类似的单位还有兆位每秒(又称兆比特每秒,megabit per second, Mbps),Gbps(俗称千兆)
采样率就是44.1KHz这个值,越高反应音乐效果越好
比特率就一般是128kbps,反映每秒所使用的空间大小(比方硬盘空间大小),同样是越高反应音乐效果越好。
以下是更多的信息:
简单来讲,采样率和比特率就像是坐标轴上的横纵坐标。横坐标的采样率表示了每秒钟的采样次数。纵坐标的比特率表示了用数字量来量化模拟量的时候的精度。
采样率类似于动态影像的帧数,比如电影的采样率是24赫兹,PAL制式的采样率是25赫兹,NTSC制式的采样率是30赫兹。当我们把采样到的一个个静止画面再以采样率同样的速度回放时,看到的就是连续的画面。同样的道理,把以44.1kHZ采样率记录的CD以同样的速率播放时,就能听到连续的声音。显然,这个采样率越高,听到的声音和看到的图像就越连贯。当然,人的听觉和视觉器官能分辨的采样率是有限的,基本上高于44.1kHZ采样的声音,绝大部分人已经觉察不到其中的分别了。
而声音的位数就相当于画面的颜色数,表示每个取样的数据量,当然数据量越大,回放的声音越准确,不至于把开水壶的叫声和火车的鸣笛混淆。 同样的道理,对于画面来说就是更清晰和准确,不至于把血和西红柿酱混淆。不过受人的器官的机能限制,16位的声音和24位的画面基本已经是普通人类的极限了,更高位数就只能靠仪器才能分辨出来了。比如电话就是3kHZ取样的7位声音,而CD是44.1kHZ取样的16位声音,所以CD就比电话更清楚。
当你理解了以上这两个概念,比特率就很容易理解了。以电话为例,每秒3000次取样,每个取样是7比特,那么电话的比特率是21000。而CD是每秒44100次取样,两个声道,每个取样是13位PCM编码,所以CD的比特率是44100213=1146600,也就是说CD每秒的数据量大约是144KB,而一张CD的容量是74分等于4440秒,就是639360KB=640MB
VBR (Variable Bitrate) 动态比特率
也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确定使用什么比特率,这是以质量为前提兼顾文件大小的方式,推荐编码模式;
ABR (Average Bitrate) 平均比特率
是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折衷选择。
CBR (Constant Bitrate) 常数比特率
指文件从头到尾都是一种位速率。相对于VBR和ABR来讲,它压缩出来的文件体积很大,而且音质相对于VBR和ABR不会有明显的提高。
动画(animation)
将静态的图像、图形及连环图画等按一定时间顺序显示而形成连续的动态画面。
视频(video)
视频文件格式 mp4 avi flv rmvb mov asf
计算公式 :
数据量(位/秒) = (画面尺寸色彩位数(bit) 帧数) 应该就是视频比特率
视频大小(字节) = (画面尺寸色彩位数(bit) 帧数)* 时间(秒)/ 8
数据量 * 时间 / 8 = 文件总字节
视频比特率(码率,每秒传送的比特数-bit数,单位为 bps(Bit Per Second),比特率越高,传送数据速度越快。)
音频和视频的基础知识及计算相关推荐
- 音频和视频的基础知识
目录 PCM-脉冲编码调制 录音的原理 记录声音-音频数字化 音频数字化-PCM 采样 采样 采样率 采样定理 量化 位深度 编码 声道(Channel) 比特率 信噪比 编码(Encode) 解码( ...
- 视频格式基础知识 让你了解MKV MP4 H 265 码率\码流 多码流等等
转载请标明出处:http://blog.csdn.net/xx326664162/article/details/51784440 文章出自:薛瑄的博客 你也可以查看我的其他同类文章,也会让你有一 ...
- 视频测试基础知识--视频算法DMOS和PPSNR--视频参考与无参考测试介绍
视频测试基础知识--视频算法DMOS--视频参考与无参考测试介绍 测试则从传统的静态.单帧像分析,转换为动态测试.图像质量分析. 虽然单帧像分析可提供信号定时.色深.线条同步化,以及更多有用信息,但压 ...
- 理解HLS流及数字视频的基础知识
HLS (HTTP Live Streaming) HLS是一种基于HTTP的流媒体协议. HLS的工作原理 HLS的工作原理是将流分解为一系列小数据包. 在流会话开始时,HLS下载一个扩展名为M3U ...
- 音视频知多少(1)声音与视频的基础知识
前言 最近新加入的公司在嵌入式音视频方面算是全国领先水平,因而在完成自己本职的工作的时候有必要在这一方面做一系列的提升,以跟上其他同事的世界,不光光只支持BSP的能力,在我看来也是需要将视频流作为自己 ...
- 网络基础知识 快速计算子网掩码的2种方法
网络基础知识 快速计算子网掩码的2种方法<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office ...
- ffmpeg调整缩放裁剪视频的基础知识(转)
源网址:ffmpeg调整缩放裁剪视频的基础知识 - yongfengnice - 博客园 1. resize and scale video 调整视频的大小和尺寸 1-1.调整视频大小(resize) ...
- 音视频开发基础知识到进阶剖析
全网最强音视频开发教学--音视频开发基础知识到进阶剖析 1.要掌握多深的原理才能开始做项目 2.音视频基础有哪些必须掌握的 3.进阶需要学习什么项目 视频讲解如下,点击观看: 全网最强音视频开发--音 ...
- 零基础入门:实时音视频技术基础知识全面盘点
1.引言 随着移动网络速度越来越快.质量越来越来,实时音视频技术已经在各种应用场景下全面开花,语音通话.视频通话.视频会议.远程白板.远程监控等等. 实时音视频技术的开发也越来越受到重视,但是由于音视 ...
最新文章
- 什么是条件组合覆盖_物史政组合分析,新高考最终受益者丨选科17期
- 035_Unicode对照表一
- [转]oracle设计数据库应选择正确的数据类型
- SpringBoot初步入门
- 以太坊在哪里买_DeFi只是以太坊的开胃小菜,以太坊2.0才是重头戏
- 一名全栈工程师的必备“百宝箱”
- go micro java_Java Micro Framework:您无法忽略的新趋势
- 前端笔记-js文件首行添加;号(前端小技巧)
- QML工作笔记-在Row布局中如何进行稍许移动(图片Row布局会遇到)
- 虚拟机安装mac os x实战
- java中ajax由哪些组成,java中ajax
- Dos命令tasklisttaskkill强大命令
- 中望cad2012专业破解版
- idea 报@Override is not allowed when implementing interface method的问题解决
- [论文分享] Stegozoa: Enhancing WebRTC Covert Channels with Video Steganography for Internet Censorship
- Python boto3 遍历credential获取aws EC2基本信息
- 恒指均线流区间突破法的构建
- Python创建文件名为0000—nnnn的txt文件
- 页面加载时就请求ajax,页面加载时发送Ajax请求
- 用YOLO3进行人民币编码的定位与切割