声明一下:这些关于ffmpeg的文章仅仅是用于记录我的学习历程和以便于以后查阅,文章中的一些文字可能是直接摘自于其它文章、书籍或者文献,学习ffmpeg相关知识是为了使用在Android上,我也才是刚開始接触学习,如有不正确之处还请指出。
音频格式是指要在计算机内播放或是处理音频文件,也就是要对声音文件进行数、模转换,这个过程相同由採样和量化构成。人耳所能听到的声音。最低的频率是从20HZ起一直到最高频率20KHZ。20KHZ以上人耳是听不到的,因此音频文件格式的最大带宽是20KHz,故而採样速率须要介于40~50KHZ之间,并且对每一个样本须要很多其它的量化比特数。音频数字化的标准是每一个样本16位-96dB的信噪比。採用线性脉冲编码调制PCM,每一量化步长都具有相等的长度。在音频文件的制作中。正是採用这一标准。
常见的音频格式有:CD格式、WAVE(*.WAV)、AIFF、AU、MP3、MIDI、WMA、RealAudio、VQF、OggVorbis、AAC、APE。
1、CD格式
CD格式的音质是比較高的音频格式。因此要讲音频格式,CD自然是打头阵的先锋。在大多数播放软件的“打开文件类型”中,都能够看到*.cda格式,这就是CD音轨了。

标准CD格式也就是44.1K的採样频率,速率88K/s,16位量化位数。由于CD音轨能够说是近似无损的,因此它的声音基本上是忠于原声的。一个CD音频文件是一个*.cda文件,这仅仅是一个索引信息,并非真正的包括声音信息,所以不论CD音乐的长短,在电脑上看到的"*.cda"文件都是44字节长。注意:不能直接的复制CD格式的*.cda文件到硬盘上播放,须要使用像EAC这种抓音轨软件把CD格式的文件转换成WAV,这个转换过程假设光盘驱动器质量过关并且EAC的參数设置得当的话,能够说是基本上无损抓音频。

2、WAVE
WAVE(*.WAV)是微软公司开发的一种声音文件格式,标准格式的WAV文件和CD格式一样,也是44.1K的採样频率,速率88K/s。16位量化位数。差点儿全部的音频编辑软件都“认识”WAV格式。
3、AIFF
AIFF(Audio Interchange File Format)格式和AU格式,它们都和WAV很相像。在大多数的音频编辑软件中也都支持它们这几种常见的音乐格式。
4、AU
AUDIO文件是SUN公司推出的一种数字音频格式。AU文件原先是UNIX操作系统下的数字声音文件。因为早期INTERNET上的WEBserver主要是基于UNIX的。所以。AU格式的文件在现在的INTERNET中也是经常使用的声音文件格式。
5、MPEG
MPEG是动态图像专家组的英文缩写。

MPEG音频文件指的是MPEG标准中的声音部分即MPEG音频层。MPEG含有格式包含:MPEG-1、MPEG-2、MPEG-Layer3、MPEG-4。

6、MIDI
MIDI(Musical Instrument Digital Interface)乐器数字接口。是20世纪80年代初为解决电声乐器之间的通信问题而提出的。MIDI是编曲界最广泛的音乐标准格式。可称为“计算机能理解的乐谱”。它用音符的数字控制信号来记录音乐。

一首完整的MIDI音乐仅仅有几十KB大。而能包括数十条音乐轨道。

差点儿全部的现代音乐都是用MIDI加上音色库来制作合成的。MIDI传输的不是声音信号。而是音符、控制參数等指令,它指示MIDI设备要做什么,怎么做。如演奏哪个音符、多大音量等。它们被统一表示成MIDI消息(MIDI Message)。传输时採用异步串行通信,标准通信波特率为31.25*(1+/-0.01)KBaud。

MIDI是乐器数字化接口,能够把MIDI理解成是一种协议、一种标准、或是一种技术,但它并非单指某个硬件设备。

MIDI系统实际就是一个作曲、配器、电子模拟的演奏系统。从一个MIDI设备转送到还有一个MIDI设备上去的数据就是MIDI信息。MIDI数据不是数字的音频波形。而是音乐代码或称电子乐谱。MIDI是一种电子乐器之间以及电子乐器与电脑之间的统一交流协议。在播放时,依据MIDI文件记录的乐曲信息向波表发出指令。从“表格”中逐一找出相应的声音信息,经过合成、加工后回放出来。

因为它採用的是真实乐器的採样。所以效果自然要好于FM。一般波表的乐器声音信息都以44.1KHz、16Bit的精度录制,以达到最真实的回放效果。

7、WMA
WMA(Windows Media Audio)格式是来自于微软的重量级选手,后台强硬,音质要强于MP3格式,更远胜于RA格式。它和日本YAMAHA公司开发的VQF格式一样,是以降低数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都能够达到1:18左右。另外WMA还支持音频流(Stream)技术,适合在网络上在线播放。
8、RealAudio
RealAudio主要适用于在网络上的在线音乐赞赏,如今大多数的用户仍然在使用56Kbps或更低速率的Modem,所以典型的回放并不是最好的音频。有的下载网站会提示你依据你的Modem速率选择最佳的Real文件。

real的文件 格式主要有那么几种:有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured)。还有很多其它。这些格式的特点是能够随网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较富裕的听众获得较好的音质。

9、VQF
雅马哈公司还有一种格式是*.vqf,它的核心是降低数据流量但保持音质的方法来达到更高的压缩比,VQF的音频压缩率比标准的MPEG音频压缩率高出近一倍,能够达到18:1左右甚至更高。
10、OggVorbis
OggVorbis是一种新的音频压缩格式,类似于MP3等现有的音乐格式。但有一点不同的是,它是全然免费、开放和没有 专利限制的。

Vorbis採用有损压缩,但通过使用更加先进的声学模型去降低损失,因此,相同位速率编码的OGG与MP3相比起来更好一些。并且MP3格式是受专利保护的。

11、AMR
AMR全称Adaptive Multi-Rate。自适应多速率编码。主要用于移动设备的音频,压缩比比較大,但相对于其它的压缩格式质量比較差,因为多用于人声,通话,效果还是非常不错的。
外挂字幕与内嵌字幕的阐述
外挂字幕:是视频文件和字幕文件分离,在播放的时候要导入字幕文件。外挂字幕的优点是:能够导入自己国家的语言。
内嵌字幕:视频文件和字幕文件已经集成到了一起,没有办法改变和去掉了。
外挂字幕的三种格式:
1、srt格式:这是最好的。体积小。用记事本能够打开编辑。
2、sub+idx:这样的是图形字幕,仅仅能用字幕转换软件,体积较大。
3、ass字幕:网上比較少,比srt多一些特效。
外挂字幕的一些基本注意事项:
使用外挂字幕的时候,要保证字幕文件和视频文件放置在同一个目录下,而且保证两者的文件名称同样。可是不要改动后缀和标识(常见的标识有chs、GB、cht、Big5、eng五种,当中chs和GB表示中文简体,cht和Big5表示繁体中文,eng表示英文)
转载请注明出处:http://blog.csdn.net/android_jiangjun/article/details/46740237

转载于:https://www.cnblogs.com/mfmdaoyou/p/7122965.html

FFmpeg基础库编程开发学习笔记——音频常见格式及字幕格式相关推荐

  1. ffmpeg基础库编程开发 读书笔记

    第一章 1.6 容器和协议 1. 媒体文件和编码的区别 文件是既包括视频又包括音频.甚至还带有脚本的一个集合,也可以叫做容器: 文件当中的视频和音频的压缩算法才是具体的编码. 2. 两大标准指定组织 ...

  2. ffmpeg基础库编程开发.pdf

    ffmpeg基础库编程开发.pdf 下载地址: http://download.csdn.net/detail/aflyeaglenku/9718140 目录结构如下图:

  3. 编程开发学习笔记之程序员如何用1年时间获得3年成长(图)

    2019独角兽企业重金招聘Python工程师标准>>> 编程开发学习笔记之程序员如何用1年时间获得3年成长(图) 前言 这世界存在这么一个银行,你一出生,就自动享有这家银行为你开设的 ...

  4. FFmpeg基础到工程-多路H265监控录放开发学习笔记

    多路H265监控录放开发学习笔记 课程涉及:FFmpeg,WebRTC,SRS,Nginx,Darwin,Live555,等.包括:音视频.流媒体.直播.Android.视频监控28181.等. 具体 ...

  5. Python快速编程入门#学习笔记01# |第一章 :Python基础知识 (Python发展历程、常见的开发工具、import模块导入)

    全文目录 ==先导知识== 1 认识Python 1.1.1 Python的发展历程 1.1.2 Python语言的特点 2. Python解释器的安装与Python程序运行 1.2.1 安装Pyth ...

  6. Windows驱动开发学习笔记(二)—— 驱动调试内核编程基础

    Windows驱动开发学习笔记(二)-- 驱动调试&内核编程基础 基础知识 驱动调试 PDB(Program Debug Database) WinDbg 加载 PDB 实验:调试 .sys ...

  7. Python快速编程入门#学习笔记03# |第二章 :Python基础(代码格式、标识符关键字、变量和数据类型、数字类型以及运算符)

    全文目录 ==先导知识== 学习目标: 2.1 代码格式 2.1.1 注释 2.1.2 缩进 2.1.3 语句换行 2.2 标识符和关键字 2.2.1 标识符 2.2.2 关键字 2.3 变量和数据类 ...

  8. ⑤ESP8266 开发学习笔记_By_GYC 【ESP8266 IDF框架 使用C++编程】

    ⑤ESP8266 开发学习笔记_By_GYC [ESP8266 IDF框架 使用C++编程] 目录 ⑤ESP8266 开发学习笔记_By_GYC [ESP8266 IDF框架 使用C++编程] 一.简 ...

  9. golang游戏开发学习笔记-开发一个简单的2D游戏(基础篇)

    此文写在golang游戏开发学习笔记-创建一个能自由探索的3D世界之后,感兴趣可以先去那篇文章了解一些基础知识,在这篇文章里我们要创建一个简单的2D游戏场景以及配套的人物,并实现人物运动和碰撞检测功能 ...

最新文章

  1. AI创业哪家强?6大选择给你方向
  2. ios Runloop
  3. iOS10存高级安全隐患 黑客入侵可比以往快2500倍
  4. 如何构建一套高性能、高可用性、低成本的视频处理系统?
  5. (三)linux之根文件系统的制作
  6. 《Spring参考手册》中定义了以下几个AOP的重要概念
  7. Java执行外部命令,并把结果回显到控制台
  8. mysql InnoDB引擎支持hash索引吗
  9. 想法独特 上半年最具特色摄像头集锦
  10. java毕业设计——基于java+JSP+MyEclipse的网上订餐系统设计与实现(毕业论文+程序源码)——网上订餐系统
  11. 《资治通鉴》曾参三人成“真”、胡服骑射、吕不韦
  12. 抖音超火JavaScript实现网红太空人表盘 ~看程序员是如何用代码做华为太空手表
  13. redis.clients.jedis.exceptions.JedisDataException
  14. redhat各版本和下载地址
  15. 留学生VS应届生,留学生在当下还有求职优势吗
  16. HTML的文本输入框、密码输入框
  17. matlab怎么看fit文件,FIT文件格式解析及MATLAB读取程序
  18. YYYY-mm-dd HHMMSS大小写解释
  19. 战略财务、共享财务、业务财务的思考-来自一个财务业务的分享
  20. 【简谈】可编程逻辑器件发展历史及工艺分类

热门文章

  1. mysql 存储过程 总结_Mysql存储过程总结
  2. JavaSE语言基础
  3. Go语言的流程结构简单介绍
  4. 28岁程序员目前考虑转行,但又不知道自己能干什么
  5. 头歌Python,7号的,作业,
  6. 为了数学的明天,,穿越时空,重返南大(III)-
  7. Leetcode 838. 推多米诺 C++
  8. wd移动硬盘不能识别_西数移动硬盘电脑提示无法识别USB设备怎么办
  9. R 中关闭科学记数法
  10. CRMEBV4小程序H5页面端宝贝列表分享海报以及会员中心分销推广不显示的常见问题解决