Android的音视频开发是我暂定的一个职业发展的一个方向,通过自学记录一些记了又忘记的知识。

音频基础知识

采样率(samplerate)

蓝色代表模拟音频信号,红色的点代表采样得到的量化数值。

采用就是把模拟信号数字化的过程,不仅仅是音频需要采样,所有的模拟信号都需要通过采样转换为可以用0101来表示的数字信号。常用的音频采样频率有:8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz、96kHz、192kHz等。

人耳可以听到的声波频率范围?

20-20000Hz。为了保证声音不失真,采样频率应在40kHz以上。

AudioRecord构造参数中的sampleRateInHz。

量化精度(位宽)

上图中,每一个红色的采样点,都需要用一个数值来表示大小,这个数值的数据类型大小可以是:4bit、8bit、16bit、32bit等等,位数越多,表示得就越精细,声音质量自然就越好,当然,数据量也会成倍增大。

AudioRecord构造参数中的audioFormat。

声道数(channels)

由于音频的采集和播放是可以叠加的,因此,可以同时从多个音频源采集声音,并分别输出到不同的扬声器,故声道数一般表示声音录制时的音源数量或回放时相应的扬声器数量。

AudioRecord 构造参数中的channelConfig。

音频帧(frame)

视频我们知道每一帧是一张图片,音频数据是流式的,没有明确的一帧帧的概念,但是在音频处理的时候,一般取2.5ms-60ms为单位数据量的一帧音频。

假设某通道音频信号采样率为8kHz,位宽位16bit,20ms一帧,双通道,那么一帧音频的大小为:

8000*16bit*0.02*2=5120bit=640byte

音频编码

是将音频采样数据(PCM等)压缩成为音频码流,从而降低音频的数据量。模拟的音频信号转换为数字信号需要经过采样和量化,量化的过程被称之为编码,根据不同的量化策略,产生了许多不同的编码方式,常见的编码方式有:PCM 和 ADPCM

为什么要音频编码

存储一秒钟采样率为44.1KHz,位深为16bit,双声道的PCM编码的音频信号,需要

44100*16bit*2 / 8/1024 = 172.2KB的空间,那么1分钟则约为10.09M。

这对大部分用户是不可接受的。

只有2种方法,降低采样指标或者压缩。

音频压缩

降低采样是不可取的,因此就有了各种各样的压缩方式。

有两类主要的音频文件格式:

有损文件格式: 是基于声学心理学的模型,除去人类很难或根本听不到的声音。

无损格式,例如PCM,WAV,ALS,ALAC,TAK,FLAC,APE,WavPack(WV)

有损格式,例如MP3,AAC,WMA,Ogg。

根据采样率和采样大小可以得知,相对自然界的信号,音频编码最多只能做到无限接近,至少目前的技术只能这样了,相对自然界的信号,任何数字音频编码方案都是有损的,因为无法完全还原。在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV文件中均有应用。因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。

我们而习惯性的把MP3列入有损音频编码范畴,是相对PCM编码的。

Android如何采集音频

Android SDK对于音频采集提供两套API:MediaRecorder和AudioRecorder,前者是偏上层的一个API,可以直接把手机麦克风录入的音频数据进行编码压缩为AMR,MP3等并保存文件。后者接近底层,可以灵活控制,得到原始的一帧帧PCM音频数据。

当要简单的把数据采集为音频文件,就使用MediaRecorder,如果要对音频做进一步的算法处理就使用AudioRecorder。

什么是PCM音频数据?

PCM(Pulse Code Modulation)也被称为脉冲编码调制。PCM音频数据是未经压缩的音频采样数据裸流,它是由模拟信号经过采样、量化、编码转换成的标准的数字音频数据。(详细参考)

AudioRecord

简介

AudioRecord输出是PCM语音数据,如果保存成音频文件,是不能够被播放器播放的,所以必须先写代码实现数据编码以及压缩。

AudioRecord适用于对采集的音频数据进行二次处理的,我们首先看到代码AudioRecord类的构造函数。

/**

* Class constructor.

* Though some invalid parameters will result in an {@link IllegalArgumentException} exception,

* other errors do not. Thus you should call {@link #getState()} immediately after construction

* to confirm that the object is usable.

* @param audioSource the recording source.

* See {@link MediaRecorder.AudioSource} for the recording source definitions.

* @param sampleRateInHz the sample rate expressed in Hertz. 44100Hz is currently the only

* rate that is guaranteed to work on all devices, but other rates such as 22050,

* 16000, and 11025 may work on some devices.

* {@link AudioFormat#SAMPLE_RATE_UNSPECIFIED} means to use a route-dependent value

* which is usually the sample rate of the source.

* {@link #getSampleRate()} can be used to retrieve the actual sample rate chosen.

* @param channelConfig describes the configuration of the audio channels.

* See {@link AudioFormat#CHANNEL_IN_MONO} and

* {@link AudioFormat#CHANNEL_IN_STEREO}. {@link AudioFormat#CHANNEL_IN_MONO} is guaranteed

* to work on all devices.

* @param audioFormat the format in which the audio data is to be returned.

* See {@link AudioFormat#ENCODING_PCM_8BIT}, {@link AudioFormat#ENCODING_PCM_16BIT},

* and {@link AudioFormat#ENCODING_PCM_FLOAT}.

* @param bufferSizeInBytes the total size (in bytes) of the buffer where audio data is written

* to during the recording. New audio data can be read from this buffer in smaller chunks

* than this size. See {@link #getMinBufferSize(int, int, int)} to determine the minimum

* required buffer size for the successful creation of an AudioRecord instance. Using values

* smaller than getMinBufferSize() will result in an initialization failure.

* @throws java.lang.IllegalArgumentException

*/

public AudioRecord(int audioSource, int sampleRateInHz, int channelConfig, int audioFormat,

int bufferSizeInBytes)

看这个构造函数的参数的解释可以明白个七七八八。具体的介绍如下:

audioSource

音频采集的输入源,可选的值以常量的形式定义在 MediaRecorder.AudioSource 类中,常用的值包括:DEFAULT(默认),VOICE_RECOGNITION(用于语音识别,等同于DEFAULT),MIC(由手机麦克风输入),VOICE_COMMUNICATION(用于VoIP应用)等等。

sampleRateInHz

采样率,注意,目前44100Hz是唯一可以保证兼容所有Android手机的采样率。

channelConfig

通道数的配置,可选的值以常量的形式定义在 AudioFormat 类中,常用的是 CHANNEL_IN_MONO(单通道),CHANNEL_IN_STEREO(双通道)

audioFormat

这个参数是用来配置“数据位宽”的,可选的值也是以常量的形式定义在 AudioFormat 类中,常用的是 ENCODING_PCM_16BIT(16bit),ENCODING_PCM_8BIT(8bit),注意,前者是可以保证兼容所有Android手机的。

bufferSizeInBytes

配置的是 AudioRecord 内部的音频缓冲区的大小,该缓冲区的值不能低于一帧“音频帧”(Frame)的大小,而前一篇文章介绍过,一帧音频帧的大小计算如下:

int size = 采样率 x 位宽 x 采样时间 x 通道数

在Android开发中,AudioRecord 类提供了一个帮助你确定这个 bufferSizeInBytes 的函数,原型如下:

int getMinBufferSize(int sampleRateInHz, int channelConfig, int audioFormat);

不同的厂商的底层实现是不一样的,但无外乎就是根据上面的计算公式得到一帧的大小,音频缓冲区的大小则必须是一帧大小的2~N倍。

使用AudioRecord

操作AudioRecord步骤如下:

配置参数,初始化AudioRecord构造函数

开始采集

开启一个子线程,不断从AudioRecord的缓冲区将音频数据读出来。注意,这个过程一定要及时,否则就会出现“overrun”的错误,该错误在音频开发中比较常见,意味着应用层没有及时地取走音频数据,导致内部的音频缓冲区溢出。

停止采集,释放资源。

示例代码:

注意添加RECORD_AUDIO权限。

点击查看

MediaRecorder

MediaRecorder可以直接把手机麦克风录入的音频数据进行编码压缩为AMR,MP3等并保存文件。

使用MediaRecorder

简单操作使用MediaRecorder类步骤如下:

实例化MediaRecorder对象

使用函数SetAudioSource设置硬件设备为采集音频输入数据

使用函数SetOutputFormat设置输出音频格式。使用类OutputFormat列出支持的输出格式

调用方法SetAudioEncoder方法设置音频编码格式

调用SetOutputFile方法保存输出文件数据的绝对完整路径

调用Prepare方法初始化录制

调用Start方法开始录制

示例代码:

注意添加权限:

WRITE_EXTERNAL_STORAGE;

RECORD_AUDIO;

点击查看

总结

MediaRecorder和AudioRecord都可以录制音频,区别是MediaRecorder录制的音频文件是经过压缩后的,需要设置编码器。并且录制的音频文件可以用系统自带的Music播放器播放。

而AudioRecord录制的是PCM格式的音频文件,需要用AudioTrack来播放,AudioTrack更接近底层。

在用MediaRecorder进行录制音视频时,最终还是会创建AudioRecord用来与AudioFlinger进行交互。

C++层MediaRecorder创建AudioRecord类的代码位于AudioSource类构造函数中.

MediaRecorder录制的数据是 amr MP3 格式;AudioRecorder录制出来的是比较原始的PCM音频格式;PCM经过编码压缩可以为 amr MP3 AAC。

优缺点:

AudioRecord

主要是实现边录边播以及对音频的实时处理,这个特性让他更适合在语音方面有优势;

优点:语音的实时处理,可以用代码实现各种音频的封装

缺点:输出是PCM格式文件,如果保存成音频文件,是不能够被播放器播放的,所以必须先写代码实现数据编码以及压缩

MediaRecorder

已经集成了录音、编码、压缩等,支持少量的录音音频格式,大概有,aac,amr,3gp等

优点:集成,直接调用相关接口即可,代码量小

缺点:无法实时处理音频;输出的音频格式不是很多,例如没有输出mp3格式文件

android触屏音文件地址,Android音视频-音频采集相关推荐

  1. android 代码功能测试,Android触屏测试实例代码

    本文实例详细描述了Android触屏测试代码,可实现对触屏的点击.移动.离开等事件的处理,对于Android初学者有很好的借鉴价值. 具体功能代码如下: package com.test; impor ...

  2. android 触摸 事件,Android触屏事件和MotionEvent详解

    Android屏幕操作 屏幕是用户和Android设备交互的主要媒介,屏幕分为触屏和非触屏.Android设备目前有四种类型:Android Phone,Android Tablet,Android ...

  3. android 触摸时震动,android触屏震动以及震动强度批改

    android触屏震动以及震动强度修改 PhoneWindowManager.java: 在interceptKeyBeforeQueueing函数中 performHapticFeedbackLw( ...

  4. android横竖屏切换函数,Android横竖屏切换小结.PDF

    Android横竖屏切换小结 Android横竖屏切换小结 Android手机或平板都会存在横竖屏切换的功能,通常是由物理重力感应触发的,但是 有时候也不尽然,通常在设置里面我们可以对手机的横竖屏切换 ...

  5. [Android] 触屏setOnTouchListener实现图片缩放、移动、绘制和添加水印

        前一篇文章讲述了Android实现图片Matrix矩阵类缩放.旋转.对比度.亮度.饱和度处理,但是真正的图片软件都是使用触屏实现图片缩放.移动.添加水印等功能,所以该篇文章主要通过setOnT ...

  6. android触屏设备event模拟,android 使用命令模拟点击 滑动

    adb shell getevent -p 出现上述截图的就是屏幕触摸输入设备 带上 -l adb shell getevent -p-l . EV_ABS      ABS_MT_TRACKING_ ...

  7. android触屏压力方案,触摸屏实现原理与在android上实现.doc

    PAGE 6 武汉工程大学邮电与信息工程学院毕业设计(论文) 武汉工程大学邮电与信息工程学院 毕业设计(论文) 触摸屏的实现原理及在android上的实现 The Principle of the T ...

  8. Android触屏校验

    需求背景,在开机动画结束后弹出触屏校验 : 效果图 : 实现方法 :使用WindowManager在launcher上面添加View 具体代码: import android.annotation.S ...

  9. android锁屏软件开发,Android一键锁屏开发全过程

    一.项目简介: 项目:<Android 一键锁屏> 开发周期:4天 代码量:100行 二.项目流程: 三.项目代码 1.主程序代码: 1.private DevicePolicyManag ...

最新文章

  1. LeetCode 141. 环形链表 简单难度
  2. sql server 2014安装方法教程
  3. DOM-7 【兼容】事件处理函数、冒泡捕获、阻止冒泡默认事件
  4. 【python】Macbook的Anaconda查看、创建和管理python环境
  5. [C++] - 类的构造函数constructor
  6. python requests下载zip文件_python requests 下载zip包
  7. excel导入,用反射匹配字段名
  8. 真正厉害的人,是怎么分析问题的?
  9. 数据采集---高清壁纸
  10. python怎么升级python的pip
  11. Springboot毕设项目篮球文化商铺系统的设计与实现t1klm(java+VUE+Mybatis+Maven+Mysql)
  12. 《程序员的自我修养》后感【1】
  13. 查看计算机上隐藏用户,Win732位旗舰版系统下如何查看与删除隐藏账户【图】
  14. css——指定某个区域可垂直或水平滑动
  15. 通俗易懂玩QT:Qpaint绘制开关按钮(内附详细源码)
  16. 数据分析实战-15 一次学会python数据可视化的10种技能
  17. 数据库文件损坏修复实战笔记
  18. 红米手机安装google商店问题总结
  19. jquery.offset()使用方法总结
  20. 【课堂笔记】AE文字特效

热门文章

  1. 关于一些常见智柜问题的分析及解决办法
  2. 参考文献中会议名称怎么缩写_期刊缩写查询总结
  3. 正则表达式验证问题(用户名、密码、email、身份证
  4. 更安全的Web通信HTTPS
  5. ValueError: too many values to unpack
  6. 6759: 异或序列
  7. ScanTailor-ScanTailor 强大的多方位的满足处理扫描图片的需求
  8. C语言程序设计预报作业
  9. 【看番杂感】Clannad系列观后感(剧透慎入)
  10. RPC框架Dubbo分析