MediaCodec讲解

MediaCodec是Android提供的用于对音视频进行编解码的类,它通过访问底层的codec来实现编解码的功能。是Android media基础框架的一部分,通常和 MediaExtractor, MediaSync, MediaMuxer, MediaCrypto, MediaDrm, Image, Surface和AudioTrack一起使用。

MediaCodec支持的数据类型

编解码器支持的数据类型:压缩的音视频数据,原始音频数据和原始视频数据

  • 数据通过ByteBuffers类来表示。

  • 可以设置Surface来获取/呈现原始的视频数据,Surface使用本地的视频buffer,不需要进行ByteBuffers拷贝。可以让编解码器的效率更高。

  • 通常在使用Surface的时候,无法访问原始的视频数据,但是可以使用ImageReader访问解码后的原始视频帧。在使用ByteBuffer的模式下,可以使用Image类和getInput/OutputImage(int)获取原始视频帧。

压缩的音视频数据
  • 对于视频类型,这通常是一个压缩视频帧。
  • 对于音频数据,这通常是单个访问单元(通常包含由格式类型的指定的几毫秒的音频段(通常包含几毫秒的音频),但是该要求略微放松,因为一个buffer可以包含多个编码的音频访问单元。
  • 在以上两种情况下,buffer都不在任意字节边界上启动或结束,而是在帧/访问单元边界上启动或结束,除非它们被BUFFER_FLAG_PARTIAL_FRAME标记。
原始音频数据

原始音频buffer包含PCM音频数据的整个帧,这是每个通道按通道顺序的一个样本。每个样本都是一个 AudioFormat#ENCODING_PCM_16BIT。

原始视频数据

在ByteBuffer模式下,视频buffer根据它们的MediaFormat#KEY_COLOR_FORMAT进行布局。可以从getCodecInfo(). MediaCodecInfo.getCapabilitiesForType.CodecCapability.colorFormats获取支持的颜色格式。视频编解码器可以支持三种颜色格式:

  • native raw video format: CodecCapabilities.COLOR_FormatSurface,可以与输入/输出的Surface一起使用。
  • flexible YUV buffers 例如CodecCapabilities.COLOR_FormatYUV420Flexible, 可以使用getInput/OutputImage(int)与输入/输出Surface一起使用,也可以在ByteBuffer模式下使用。
  • other, specific formats: 通常只支持ByteBuffer模式。有些颜色格式是厂商特有的,其他定义在CodecCapabilities。对于等价于flexible格式的颜色格式,可以使用getInput/OutputImage(int)。

从Build.VERSION_CODES.LOLLIPOP_MR1.开始,所有视频编解码器都支持flexible的YUV 4:2:0 buffer。

MediaCodec状态与生命周期

MediaCodec生命周期状态分为三种 Stopped、Executing和Released
其中Stopped包含三种子状态 Uninitialized(为初始化状态)、Configured(已配置状态)、Error(异常状态)
Executing也包含三个子状态 Flushed(刷新状态)、Running(运行状态)和EOS(流结束状态)

Stopped状态:
  • Uninitialized:当使用工厂方法创建了一个MediaCodec对象,此时处于Uninitialized状态。可以在任何状态调用reset()方法使MediaCodec返回到Uninitialized状态
  • Configured:使用configure(…)方法对MediaCodec进行配置转为Configured状态
  • Error:MediaCodec遇到错误时进入Error状态。错误可能是在队列操作时返回的错误或者异常导致的。
Executing状态:

当调用了mediaCodec.start()方法后,就由stopped到Executing状态了,在此状态下,可以通过上面描述的缓冲队列操作来处理数据

  • Flushed:在调用start()方法后MediaCodec立即进入Flushed子状态,此时MediaCodec会拥有所有的缓存。可以在Executing状态的任何时候通过调用flush()方法返回到Flushed子状态。
  • Running:一旦第一个输入缓存(input buffer)被移出队列,MediaCodec就转入Running子状态,这种状态占据了MediaCodec的大部分生命周期。通过调用stop()方法转移到Uninitialized状态。
  • EOS:将一个带有end-of-stream标记的输入buffer入队列时,MediaCodec将转入End-of-Stream子状态。在这种状态下,MediaCodec不再接收之后的输入buffer,但它仍然产生输出buffer直到end-of-stream标记输出。
Released状态

当使用完MediaCodec后,必须调用release()方法释放其资源。调用 release()方法进入最终的Released状态。

工作原理和基本流程

来看这个图片,这张图片就是MediaCodec的工作原理。简单讲一下就是。

  • 数据的生产方(左侧的Client)从input缓冲队列申请empty buffer,然后把要处理的数据,填充到这些empty buffer里面。就是上面的空方块(empty buffer),经过Client(数据生成方)之后,变成了红色实心的方块(有数据的buffer)

  • 这些数据经过Codec处理之后,然后处理后的数据(黄色的方块)放入到右侧output缓冲区队列

  • 消费方Client(右侧Client)从output缓冲区队列申请处理后的buffer,然后进一步处理,最后再将改buffer放回缓冲队列。

接下来,就以解析mp4的视频为例。讲解一下mediaCodec的解码视频轨道的过程。各个功能看文中的代码注释,一些异常处理,这里就暂时不考虑了。

这里大概讲一下mp4解码的过程(代码参考grafika)

  1. 创建MediaExtractor(),并设置数据源,MediaExtractor类,可以用来分离容器中的视频track和音频track。然后选中音频轨道
  2. 通过MediaCodec.createDecoderByType解码器
  3. 调用decoder的configure与start函数
  4. 调用decoder.dequeueInputBuffera得到inputBufIndex
  5. decoder.getInputBuffer(inputBufIndex)得到inputBuf
  6. 调用 extractor.readSampleData填充inputBuf
  7. 调用extractor.advance()移动到下一个样本
  8. 调用decoder.dequeueOutputBuffer(mBufferInfo, TIMEOUT_USEC)得到decoderStatus,这里是消费者消费数据
  9. 调用decoder.releaseOutputBuffer(decoderStatus,doRender),释放输出的Buffer空间
package com.example.videodemoimport android.media.MediaCodec
import android.media.MediaExtractor
import android.media.MediaFormat
import android.os.Handler
import android.os.Message
import android.util.Log
import android.view.Surface
import java.io.File
import java.io.FileNotFoundException
import java.io.IOExceptionclass MediaCodecDemo constructor(val path: File, val outputSurface: Surface,val callback: SpeedControlCallback) {private val TAG: String = "MediaCodecDemo"var mVideoHeight = -1var mVideoWidth = -1private val mBufferInfo = MediaCodec.BufferInfo() //输出buffer的metadatavar mLoop = falseinit {var extractor: MediaExtractor? = nulltry {extractor = MediaExtractor()extractor.setDataSource(path.toString())val trackIndex = selectVideoTrack(extractor)if (trackIndex < 0) {throw RuntimeException("找不到视频轨道")}extractor.selectTrack(trackIndex)val format = extractor.getTrackFormat(trackIndex)mVideoHeight = format.getInteger(MediaFormat.KEY_HEIGHT)mVideoWidth = format.getInteger(MediaFormat.KEY_WIDTH)} finally {extractor?.release()}}//寻找视频轨道,并返回对应的indexprivate fun selectVideoTrack(extractor: MediaExtractor): Int {val numTracks = extractor.trackCountLog.d("hch","index $numTracks")for (index in 0 until numTracks) {val format = extractor.getTrackFormat(index)val mime = format.getString(MediaFormat.KEY_MIME)mime?.let {if (it.startsWith("video/")) {Log.d("hch","index $index")return index}}}return -1}private fun play() {var extractor: MediaExtractor? = nullvar decoder: MediaCodec? = nulltry {extractor = MediaExtractor()extractor.setDataSource(path.toString())//文件不存在,直接抛出异常if (!path.exists()) {throw FileNotFoundException("file donot exists")}val trackIndex = selectVideoTrack(extractor)if (trackIndex < 0) {throw RuntimeException("video track dont find")}extractor.selectTrack(trackIndex)val format = extractor.getTrackFormat(trackIndex)val mine = format.getString(MediaFormat.KEY_MIME)decoder = mine?.let { MediaCodec.createDecoderByType(it) }decoder?.let {decoder?.configure(format, outputSurface, null, 0)decoder?.start()doFrame(extractor!!, trackIndex, it)}} catch (e:IOException){}finally {decoder?.stop()decoder?.release()decoder = nullextractor?.release()extractor = null}}private fun doFrame(extractor: MediaExtractor, trackIndex: Int, decoder: MediaCodec) {val TIMEOUT_USEC = 10000Lvar inputChunk = 0var inputDone = falsevar outputDone = falsewhile (!outputDone) {//获取输入buff的空间if (!inputDone) {//得到inputBufIndexval inputBufIndex = decoder.dequeueInputBuffer(TIMEOUT_USEC)if (inputBufIndex >= 0) {//得到对应的inputBufferval inputBuf = decoder.getInputBuffer(inputBufIndex)inputBuf?.let {//数据生成方填充对应的inputBufval chunkSize = extractor.readSampleData(it, 0)if (chunkSize < 0) {//读到文件末decoder.queueInputBuffer(inputBufIndex,0,0,0L,MediaCodec.BUFFER_FLAG_END_OF_STREAM)//推出循环inputDone = true} else {//val presentationTimeUs = extractor.sampleTimedecoder.queueInputBuffer(inputBufIndex,0,chunkSize,presentationTimeUs,0)inputChunk++//移动到下一个样本extractor.advance()}}} else {Log.d("hch", "input buffer not available")}}if (!outputDone) {//获取Codec的数据val decoderStatus = decoder.dequeueOutputBuffer(mBufferInfo, TIMEOUT_USEC)when {decoderStatus == MediaCodec.INFO_TRY_AGAIN_LATER -> {Log.d("hch", "no output from decoder available")}decoderStatus == MediaCodec.INFO_OUTPUT_FORMAT_CHANGED -> {val newFormat = decoder.outputFormatLog.d(TAG, "decoder output format changed: $newFormat")}decoderStatus < 0 -> {throw RuntimeException("unexpected result from decoder.dequeueOutputBuffer: $decoderStatus")}else -> {// decoderStatus >= 0var doLoop = falseif (mBufferInfo.flags.and(MediaCodec.BUFFER_FLAG_END_OF_STREAM) != 0) {if (mLoop) {doLoop = true} else {outputDone = true}}val doRender = (mBufferInfo.size != 0)//控制速率if (doRender){callback.preRender(mBufferInfo.presentationTimeUs)}//释放资源decoder.releaseOutputBuffer(decoderStatus,doRender)if (doRender ) {callback.postRender()}if (doLoop){Log.d(TAG,"")extractor.seekTo(0, MediaExtractor.SEEK_TO_CLOSEST_SYNC)inputDone = falsedecoder.flush()}}}}}}class PlayTask(player: MediaCodecDemo,) :Runnable {private val mPlayer: MediaCodecDemoprivate var mDoLoop = falseprivate var mThread: Thread? = nullprivate val mLocalHandler: LocalHandlerprivate val mStopLock = java.lang.Object()private var mStopped = falsefun setLoopMode(loopMode: Boolean) {mDoLoop = loopMode}fun execute() {mThread = Thread(this, "Movie Player")mThread?.start()}fun waitForStop() {synchronized(mStopLock) {while (!mStopped) {try {mStopLock.wait()} catch (ie: InterruptedException) {// discard}}}}override fun run() {try {mPlayer.play()} catch (ioe: IOException) {throw RuntimeException(ioe)} finally {// tell anybody waiting on us that we're donesynchronized(mStopLock) {mStopped = truemStopLock.notifyAll()}}}private class LocalHandler : Handler() {override fun handleMessage(msg: Message) {val what = msg.whatwhen (what) {MSG_PLAY_STOPPED -> {val fb: PlayerFeedback = msg.obj as PlayerFeedbackfb.playbackStopped()}else -> throw RuntimeException("Unknown msg $what")}}}companion object {private const val MSG_PLAY_STOPPED = 0}/*** Prepares new PlayTask.** @param player The player object, configured with control and output.* @param feedback UI feedback object.*/init {mPlayer = playermLocalHandler = LocalHandler()}}}interface PlayerFeedback {fun playbackStopped()
}
interface FrameCallback {fun preRender(presentationTimeUsec: Long)fun postRender()fun loopReset()
}
package com.example.videodemoimport android.util.Log
import com.example.videodemo.SpeedControlCallbackclass SpeedControlCallback : FrameCallback {private var mPrevPresentUsec: Long = 0private var mPrevMonoUsec: Long = 0private var mFixedFrameDurationUsec: Long = 0private var mLoopReset = falsefun setFixedPlaybackRate(fps: Int) {mFixedFrameDurationUsec = ONE_MILLION / fps}// runs on decode threadoverride fun preRender(presentationTimeUsec: Long) {if (mPrevMonoUsec == 0L) {mPrevMonoUsec = System.nanoTime() / 1000mPrevPresentUsec = presentationTimeUsec} else {// Compute the desired time delta between the previous frame and this frame.var frameDelta: Longif (mLoopReset) {mPrevPresentUsec = presentationTimeUsec - ONE_MILLION / 30mLoopReset = false}frameDelta = if (mFixedFrameDurationUsec != 0L) {mFixedFrameDurationUsec} else {presentationTimeUsec - mPrevPresentUsec}if (frameDelta < 0) {Log.w(TAG, "Weird, video times went backward")frameDelta = 0} else if (frameDelta == 0L) {Log.i(TAG, "Warning: current frame and previous frame had same timestamp")} else if (frameDelta > 10 * ONE_MILLION) {Log.i(TAG, "Inter-frame pause was " + frameDelta / ONE_MILLION +"sec, capping at 5 sec")frameDelta = 5 * ONE_MILLION}val desiredUsec = mPrevMonoUsec + frameDelta // when we want to wake upvar nowUsec = System.nanoTime() / 1000while (nowUsec < desiredUsec - 100 /*&& mState == RUNNING*/) {var sleepTimeUsec = desiredUsec - nowUsecif (sleepTimeUsec > 500000) {sleepTimeUsec = 500000}try {if (CHECK_SLEEP_TIME) {val startNsec = System.nanoTime()Thread.sleep(sleepTimeUsec / 1000, (sleepTimeUsec % 1000).toInt() * 1000)val actualSleepNsec = System.nanoTime() - startNsecLog.d(TAG, "sleep=" + sleepTimeUsec + " actual=" + actualSleepNsec / 1000 +" diff=" + Math.abs(actualSleepNsec / 1000 - sleepTimeUsec) +" (usec)")} else {Thread.sleep(sleepTimeUsec / 1000, (sleepTimeUsec % 1000).toInt() * 1000)}} catch (ie: InterruptedException) {}nowUsec = System.nanoTime() / 1000}mPrevMonoUsec += frameDeltamPrevPresentUsec += frameDelta}}override fun postRender() {}override fun loopReset() {mLoopReset = true}companion object {private const val TAG = "SpeedControlCallback"private const val CHECK_SLEEP_TIME = falseprivate const val ONE_MILLION = 1000000L}
}

以上就是mediaCodec的解码mp4视频轨道的代码了。

MediaCodec解析MP4视频相关推荐

  1. 【Python网络爬虫实战篇】使用selenium+requests爬取下载高清源视频:关于爬取m3u8文件链接解析为ts视频合并成mp4视频的分析实战

    这两天博主在摸鱼时,偶然间接触到了流媒体的概念,一时间来了兴致.再加上之前博主有着七.八年的视频制作经验,深知视频素材获取的不易.因此,打算利用自己所学的python网络爬虫的知识,通过编写代码实现获 ...

  2. 如何使用mp4v2解析mp4文件,抽取音视频数据帧【源码】【mp4】【NVR】

    前言: mp4文件目前已经成为了流媒体音视频行业的通用标准文件格式,它是基于mov格式基础上演变来的,特别适合多平台播放,录制一次,多个平台都可使用.但是,由于mp4格式相对比较复杂,直到mp4v2这 ...

  3. atitit.mp4 视频文件多媒体格式结构详解

    atitit.mp4 视频文件多媒体格式结构详解 1. 一.基本概念1 2. MP4文件概述2 3. mp4是由一个个"box"组成的,2 4. 典型简化mp43 5. Fragm ...

  4. Android项目小结——硬解码(MediaCodec实现[MP4]转YUV420各种格式)

    YUV420 yuv420p:yv12(YYYYYYYY VV UU).I420(YYYYYYYY UU VV) yuv420sp:nv12(YYYYYYYY UV UV).nv21(YYYYYYYY ...

  5. python多线程爬取ts文件并合成mp4视频

    python多线程爬取ts文件并合成mp4视频 声明:仅供技术交流,请勿用于非法用途,如有其它非法用途造成损失,和本博客无关 目录 python多线程爬取ts文件并合成mp4视频 前言 一.分析页面 ...

  6. Mp4视频首帧加载时间过长问题分析

    一.背景说明 用户反映某课程视频(mp4格式)从打开播放器到第一帧画面显示,加载时间过长,影响观看体验. 二.时间埋点 1.定位耗时问题,最直接的方法是在关键节点埋点,打印时间戳,找出耗时操作.项目使 ...

  7. m3u8格式下载合并mp4视频

    m3u8解析.ts视频块解密合并mp4 今天客户有个批量下载视频得需求.拿到链接一顿分析.发现视频是m3u8文件分块.然后有KEY加密.aes-128 下面开始处理流程: 1 先取出key链接.这里得 ...

  8. 服务器设置播放mp4文件,服务器设置播放mp4视频

    服务器设置播放mp4视频 内容精选 换一换 华为云面向企业市场推出音视频转码解决方案,可以根据用户业务需要,提供云端音视频转码服务,以满足用户业务在OTT.PC以及移动终端上播放的诉求 来自:解决方案 ...

  9. 群晖Nas通过jellyfin搭建本地影音库详细全过程(四):解析jellyfin视频信息文件NFO

    前言,经过上述刮削之后,电脑里还剩下很多不知名的或者一些个人喜欢的科普视频等,这些视频也很多,难道都要导入tinyMediaManager一个个手动添加视频信息吗?应该看看tinyMediaManag ...

  10. Python3从零开始爬取今日头条的新闻【五、解析头条视频真实播放地址并自动下载】

    Python3从零开始爬取今日头条的新闻[一.开发环境搭建] Python3从零开始爬取今日头条的新闻[二.首页热点新闻抓取] Python3从零开始爬取今日头条的新闻[三.滚动到底自动加载] Pyt ...

最新文章

  1. c语言函数库哪里keyk,[精品]C语言库函数(字母G-K)-教案.doc
  2. 一包烟钱买到电动剃须刀,小米有品告诉你什么叫性价比
  3. 【RocketMQ】【分布式事务】使用RocketMQ实现分布式事务
  4. elasticsearch使用jetty进行简单的权限控制
  5. [WC2018]通道
  6. c语言subscripted_c语言。数组的问题。急!
  7. saltstack php,Saltstack快速入门简单汇总
  8. diskgenius扩容c盘重启电脑卡住_电脑开机显示:reboot and select proper boot device怎么办?...
  9. Ensure that config phoenix.schema.isNamespaceMappingEnabled is consistent on client and server
  10. 使用xml文件存储数据使用xpath查询
  11. icmp基于tcp还是udp_imi -- 基于PHP协程应用开发框架,支持WebSocket,TCP,UDP应用开发...
  12. 【数据挖掘】数据挖掘简介及十大经典算法
  13. win10安装RNDIS驱动
  14. “个人数据库操作可视化系统”设计思维导图
  15. 微信与企业微信的十个区别
  16. usb右下角有显示,计算机没显示,U盘显示在计算机的右下角,但无法打开
  17. AVFoundation 框架小结
  18. 使用qq 、微信和新浪微博三种方式登录demo
  19. 洗牌前夜:中国云主机市场全景观察
  20. 蓝以中老师《高等代数》第01章:代数学的经典课题,笔记

热门文章

  1. 数学建模之倾倒的啤酒杯
  2. 推荐使用Numba加速Python科学计算
  3. html 【一个简单的用户登录页面代码】
  4. JavaWeb实体类转为json对象
  5. 软件测试仓库管理信息系统,仓库管理系统测试报告
  6. 中国石油大学计算机专业调剂信息,中国石油大学(北京)地球科学学院2020级硕士研究生招生缺额信息发布公告...
  7. 计算机网络技术与实验清华大学,清华大学计算机网络实验指示书.doc
  8. 兄弟连Linux学习笔记
  9. E-prime实验设计常用技术
  10. MYSQL入门基础知识