随着网络基础建设的发展和资费的下降,在这个内容消费升级的时代,文字、图片无法满足人们对视觉的需求,因此视频直播应运而生。承载了实时性Real-Time和交互性的直播云服务是直播覆盖各行各业的新动力。网易云信推出一系列文章,对视频直播技术进行深入讲解,本篇文章将向大家介绍iOS端的推流技术。

相关阅读推荐
《短视频技术详解:Android端的短视频开发技术》

《视频直播:Windows中各类画面源的截取和合成方法总结》

《视频直播关键技术:流畅、拥塞和延时追赶》

直播架构
想必了解过直播的人都清楚直播主要分为3部分:推流->流媒体服务器->拉流。

而我们今天需要讲的就是推流这部分,它主要包括音视频采集,音视频前处理,音视频编码,推流和传输4个方面。但是由于网络的复杂性和大数据的统计,推流还需要有全局负载均衡调度GSLB(Global Server Load Balance),以及实时的统计数据上报服务器,包括提供频道管理给用户运营,因此推流SDK需要接入GSLB中心调度,统计服务器,心跳服务器,用于推流分配到网络最好的节点,有大数据的统计和分析。

下图涵盖了直播相关的所有服务,红色小标的线条代表指令流向,绿色小标的线条代表数据流向。

直播技术点

音视频采集
采集是所有环节中的第一环,我们使用的系统原生框架AVFoundation采集数据。通过iPhone摄像头(AVCaptureSession)采集视频数据,通过麦克风(AudioUnit)采集音频数据。目前视频的采集源主要来自摄像头采集、屏幕录制(ReplayKit)、从视频文件读取推流。

音视频都支持参数配置。音频可以设置采样率、声道数、帧大小、音频码率、是否使用外部采集、是否使用外部音频前处理;视频可以设置帧率、码率、分辨率、前后摄像头、摄像头采集方向、视频端显示比例、是否开启摄像头闪光灯、是否打开摄像头响应变焦、是否镜像前置摄像头预览、是否镜像前置摄像头编码、是否打开滤镜功能、滤镜类型、是否打开水印支持、是否打开QoS功能、是否输出RGB数据、是否使用外部视频采集。

音视频处理
前处理模块也是主观影响主播观看效果最主要的环节。目前iOS端比较知名的是GPUImage,提供了丰富的预处理效果,我们也在此基础上进行了封装开发。视频前处理包含滤镜、美颜、水印、涂鸦等功能,同时在人脸识别和特效方面接入了第三方厂商FaceU。SDK内置4款滤镜黑白、自然、粉嫩、怀旧;支持16:9裁剪;支持磨皮和美白(高斯模糊加边缘检测);支持静态水印,动态水印,涂鸦等功能。音频前处理则包括回声抑制、啸叫、增益控制等。音视频都支持外部前处理。

音视频编码
编码最主要的两个难点是:

1 处理硬件兼容性问题

2 在高FPS、低bitrate和音质画质之间找个一个平衡点

由于iOS端硬件兼容性比较好,因此可以采用硬编。SDK目前支持软件编码openH264,硬件编码VideoToolbox。而音频支持软件编码FDK-AAC和硬件编码AudioToolbox。

视频编码的核心思想就是去除冗余信息:

空间冗余:图像相邻像素之间有较强的相关性。

时间冗余:视频序列的相邻图像之间内容相似。

编码冗余:不同像素值出现的概率不同。

视觉冗余:人的视觉系统对某些细节不敏感。

音视频发送
推流SDK使用的流媒体协议是RTMP(RealTime Messaging Protocol)。而音视频发送最困难的就是针对网络的带宽评估。由于从直播端到RTMP服务器的网络情况复杂,尤其是在3G和带宽较差的Wifi环境下,网络丢包、抖动和延迟经常发生,导致直播推流不畅。RTMP基于TCP进行传输,TCP自身实现了网络拥塞下的处理,内部的机制较为复杂,而且对开发者不可见,开发者无法根据TCP协议的信息判断当时的网络情况,导致发送码率大于实际网络带宽,造成比较严重的网络拥塞。因此我们自研开发了一款实时根据网络变化的QoS算法,用于实时调节码率、帧率、分辨率,同时将数据实时上报统计平台。

模块设计&线程模型
模块设计
鉴于推流的主流程分为上述描述的4个部分:音视频采集、音视频前处理、音视频编码、音视频发送。因此将推流SDK进行模块划分为LSMediacapture层(对外API+服务器交互)、视频融合模块(视频采集+视频前处理)、音频融合模块(音频采集+音频前处理)、基础服务模块、音视频编码模块、网络发送模块。

线程模型
推流SDK总共含有10个线程。视频包含AVCaptureSession的原始采集线程、前处理线程、硬件编码线程、数据流向定义的采集线程、编码线程、发送线程。音频包含AudioUnit包含的原始采集线程、数据流向定义的采集线程、编码线程、发送线程。在数据流向定义的采集线程、编码线程、发送线程之间会创建2个bufferQueue,用于缓存音视频数据。采集编码队列可以有效的控制编码码率,编码发送队列可以有效自适应网络推流。

QoS&跳帧
下图是直播的主要流程,用户初始化SDK,创建线程,开始直播,音视频数据采集,编码,发送。在发送线程下,音视频数据发送,QoS开启,根据网络实时评估带宽,调整帧率,码率控制编码器参数,同时触发跳帧,调整分辨率控制采集分辨率参数。用户停止直播,反初始化SDK,销毁线程。QoS&跳帧可以有效的解决用户在网络不好的情况下,直播卡顿的问题。在不同的码率和分辨率情况下,都能够做到让用户流畅地观看视频直播。

以上就是iOS端推流技术的详细讲解。

另外,想要关于视频直播技术的文章,可以移步网易云信博客。

视频直播技术之iOS端推流 1相关推荐

  1. 视频直播技术之iOS端推流

    随着网络基础建设的发展和资费的下降,在这个内容消费升级的时代,文字.图片无法满足人们对视觉的需求,因此视频直播应运而生.承载了实时性Real-Time和交互性的直播云服务是直播覆盖各行各业的新动力.网 ...

  2. 视频直播技术详解之推流和传输

    声明:本文为CSDN原创投稿文章,未经许可,禁止任何形式的转载. 作者:七牛云 责编:钱曙光,关注架构和算法领域,寻求报道或者投稿请发邮件qianshg@csdn.net,另有「CSDN 高级架构师群 ...

  3. 视频直播技术:最大限度保障流畅性和清晰度

    直播和互动直播在2017年引起了人们的极大关注,应运而生的各种直播类APP多如牛毛.随着互动直播的逐渐兴起,交互成为直播APP的强需求.然而,实际网络中的丢包.延迟.抖动等问题仍然严重影响了直播的效果 ...

  4. iOS 视频直播技术

    iOS 视频直播技术 直播难:直播中运用到的技术难点非常之多,视频/音频处理,图形处理,视频/音频压缩,CDN分发,即时通讯等技术,每一个技术都够你学几年的. 直播易:市场已经有很多成熟的案例了.最常 ...

  5. 移动端实时音视频直播技术详解(一):开篇

    移动端实时音视频直播技术详解(一):开篇 1.引言 随着互联网用户消费内容和交互方式的升级,支撑这些内容和交互方式的基础设施也正在悄悄发生变革.手机设备拍摄视频能力和网络的升级催生了大家对视频直播领域 ...

  6. 《视频直播技术详解》之二:编码和封装、推流和传输

    视频编码是本系列一个重要的部分,如果把整个流媒体比喻成一个物流系统,那么编解码就是其中配货和装货的过程,这个过程非常重要,它的速度和压缩比对物流系统的意义非常大,影响物流系统的整体速度和成本.同样,对 ...

  7. 【音视频第6天】基础知识-移动端实时音视频直播技术详解和开源工程WebRTC的技术原理和使用浅析

    本文是系列文章中的第1篇,本系列文章的大纲如下: <移动端实时音视频直播技术详解(一):开篇> <移动端实时音视频直播技术详解(二):采集> <移动端实时音视频直播技术详 ...

  8. 视频直播技术详解(2)采集

    原文 http://mp.weixin.qq.com/s?__biz=MjM5NzAwNDI4Mg==&mid=2652191198&idx=1&sn=6d20bc90d19d ...

  9. 视频直播技术详解(0)开篇

    (原标题:<视频直播技术详解>系列之一:开篇) 文|何李石 随着互联网用户消费内容和交互方式的升级,支撑这些内容和交互方式的基础设施也正在悄悄发生变革.手机设备拍摄视频能力和网络的升级催生 ...

最新文章

  1. alert 回调_element之Alert 警告
  2. doc2vec介绍和实践
  3. [原]OpenCV2.2无法打开摄像头或读取视频的解决方法
  4. 使用应用程序(Java/Python)访问MaxCompute Lightning进行数据开发
  5. ZeroMq的研究和使用
  6. Nginx默认虚拟主机、 Nginx用户认证、Nginx域名重定向、访问日志·····
  7. cimiss数据_CIMISS数据下载小助手
  8. 在Windows下运行UNIX程序
  9. C语言malloc函数
  10. 计算机语言中daly什么意思,Daly.
  11. leetcode 812. Largest Triangle Area(python)
  12. 手机访问网站获取外网IP
  13. Linux启用显卡opengl,如何使你的Nvidia显卡支持OpenGL?
  14. JavaSE:网络编程
  15. 放回c41_数学排列组合C41C43怎么算
  16. 教师资格证网站 在mac上无法打开- 看我就够了(踏过太多坑了)
  17. HOW2J.CN--JAVA学习笔记
  18. B类直播产品化建设浅谈
  19. C 语言里的 %2d的意思
  20. 12. GeoTrellis数据输出篇之输出COG到本地文件系统

热门文章

  1. Kanzi for Android Demo
  2. 为什么要用VR全景?5个答案告诉你
  3. 在美国成年人群体中,语音助手Siri已经成了第二大移动搜索引擎
  4. Navicat premium 导入大数据的Excel文件失败的方法
  5. [效率提升]webstorm配置Prettier
  6. 八十二烷基笼状聚倍半硅氧烷poss无色透明黏稠液体|提高颜料分散性
  7. Syntactic sugar Syntactic salt
  8. 石油大学个人训练赛(一)补题----问题 A: 斗地主
  9. 思科警告:旗下某些产品可能存在无法修补的WannaCrypt漏洞
  10. 桌面word文档变成了html,我电脑上的Word文档都变成网页形式了怎么回事?