LiveVideoStack邮件采访了北京美摄网络科技有限公司CTO 见良,作为十多年的多媒体老兵,他认为学习多媒体技术主要通过实践,必须在实际的项目中锻炼自己。对于未来,机器学习结合计算机图形学可以实现智能剪辑,制作出更有趣的视频。

文 / 见良

策划 / LiveVideoStack

LiveVideoStack:见良你好,能否向LiveVideoStack的读者介绍下自己,以及目前主要的工作以及关注的技术方向?

见良:目前主要是移动端高质量的视音频技术解决方案,包括视音频的采集,编辑,特效合成,为各种视音频应用提供底层技术支持。目前主要关注视音频处理架构设计,算法设计,视音频AI处理。

LiveVideoStack:15年来一直在从事视频处理相关的研发,没有考虑过更换个技术方向吗?如何保持对技术的好奇心?

见良:视音频技术总是在不断发展的,以前用传统计算机图形学、图像处理算法难以解决的问题,现在通过卷积神经网络能解决的相当不错。同时市场用户不断提出新的要求,不再满足一般低质量、五毛特效,要求效果越来越真实,更炫酷,更简便。厂商要求技术也越来越高,更高的清晰度,更小的资源,更高的效率。

LiveVideoStack:一种观点认为,现在做多媒体开发比十年前容易很多,因为有许多强大的开源框架、工具(如WebRTC、FFmpeg、x264),您怎么看这种观点?

见良:确实是强大的开源框架能助力开发,但是视音频处理要求更高,所以开源的项目要谨慎选择,它们普适性很强,为了追求更好效果、更高的质量,我们有自有的高效率框架,在需要的地方合理的去使用这些开源技术。

LiveVideoStack:搞多媒体开发需要学习大量的基础知识,而且需要在实际工作中摸爬滚打。对于学习多媒体开发,您有哪些建议?能否推荐一些多媒体开发相关的学习资料或书籍。

见良:学习多媒体主要靠实践,比如可以阅读一些开源项目的源代码(比如FFmpeg,GStreamer等)并使用其做一些简单的项目,如果参与到其开发中那就更好了。此外再接触一些商业的多媒体框架,比如DirectShow, MediaFoudation, AVFoundation等等,这样可以比较快速地了解多媒体的基本概念以及基本处理流程。

LiveVideoStack:您认为CTO的核心职责包括哪些?是否需要写(或review)代码呢?

见良:CTO主要确定公司的技术方向,构建公司的技术体系,为公司的战略提供强有力的技术支撑。CTO在每个阶段的工作重点是不一样的,是有必要写代码的。

LiveVideoStack:您主导开发了敦煌视觉效果合成系统,能否简单介绍下这个产品。在研发的过程中,有哪些难忘的故事?

见良:敦煌视觉效果合成系统是国内第一款后期合成包装系统,这个产品主要面向电影,电视剧广告的后期合成包装,它涉及颜色校正,抠像,遮罩,跟踪,三维摄像机反求等等非常复杂的算法,它的定位是顶级的视音频合成系统,也是获得国家科技进步一等奖项目的技术核心部分。最难忘的是当时我们做算法就封闭开发了一年多,算法效果出来后我们请了国内顶尖的做后期合成的专业人士来帮我们看这些效果是否可以用于高端视音频制作了,经过专家三天的详细测评对比给了相当满意的结果,这样我们有坚定的信念去软件架构的搭建和应用软件的开发了

LiveVideoStack:能否介绍下美摄SDK这个产品,他有什么技术特点?

见良:兼容性,高效率,高质量,可扩展性。

LiveVideoStack:音视频领域还有哪些学界、工业界公认的难点?未来几年,哪些难点有可能取得突破?

见良:智能的剪辑合成是困难的,未来通过机器学习的技术结合传统计算机图形学图像处理能有效降低视频制作的难度,同时提供有趣的视频玩法出来。

见良:学习多媒体主要靠实践相关推荐

  1. python爬取知乎话题广场_学习python爬虫---爬虫实践:爬取B站排行榜2(爬取全部分类排行榜、利用pygal库作图)...

    前面我们爬取了B站上全站的排行榜,详细见:魏勇:学习python爬虫---爬虫实践:爬取B站排行榜​zhuanlan.zhihu.com 一.爬取全部分类排行榜 我们观察一下B站排行榜,那里还有番剧排 ...

  2. python神经网络原理pdf_《深度学习原理与 TensorFlow实践》高清完整PDF版 下载

    1.封面介绍 2.出版时间 2019年7月 3.推荐理由 本书介绍了深度学习原理与TensorFlow实践.着重讲述了当前学术界和工业界的深度学习核心知识:机器学习概论.神经网络.深度学习.着重讲述了 ...

  3. 深度学习原理与TensorFlow实践

    深度学习原理与TensorFlow实践 王琛,胡振邦,高杰 著 ISBN:9787121312984 包装:平装 开本:16开 用纸:胶版纸 正文语种:中文 出版社:电子工业出版社 出版时间:2017 ...

  4. 2018~2019-11 20165107 网络对抗技术期末免考 Exp10 Final Powershell学习应用与渗透实践...

    20165107 网络对抗技术免考 Exp10 Final  Powershell学习应用与渗透实践 目录 1.Powershell入门相关知识 Powershell简介 Powershell命令 P ...

  5. MapServer Tutorial——MapServer7.2.1教程学习——第一节用例实践:Example1.5 Adding a raster layer...

    MapServer Tutorial--MapServer7.2.1教程学习--第一节用例实践:Example1.5 Adding a  raster layer 一.前言 MapServer不仅支持 ...

  6. Docker学习六:综合实践

    前言 本次学习来自于datawhale组队学习: 教程地址为: https://github.com/datawhalechina/team-learning-program/tree/master/ ...

  7. 迷宫_随机实验_边做边学深度强化学习:PyTorch程序设计实践(1)

    迷宫_随机实验_边做边学深度强化学习:PyTorch程序设计实践 0.相关文章 1.导入所使用的包 2. 定义迷宫 3.定义迷宫动作 4.策略参数θ转换为行动策略π 5.定义随机移动函数 6.定义使智 ...

  8. Datawhale组队学习-金融时序数据挖掘实践-Task01数据探索与分析

    Datawhale组队学习-金融时序数据挖掘实践-Task01数据探索与分析   在二手车交易价格预测之后,本菜鸟又加入了金融时序数据挖掘实践的学习.两个项目都是结构化数据,都着重于对数据本身的探索. ...

  9. TensorFlow深度学习-龙曲良-学习笔记1

    TensorFlow深度学习-龙曲良-学习笔记 1. 经典的深度学习网络规模 AlexNet(8 层) VGG16(16 层) GoogLeNet(22 层) ResNet50(50 层) Dense ...

最新文章

  1. IntelliJ IDEA 2020.2.4款 神级超级牛逼插件推荐(自用,真的超级牛逼)
  2. pdfbox 按章节读取_2020年知到设施园艺学第十单元章节测试答案
  3. 【Qt】Qt6调用Visual Studio2019生成的动态库详解
  4. 飞畅科技-国内老牌工业以太网交换机品牌
  5. stm32f407 tim4 复用_波分复用对比,CWDM、DWDM、CCWDM有何不同?
  6. 微信开源组件WCDB漫谈及Demo
  7. linux 压缩权限,linux的基本操作(归档压缩,用户、权限管理,远程服务器构建和vi编辑器)...
  8. 微软发布企业安全进度报告 云应用安全服务即将面世
  9. bs架构多用户访问_Spark架构
  10. 台达plc自由口通讯_自由口通讯问题无法接收数据
  11. pve万兆网卡驱动_网卡的正确选择,避开小白踩坑
  12. stm32 jlink Unexceped core id found 0x00000000,excepted 0X3BA00477,MASK 0XFFFFFFFF
  13. 在终端输入“python”或者”pip“时出现python’不是内部或外部命令,也不是可运行的程序 或批处理文件
  14. python首字母大写
  15. 常用的企业邮箱有哪些?
  16. 【嵌入式操作系统-2】Cortex-M7处理器编程者模型
  17. git fatal: schannel: next InitializeSecurityContext failed: SEC E CERT EXPIRED (0x80090328)
  18. 【Opencv】Python+openCV实现全景图拼接(左右两张图片拼接成一张全景图)
  19. Quartus II建立新工程流程,Quartus如何建立工程?
  20. 2021年最强软件测试工程师Linux面试题及答案

热门文章

  1. 修改Linux的基本配置(如主机名、ip等)
  2. build.xml引用其它文件的任务
  3. 【开发者的精进】 数据驱动下的程序设计
  4. GO模仿python –m SimpleHTTPServer 8080
  5. 果断收藏!六大主流大数据采集平台架构分析
  6. 《挖掘管理价值:企业软件项目管理实战》一2.4 软件设计过程
  7. 农历控件源码(C#)
  8. 虚拟打印的实现-EMF转换成BMP
  9. CodeForces - 1368F Lamps on a Circle(交互+贪心)
  10. CodeForces - 1350E Orac and Game of Life(bfs)