过去,小编经常通过写信和打电话与不在一处的亲人朋友沟通交流。

现在的小编只要手握各种移动式便携设备,随时随地视频通话或观看直播就可以和异地亲人虽不见面但胜似见面。

我们感慨技术迭代发展的同时,也惊觉随着移动网络的快速进步,视频通信确实已经不声不响地占据了互联网流量市场的主体地位,这不连人们在日常生活中保持的通信习惯都被悄悄改变啦!

网络用图,出处不明

近日,小编了解到一家专攻视频通信的企业免费开放其研发的视频通信技术,目前已经将下载地址放入码云,并着手安排工程师帮助用户接入该项技术。

开放技术,有意思!先来了解下这家企业!

据小编了解,这家企业名为图鸭科技,由前掌赢科技首席科学家武俊敏于2016年8月创立。

团队成员主要来自上海交大和南京大学,拥有专利80余项,目前在上海和南京还配备两个研发中心。

除了做视频通信之外,还涉及到视频压缩和分析的相关技术研发,妥妥的一枚创业型技术公司!

初次见到图鸭科技CEO武俊敏,感觉和初创企业的特质很相似,年纪轻轻(妥妥的90后)且态度认真,最重要的是还有一股对技术、对行业的“霸气”。

说到技术上的霸气外漏,现于上海交大攻读博士学位的武俊敏,曾经作为前掌赢首席科学家,在即时通讯美颜算法的的研发过程中帮助掌赢融资1亿人民币。

在可圈可点的职业生涯中,作为simpleeye lab负责人,他又带领团队开发出三套算法。

值得提及的是,他研究的表情迁移比iPhone X 早三年;即时通讯美颜算法比美图早一年;图片压缩技术比Webp提升50%。

小编不觉感叹,90后CEO,四个字:技术有为!

聊天中,说到投身创业大军的初衷,武俊敏腼腆地笑了:“就在2016年7月,我去了美国,当时参加了CVPR 会议,我看到很多人,因为一个技术、一些基本的技术就融到了很多资金,我就联想到我自己,可以在技术上做到比他们更好,那为什么不去创业呢?”

抱着这个想法,回国后,武俊敏踏上了创业征程。

谈到将音视频技术研发作为创业项目的想法,武俊敏表示,自己在上一家公司主要参与的技术项目就是有关于音视频方面的(当时视频分析做的多一些),可以说在这个领域有一定的技术积累,所以创业也就顺理成章地选择了该领域中比较难的视频压缩。

“刚开始的时候我想做的是VR方面的通信,后来逐步想把VR通信转变为一个普通通信,现在来看在通信领域我们已经解决了两个问题,一个是压缩问题,另一个是传输问题。”武俊敏补充道。

作为国内第一家将视频和通信“并举”的公司,在言谈中小编除了感受到武俊敏对音视频技术的满满自信之外,还有对行业认知的“轻车熟路”。

如今的视频行业究竟如何?武俊敏也有自己的看法,或许对渴望投身于此的小伙伴们有些经验之谈的帮助。

他认为如今的视频分析行业其实可以分为两个部分,一个是纯的视频分析方面,另一个是与传统行业相结合的问题。说到纯的视频分析,目前的市场风口主要集中在三个领域,分别是人脸识别、自动驾驶和相机。

自动驾驶,无论从入市的企业量级以及目前的融资水平来看,有望成为万亿级的市场,这一点武俊敏表示毋庸多言,但他对相机应用的前景判断还是挺出人意料的。

他表示,这几年相机应用层出不穷。从美图秀秀到足迹,再到FaceU, 现在来看或许会有一些新的东西加入,例如3D交互,这个领域会迎来新高峰。

此外,因为视频分析没有办法成为一个独立行业,所以需要与传统行业做一些结合。这方面,武俊敏提到了近几年发展势头正盛的新零售。

“新零售、无人零售,也是视频分析大举进攻的一个行业。具体来说,视频分析技术会把店面中顾客浏览的轨迹以及停留的时间进行实时传输,做一个分析优化,进而判断不同的需求……这是视频分析给零售行业带来的一个新变化。”他补充道。

关于视频创业的问题,不少小伙伴或许很关心,对此武俊敏提到了三个关键词,分别是压缩、传输和分析。

具体来说压缩,就是让视频变的更小一点;传输,就是让一个视频如何更加流畅;分析的意思是让视频更加智能,做好这三方面才能更好的把握视频创业的成功,其中涉及到的技术创新,对创业者来说都是很艰苦的。

据图鸭科技内部介绍,早在去年8月份,视频类应用不断增多扩展,带来高带宽、高流量高并发的现象后,武俊敏就瞄准了这个市场。“这是一个充满暴利的市场,粗算下来可能会达到十倍的利润。我们要做的就是打破这个局面,帮助相关领域的企业打通通道、节省成本。”他说。

关于视频通信,我们需要了解什么?

目前,图鸭科技的视频通信VoIP技术,端对端延时已经可以控制在50~100ms,P2P穿透率达到70%,可以帮助企业极大的降低带宽成本,并能根据机型自动匹配X264与X265,进一步降低20%流量,实现无缝切换。

延时、穿透率、X264与X265?说了这么多,视频通信系统的基础架构到底由哪些部分组成?

一个视频通信的基础架构可能涉及到采集(音视频采集)、前处理(例如噪声处理、人脸识别等)、音视频编解码、流媒体协议、系统架构(如数据库、文件系统)、CDN、播放控制(如音视频同步)和交互技术等。

具体的传输过程一般涉及到三个步骤,分别是:

数据发送方采集数据,其中包括音频、视频以及文本等;

通过网络将压缩的数据传送到接收方;

数据接收方接收到数据后,解码得到多媒体数据进行显示和播放。

文字描述相对简单,但实质上这是一个非常复杂的过程。网络波动、视频丢包等问题的出现需要被及时处理,同时不同硬件的适配需要在也很短的时间内得到响应。

此外,在日常应用中,不同的业务对视频通信系统的技术要求也存在差异性。

例如视频会议中,需要双方或多方的视频通信过程实时进行,延时尽可能低,同时要保持通信过程流畅;视频监控系统则要求清晰度较高,有效保留画面中的重要细节。

这样看来构建高效稳定的视频通信系统,除了具备有效实时的原始数据之外,最重要的就是压缩与传输。

通常来说,在低延时业务中,对压缩速度的要求非常高。例如如果需要达到每秒20帧的帧率,就要求压缩每一帧的时间低于50毫秒,同时还要兼顾压缩性能。

据了解,目前主流的视频编码标准为H.264/AVC,目测可以获得不错的压缩性能和传输速度。下一代的视频编码标准是H.265/HEVC,虽然其码率相比H.264在同等编码质量的情况下可以节省高达50%,但由于专利问题和巨大的计算量,还没有得到广泛应用。

对此,武俊敏表示,关于视频压缩效率的优化,目前来看压缩算法并没有完全被使用,只用了20%-60%,最主要的原因在于我们的计算性能还是不够领先,但算法还有进一步优化的空间。

压缩是难点,传输更不容易!

传输方面,目前最常用的两种传输协议是传输控制协议TCP和用户数据包协议UDP。其中TCP是面向连接的可靠传输协议,但延时相对较大;UDP是无连接、不可靠的传输协议,延时相对较小。

“大家都知道,通信行业主要就是流畅和网络之间的矛盾。因为网络随时变动,不是丢包,就是包特别多的时候传不过来……要解决流量适应网络的问题,还要同时保证流量传送的信息要尽可能完整,是特别困难的。”武俊敏说。

在图鸭科技这次开源的视频通信技术中采用了UDP协议,减少了端对端延迟,并实时对传输数据进行网络丢包、网络速度和网络抖动的统计,再返给编码器,以此确保视频传输的稳定性。此外,还采用长期参考帧的模式,在网络丢包30%的情况下仍可保证视频流畅。

未来要实现流畅高质量的视频通信,武俊敏认为编码端还是需要根据实时的网络状态进行压缩率的调整,可以通过改变量化参数、改变分辨率或改变帧率等方法实现。对网络状态的实时感知,还需要网络传输模块进行统计监测并实时提供信息。

投身开源,图鸭科技背后的想法是什么?

据悉,图鸭科技在此次的开源中主要开放了服务器的源代码和客户端的网络模块代码,不开源的部分也将免费提供给用户使用。

面对开源,武俊敏坦率告诉小编,其实技术并没有没有国界,每个人都会很容易接触到。如果想通过提升技术壁垒来创造商业壁垒,这是一个短暂有效还比较困难的事儿。从商业角度来看,开源是一种趋势;从公益角度出发,更是值得提倡的。

“未来,我们会逐步升级整个系统,把项目做得越来越好,现在只是开源的第一步,如果后面做得特别好,我们会把其他部分开源出来,例如视频分析的技术开源。我们都认为,开源会让技术向前跨进一步,对后期分析或者其他业务有促进作用。视频覆盖程度越广,视频的智能化程度就会带来更多机会。我们就是要先把这个门槛儿较高的市场激活,开源带领我们先进门,后面才能搅活市场。”武俊敏说。

关于图鸭科技

早前,小编了解到其实图鸭科技已经完成天使轮千万级融资,由中兴合创领投,华院数据和拉尔夫创投跟投。谈到融资,武俊敏很低调,坦然表示这么大笔钱肯定要拿来在技术上做大量的优化与改进。

“一方面我们的压缩技术比别人更好,另一方面来我们通信技术也做起来了,这样制造了两个技术点的融合,全球就我们一家公司把通信和压缩放在一起,这点我特别兴奋也很自豪,要一直努力做下去。”

现在图鸭科技的客户群主要包括教育、视频通信芯片,还有一些机器人行业以及视频会议,未来例如视频游戏、在线教育、视频客服等也会广泛采用音视频分析技术。

谈到音视频分析技术的适配性和有效性,武俊敏为小编举了例子说明。

目前合作的一家在芯片领域的厂商,要把视频很流畅的传输到云端,之前用的RTSP,RTMP延时比较高,而图鸭科技的技术延时降低到100毫秒,并且比较流畅;另外在直播领域,之前用的是云通信,一个月的耗费是5万块钱人民币,现在采用压缩技术后,一个月变成5000块钱人民币,流畅性的利用率却是原来的10倍。

“对于未来,我们会做AR和VR;对于人才,我们会补充一些运营人才,高端人才还会是主流,因为招人的要求很高,所以宁可招的少一点,也要精英人才、复合型人才。”武俊敏强调。

武俊敏表示:未来会一直致力于研究视频压缩和分析方向的研究,Make video smaller and smarter,这就是我们的目标。

90后CEO率图鸭投身开源,视频通信也成“隐形”红海相关推荐

  1. 阿里90后程序员入选全球顶级开源社区技术委员会,网友:真大佬

    江山代有才人出,一代更比一代强.在互联网行业社区,有程序员贴出了一则消息,称阿里某90后程序员入选全球顶级开源社区技术监督委员会成员,可谓后生可畏:全球顶级开源社区CNCF技术监督委员会,第一次有国人 ...

  2. 90后都会选择的购车模式“网上购车平台一成首付”

    90后都会选择的购车模式"网上购车平台一成首付" 相知,相识,相恋. 这是我与男朋友的爱情故事,在即将走入婚姻的殿堂开启小家生活,可是选车却成了我们的头等大事, 工作时间不长,所以 ...

  3. 阿里90后科学家研发,达摩院开源新一代AI算法模型

    整理 | 一一 出品 | AI科技大本营(ID:rgznai100) AI科技大本营7月5日消息,阿里达摩院宣布开源新一代人机对话模型ESIM.该算法模型提出两年多,已被200多篇论文引用,更曾在国际 ...

  4. 阿里 90 后科学家研发,达摩院开源新一代 AI 算法模型

    整理 | 一一 出品 | AI科技大本营(ID:rgznai100) 7月5日,阿里达摩院宣布开源新一代人机对话模型ESIM.该算法模型提出两年多,已被200多篇论文引用,更曾在国际顶级对话系统评测大 ...

  5. 估值数亿的A轮公司倒闭了,90后CEO还患上肿瘤:创业(失败)到底是怎样的体验...

    作者:原超能界创始人兼CEO陈卓权 数据猿官网 | www.datayuan.cn 今日头条丨一点资讯丨腾讯丨搜狐丨网易丨凤凰丨阿里UC大鱼丨新浪微博丨新浪看点丨百度百家丨博客中国丨趣头条丨腾讯云·云 ...

  6. 第一批 90 后30 岁了!那些 30 岁前就成博导的人都怎样了...

    前段日子,一个名为 #第一批 90 后 30 岁倒计时#的话题被顶上了微博热搜,无数网友参与了讨论. 图片来源:微博截图 转眼 2019 年 12 月已快过半,笔者掐指一算,第一批 90 距离 30 ...

  7. 牛逼了!90后小哥,只用了5年时间就成为了Python技术大牛

    点击"开发者技术前线",选择"星标????" 在看|星标|留言,  真爱 今天给大家推荐一位Python技术大牛,90后,自学Python,第一份工作就拿到高薪 ...

  8. 思一独角兽游戏 | 综艺高能玩家:看中医刘昊然、区块链圈90后CEO如何玩转高智商棋牌游戏 | SIU

    关注思一科技独角兽,了解区块链.投资.品牌.市场的一手干货! 最近,每每我问朋友们最近在看什么综艺? 三个人里肯定会有一个人说<明星大侦探>,可以看出观众们对烧脑悬疑类的综艺越来越感冒了 ...

  9. 90后,第一批接棒白酒的“年轻人”

    [潮汐商业评论/原创] 又到了每月的公司团建,"团建必喝酒"似乎已经成为了大家的共识. 但在酒水的选择上,有红的.啤的.洋的,还有低度果酒,唯独不见听谁说聚会喝白的.当Jason询 ...

最新文章

  1. 【蓝桥杯】【入门题】【算法提高VIP】1481:剪刀石头布
  2. swift处理网络返回数据(封装)
  3. ITK:图像的区域最大值
  4. CVPR 2022 | 针对目标检测的重点与全局知识蒸馏(FGD)
  5. Java中的基本类型和引用类型(未完)
  6. [二分图]luogu 1640 连续攻击游戏
  7. “关起门来搞开源,做不了开源世界的Leader”
  8. [HTML5和Flash视频播放器]Video.js 学习笔记(一 ) HLS库:videojs-contrib-hls
  9. cmd查看mysql版本_mysql安装-必会
  10. linux 编辑 iso文件格式,这两款实用的光盘映像文件制作编辑软件让你处理ISO文件易如反掌...
  11. 如何查询期刊论文影响力——JCR
  12. 罗胖的文字墙是如何制作的?
  13. 多无线路由器AP使用同一个SSID号无缝连接漫游
  14. 男女朋友关系是这么确定的。。。【其实相爱很简单】
  15. C#理论 —— 文件操作、委托和事件
  16. Java/计算银行利率
  17. lvgl使用旋转编码器做为外部输入设备
  18. 【2018-11-30】中证500指数的估值详情
  19. 百度推广——搜索营销新视角(百度官方出品,俞敏洪、吴晓波、徐雷力荐!)
  20. win10邮件配置qq邮箱和outlook邮箱

热门文章

  1. 弘辽科技:拼多多里有top是什么意思?如何提高排名?
  2. E900V21C安装Linux系统(Armbian)
  3. python卡通滤镜_纯Python综合图像处理小工具(3)10种滤镜算法
  4. 【Lv1-Lesson004】Imperative Sentences
  5. SSM整合APP项目
  6. 【WPF】用100行C#代码实现扫雷
  7. win10 安装配置 MySQL
  8. 51单片机学习笔记——SH88F4051A
  9. unity3d FPS 枪的后座力
  10. 如果心酸就会心动也应行动