对话MPEG创始人Leonardo Chiariglione: MPEG精神将在MPAI中延续
翻译/编辑:Alex
技术审校:李忠
Leonardo Chiariglione本人也审阅了采访的中、英文版本,特此感谢。
Leonardo Chiariglione
人物对话
#001#
Leonardo Chiariglione(照片由Leonardo Chiariglione本人提供)
作为MPEG的创始人,Leonardo Chiariglione曾将MP3、DVD和数字电视带进了千家万户。他近期出版了第一本书:The history of MPEG and how it made digital media happen, 这本书讲述了MPEG 32年的辉煌历史,以及它如何通过标准化方法改变了通信的本质。
在领导MPEG 32年之后,Leonardo Chiariglione去年宣布关闭MPEG,并创立了一个新的组织——MPAI(Moving Picture, Audio and Data Coding by Artificial Intelligence)。据他介绍,MPEG 的精神会在 MPAI 中得以延续。
最近Leonardo Chiariglione接受了LiveVideoStack的邮件采访,在采访中,我们和他一起讨论了新书 、MPEG 和 MPAI。下面是整理的采访稿。
LiveVideoStack:Chiariglione先生,非常感谢您接受采访,您的新书Even the stars die: The history of MPEG and how it made digital media happen 已于暑期出版,您能告诉大家您为什么会写这本书吗?
Even the stars die: The history of MPEG and how it made digital media happen
Leonardo Chiariglione:毫无疑问, MPEG是一个传奇故事——一个草根组织掀起了一场媒体数字化的革命。作为MPEG的创始人,并领导了这个组织32年,我认为我有责任不让这一伟大成就被世人遗忘,或者发展到更坏的地步——被毫无道德准则的人利用达到自己不可告人的目的。
LiveVideoStack:您能说一个大家应该读这本书的理由吗?
Leonardo Chiariglione:历史不会简单地重演,但历史演进的轨道却十分相似。世界肯定不是33年前的世界,技术也不再是33年前的技术。但人类所遵循的模式却惊人地一致。对于那些想要了解媒体数字化历程的读者,这本书是必读之物。同样,那些心有远大理想的人也能从MPEG独特的故事中汲取灵感。
LiveVideoStack: 您去年辞去了MPEG主席一职,并宣布关闭MPEG,但MPEG却并不同意您的说法,您和这个视频标准组织之间究竟发生了什么?
Leonardo Chiariglione:首先我们必须就某些词语的含义达成一致。1991年,当苏联解体时,生活在该政权下的人民和土地消失了吗?不,他们没有。他们变成了俄罗斯联邦、乌克兰、哈萨克斯坦等。MPEG的消失正如苏联一样,它已经被那些令人兴奋的组织名称所替代,如WG 1、WG 2等。
我在1988年所创立的组织已经不复存在,它已经被一批其他组织所替代。
如果你说:“MPEG不同意”,你应该告诉我你所指的MPEG是什么。
如果你问我:“您和这个视频标准组织之间究竟发生了什么?”我会说:正如一个犯罪团伙劫持了飞机一样,MPEG也被“劫持”了。这样的事情,在《三国演义》所记载的封建时代里随处可见,并依然在今天的ISO组织中延续。
如果你问我:“您和MPEG的人之间发生了什么?”我的答案是:除了“劫机者”,我和其他人绝对没有任何矛盾。几十年来,我同一起在MPEG中共事过的数千位同事保持着良好的关系。
LiveVideoStack: 对于MPEG,有什么令您感到后悔的事吗?或者一些您本来想做,但没有做成的事情?
Leonardo Chiariglione: 像MPEG这样的组织已经经历了数十年的磨砺,它本应该继续辉煌下去,未来有更多的数十年在等待着它。在第100次会议的庆祝活动中,我曾说过,如果100年后MPEG不复存在,那肯定是因为有人想要“杀死”它。没想到一语成谶。
LiveVideoStack: 既然您已经开始了您的新事业——MPAI, 那么您对MPAI有什么样的期待?
Leonardo Chiariglione: MPAI并不能称为新的事业。MPAI希望能在制定基于人工智能的数据编码标准上扮演重要角色,如同曾经的MPEG在基于数字化处理的媒体编码上所扮演的角色一样。这不仅仅是一个计划,最近MPAI已经发布了3个草案文件,正在征求社区意见,参见:
https://mpai.community/standards/mpai-mmc/draft-standard/,
https://mpai.community/standards/mpai-cui/draft-standard/ 和 https://mpai.community/governance。
前两个标准草案将于 9 月 30 日发布。在接下来的几个月中,将发布更多标准。
LiveVideoStack: MPAI中正在进行的标准有哪些?您能详细说一下吗?
Leonardo Chiariglione: 我来详细说说。计划今年10月发布的AI框架(MPAI-AIF)是基础标准,它是一个标准环境,其中可以执行由基础算子(被称为AI模块)构成的工作流。AI工作流和AI模块已经经过了安全、一致和性能方面的检查,可以直接从MPAI商店中下载(参见https://mpai.community/governance)。一个编码标准的实现,其性能是通过可靠性、健壮性、可复制性和公平性来评估。
另一个标准是上文提到的多模态对话(MPAI-MMC),计划9月份发布。MPAI-MMC的情感对话支持与由语音合成和人脸动画所模拟的机器进行视听对话;多模态问答支持对所显示对象请求信息。单向、双向和一对多语音翻译支持使用语音合成的会话翻译,保留说话人的语音特征。
LiveVideoStack: 第一个标准将在什么时间发布?您认为需要多长时间这些标准可以获得大范围的应用?
Leonardo Chiariglione:9月30日将很有可能发布两个标准:MPAI-MMC 和 MPAI-CUI。后者包含一个被称为“基于AI的公司业绩预测”的用例。通过该用例,用户可以在一个给定的预测范围内(如3或5年)评估某个公司的组织健康度、违约概率以及业务不可持续概率。
一些 MPAI 成员在标准发布后会立即实施。
LiveVideoStack: 您认为EVC和AV1的发展会削弱VVC的专利限制吗?
Leonardo Chiariglione: 我曾写过不少文章,介绍MPEG所推动的优秀技术是如何获取报酬的正确实践。但现状却不断恶化,这需要被重新审视。我不知道未来情况是否会有所改善。我唯一知道的是,只有12%的互联网视频使用HEVC。人人都知道是谁造成今天这种失败的局面。
LiveVideoStack: 基于AI的视频编码方法(端到端,多场景应用)会是未来趋势吗?在实现过程中最大的挑战是什么?(比如标准的缺失,硬件问题)
Leonardo Chiariglione: 毫无疑问,AI在未来视频编解码中肯定会发挥重要作用。但遗憾的是,决定使用哪种编码方法的下一阶段的研究,既不会基于技术,也不会是商业价值或者用户需求,而是基于支持过去视频编码标准的专利。
LiveVideoStack: 您认为基于AI的编解码器将很快超越传统编码器吗?还是两种编码器将共存很长时间?
Leonardo Chiariglione:传统的数据处理技术仍然会大显身手,但在很多领域,它已经走到了发展的尽头。而人工智能,才刚刚开始。
几天前,我发表了一篇文章(参见
https://blog.chiariglione.org/the-governance-of-the-mpai-ecosystem/)。
文中,我写道:“如果一台AI机器通过仔细训练后,可以发现某些特定的编码模式比其他模式更通用,那么它将很可能会比人类按照概率论机制所推导的编码模式取得更好的压缩率。” AI可以像人类那样根据经验解释新事物,因此机器积累经验的能力必然会随着处理和存储能力的增加而增加。然而,不要指望AI视频编码将在短期内超越传统视频编码。技术虽然发展很快,但是对过去技术的投资如此巨大,新技术的部署必然需要长久的时间。
激动人心的未来就在眼前。
LiveVideoStack: 在中国,您是否发现了MPAI的机会?
Leonardo Chiariglione: MPAI中有几位来自中国的成员,但是中国如此之大,所以我期待更多中国成员加入进来。
扫描图中二维码或点击阅读原文
了解大会更多信息
喜欢我们的内容就点个“在看”吧!
对话MPEG创始人Leonardo Chiariglione: MPEG精神将在MPAI中延续相关推荐
- 向MPEG创始人Leonardo Chiariglione提问
点击上方"LiveVideoStack"关注我们 大家好,LiveVideoStack新栏目"人物对话"目前正在筹备中.人物对话的第一期,我们邀请到了MPEG创 ...
- MPEG创始人、主席:MEPG商业模式已经破裂
随着苹果加入Google主导的AOM联盟,开源.免费的Codec AV1草案定稿进入倒计时,MPEG主导的HEVC正在受到空前的压力.MPEG创始人.主席Leonardo Chiariglione在其 ...
- 《罗永浩打脸罗永浩》、MPEG召集人辞职称MPEG将不再存在、Zoom免费用户将没有端到端加密|Decode the Week...
Decode the Week≠音视频技术周刊 01 罗永浩登GQ智族六月刊封面 对自己发出"打脸"拷问 图片来源:智族GQ六月刊封面 在智族GQ新一期"GQ不可能的 ...
- A16Z 合伙人对话Coinlist创始人:元宇宙的核心是所有权,Meta最终会过时
"可拥有元宇宙中物品的人只能是巨头公司,这是一个奇怪的想法,这基本上是说只有扎克伯格被允许拥有元宇宙,只有他可以拥有整个元宇宙,为什么我们每个人不能在元宇宙中都拥有自己的房间.自己的财产?因 ...
- 对话YouTube创始人陈士骏:创新向中国转移
对话YouTube创始人陈士骏:创新向中国转移 2011-11-14 09:55 | 7072次阅读 | 来源:21世纪网 [已有13条评论]发表评论 关键词:YouTube,陈士骏 | 作者:侯继勇 ...
- 【独家】对话Trinity创始人李一灵:智能经济的基石
点击上方 "蓝色字" 可关注我们! 记者:Clover 提到Trinity,大部分人首先想到的可能就是黑客帝国这部经典科幻片了.影片中Trinity的身份以及影片的内容想必大家也都 ...
- 王峰两小时闭门对话Polkadot创始人Gavin Wood实录,带你了解Web 3.0、跨链机制、程序设计及“一键发链”那些事...
这是「王峰十问」继本月初对话MakerDAO创始人Rune谈论DeFi之后,又一场与国际知名区块链项目的话题碰撞. 本文旨在传递更多市场信息,不构成任何投资建议. 文 | 王峰十问 出品 | 火星财经 ...
- 向爱康家园投稿:将“女排精神”发扬到工作中去
将"女排精神"发扬到工作中去 2016里约奥运会已经落幕,但是奥运的精彩瞬间却定格在每个人的心中,在这些精彩瞬间中,最为瞩目的当属中国女排的表现,时隔12年,中国女排再次夺冠,不仅 ...
- 第四范式联合创始人陈雨强:机器学习在工业应用中的新思考
很好很赞的工业应用思考,分享下 第四范式联合创始人陈雨强:机器学习在工业应用中的新思考
最新文章
- 关于卷积神经网络的思考:将CNN视作泛函拟合
- WPF中的触发器(Trigger)
- mysql游标书写_mysql中光标如何书写
- 【渝粤题库】陕西师范大学210001儿童心理学 作业(高起专、高起本)
- 华为软件研发面试题1
- 爬虫神器Requests: 让 HTTP 服务人类
- properties配置文件的加密
- jena 开发之 mysql数据导入_在Jena框架下基于MySQL数据库实现本体的存取操作
- AI 智能会议系统(36)---AI 书单
- xshell/putty 连接 linux 虚拟机 connection failed 的解决方案
- 雷赛控制卡总线方式的坑
- 普通硬盘和固态硬盘的区别?
- 博观而约取,厚积而薄发
- C#生成与识别条形码、二维码示例 zxing、 barcodelib生成条形码 code128B等 无白边 自动宽度
- 计算机留学美国ps,美国计算机专业ps范文
- Linux安装后的配置操作
- error: C1083: 无法打开包括文件: “QString”: No such error: ‘QDir‘ file not found
- change在c语言中的用法,change的过去式和用法例句意思及阅读
- 动态图 vs 静态图
- 左耳听风 第二十一周