前言

Dale(1969)的“经验之塔”指出人们获取信息70%以上是通过视觉途径,在互联网时代也不例外。在当今图片音视频服务等已成为一个互联网应用中占比很大的部分,对图片和音视频等数据的处理能力也相应变成企业和开发者的一项基本技能。

腾讯云存储团队历经数年,精心打磨了一款专注于数据处理的一站式智能平台——数据万象(Cloud Infinite,CI)。本文将以宏观视角,从产品历史、产品能力矩阵、技术架构、 应用场景等方面带大家了解数据万象这款云端处理利器,揭秘日均百亿张图片背后的技术演进之路。

背景故事

2004年QQ空间相册诞生,经历了长期的发展过程,已经深深被用户喜爱,成为大家记忆美好时光和分享快乐的平台。

作为QQ空间乃至腾讯最基础的服务之一,图片处理服务覆盖腾讯各个业务的方方面面。从图片的裁剪、缩放、水印,到压缩、审核、智能识别,伴随着腾讯产品体系的不断完善以及数据量的海量增长,处理服务也经历了一次次的磨炼与升级。

进入云计算时代后,脱胎于QQ空间相册处理服务的数据万象走上了腾讯云公有云的舞台,将QQ空间相册积累的近二十年图片运作经验开放给开发者。2014年,数据万象的前身——万象优图正式成立。起初产品功能以图片处理为主,随后逐渐增加音视频处理、文档处理、AI识别等功能。作为对象存储COS的原生数据处理工具,数据万象主打“智能存储”,帮助客户实现存量数据的批量处理及增量数据的自动化加工。随着产品的发展与升级,数据万象当前日处理图片量已达千亿规模,服务存储量达数百PB。在公司内部,腾讯视频、腾讯新闻、QQ音乐等产品均使用数据万象进行图片及音视频处理;在公司外,数据万象服务了拼多多、小红书、大众点评等各行业客户,为企业降低存储及流量成本、提升内容生产效率及用户提体验。

那么,这款在背后默默为各“大牌”保驾护航的产品是怎样的呢?数据万象的档案就此展开。

智能存储

数据万象(Cloud Infinite,CI) 是专注于数据处理的一站式智能平台,提供图片处理、媒体处理、 内容审核、内容 AI 识别、文档服务等全品类多媒体数据的处理能力。与对象存储 COS 深度集成,通过处理能力下沉到存储,帮助 COS 做智能化升级,提供开箱即用的数据处理及 AI 智能化处理能力,降低用户使用成本, 加速数据流转,提升用户体验,帮助用户挖掘数据价值,提升生产力。

在使用上,数据万象提供同步和异步的处理方式,为用户提供数据持久化处理的选择,用户可在上传时,下载时或者已存储在云上的数据进行处理,满足用户多种场景维度的需求。如果说COS是万物皆可存,那么CI就是万物皆可处理了。

|  目前都支持了哪些能力?

通过能力矩阵,各位读者也可看出相比当年的QQ相册,数据万象也增加了很多功能,这些能力当然也不是一蹴而就的。接下来的时间线,见证了数据万象如何成为处理工具百宝箱。

|  发展历史

2014:数据万象的前身——万象优图产品正式成立,开始在内外部提供云上图片处理服务。

2015 - 2017:逐步集成内容审核、AI识别、文档处理、音视频处理能力,全面升级为音视图文全品类数据处理产品,赋能对象存储,极大提升了用户的使用体验。

2018:万象优图更名为数据万象,寓意包揽云上万象、打造一站式数据处理能力。

2019 - 2020:全面升级内容审核服务,提升能力矩阵;推出云上工作流能力,提出全新存储+概念---数据存储即处理。帮助用户实现数据-存储-处理-分发全流程,一站式解决用户业务处理场景。

2021:行业首发avif图片压缩能力,助力客户优化存储及分发成本;媒体服务进入高速发展阶段,持续推出265编码、分片转码、极速高清、关键帧识别、色彩增强等众多能力;内容审核持续深耕,支持审核文档、网页数据;进军海外业务,图片处理全面上线腾讯云国际站。

2022:“智能工具箱”发布,提升用户体验与易用性;内容审核与时俱进,推出直播审核能力;产品体验持续打磨推陈出新,从控制台、SDK、API等全方面提升用户爽感。

|  技术架构

1、业务方可通过控制台、 API、SDK等多种方式接入数据万象, 同时支持COS源和第三方源。

2、根据传入的请求调用不同的处理模块进行数据处理。同时会进行监控数据等统计上报,方便进行监控告警。通过工作流模块支持批量处理, 根据业务规范,指定模板,自动批量处理, 处理完毕后根据配置进行回调业务方。其中各个内部服务间调用时, 零外网流量。对业务方来说成本更低。

|  应用场景

当前已有众多行业客户接入使用万象,各行业的使用也不尽相同:

有了强大的能力支撑,数据万象得以服务众多的行业及场景,帮助客户实现成本优化、协作效率提升、内容生产及版权保护等核心需要。主要场景如下:

  • 成本优化

    通过使用图片、视频压缩能力降低存储及流量成本、提升终端体验

  • 版权保护

    借助明文水印、盲水印等能力有效保护图片资源版权,守护企业、用户的无形资产

  • 内容生产

    提供丰富的内容生产能力,如智能封面、标签识别、海报生成等,助力客户输出爆棚

  • 风险规避

    针对存量或增量数据均可进行敏感内容审核,规避舆论或运营风险

客户案例

案例详情 --小红书

  • 使用数据万象的图片基础处理,可做到一份原图,多尺寸展示,满足客户多种业务场景下的图片需求;

  • 使用数据万象的图片格式转换能力,在图片保证质量的前提下,有效的降低压缩图片的大小;

  • 使用数据万象的盲水印功能,将水印图以不可见的形式添加到原图信息中,保障了客户对图片的所有权;

  • 使用数据万象的异常图片检测功能, 帮客户识别出夹杂在正常图片视频中的黑产文件, 有效减少了被盗刷的风险;

案例优势&客户效益

  • 效率最佳: 图片下载自动触发,减少了频繁的人工处理流程。

  • 性能保障: 减少了图片存储空间和访问流量的50%以上,同时提升了客户访问速度。

  • 安全保障: 解决了盗图维权,流量盗刷等问题,保障了平台的安全性。

  • 节约成本: 多种功能保证了在保质保量的情况,有效降低客户成本30%以上。

结语

数据万象持续丰富数据处理的相关能力,为广大客户及开发者带来更加优质、先进的使用体验,打造智能存储生态。未来我们会推出【数据万象带你玩转视图处理】的系列文章,从后台技术、产品优势、算法能力等多个方面详细介绍数据万象背后的丰富数据处理能力,诸位看官敬请期待!

数据万象技术演进之路相关推荐

  1. clickhouse hbase性能对比_QQ音乐PB级ClickHouse实时数据平台架构演进之路

    OLAP(On-Line Analytical Processing),是数据仓库系统的主要应用形式,帮助分析人员多角度分析数据,挖掘数据价值.本文基于QQ音乐海量大数据实时分析场景,通过QQ音乐与腾 ...

  2. 消息推送技术干货:美团实时消息推送服务的技术演进之路

    本文由美团技术团队分享,作者"健午.佳猛.陆凯.冯江",原题"美团终端消息投递服务Pike的演进之路",有修订. 1.引言 传统意义上来说,实时消息推送通常都是 ...

  3. 中国大地保险的大数据应用架构演进之路

    2019年9月20日,中国大地保险信息科技部数据平台处处长助理张磊先生,应邀出席大数据分析技术及解决方案供应商 Kyligence 主办的首届金融科技沙龙,并为大家做了题为<中国大地保险的大数据 ...

  4. QQ音乐PB级ClickHouse实时数据平台架构演进之路

    导语 | OLAP(On-Line Analytical Processing),是数据仓库系统的主要应用形式,帮助分析人员多角度分析数据,挖掘数据价值.本文基于QQ音乐海量大数据实时分析场景,通过Q ...

  5. Hadoop YARN 在快手的应用实践与技术演进之路

    本文是房孝敬老师主题为"yarn在快手应用实践与技术演进之路"的分享整理,内容包含yarn系统在快手的应用实践,遇到的问题以及相应的技术演进过程. 讲师介绍:房孝敬,快手大数据架构 ...

  6. 干货 | 携程技术演进之路

    作者简介 李小林,携程技术副总裁,平台研发中心负责人.从事IT互联网技术研发工作二十多年,目前负责携程基础设施平台.本文来自李小林在"2018携程技术峰会"上的分享. 作为互联网O ...

  7. YARN 在快手的应用实践与技术演进之路

    YARN 在快手的应用实践与技术演进之路 过往记忆大数据 今天 编者荐语: 本文来自8月24日的云+社区技术沙龙"大数据技术实践与应用",议题来自房孝敬老师主题为"yar ...

  8. 从编解码算法到全链路RTC架构,揭秘淘系直播技术演进之路

    从2016年直播元年至今,纯粹的直播已经逐渐失去竞争力,越来越多形式创新映入眼帘,而众多企业开始走向内容垂直化--秀场.游戏.电商.广电等内容特点深度结合.伴随2020年疫情爆发,电商为人们日常生活提 ...

  9. 云原生浪潮下自如的技术演进之路

    董浩--自如技术专家,主导了自如无线网关和Devops体系从0到1的演进工作,现在负责自如私有云体系的搭建. ▼ 自如是一家提供高品质居住产品和生活服务的科技公司,经过十多年的发展,涵盖了租住,服务, ...

最新文章

  1. 【怎样写代码】参数化类型 -- 泛型(三):泛型之类型参数
  2. 【译】TCP Implementation in Linux
  3. android+notepad教程,Android平台应用开发实例:Notepad
  4. vuex模块化 怎么引用state_[Vuex系列] - 细说state的几种用法
  5. layui如何获取父节点的父节点_layui框架中layer父子页面交互的方法分析
  6. 视频 + PPT 下载 | 挣脱流量束缚,社交电商的未来在哪里?
  7. 菜鸟入门Java语言学习六大要点
  8. [蓝桥杯2015初赛]生命之树-求树的最大子树权值和
  9. 37职责链模式(Chain of Responsibility Pattern)
  10. c语言斐波那契数列_剑指Offer-10-I.斐波那契数列
  11. matlab找距离最近的元素,如何用MATLAB找到给定坐标的最近点?
  12. 三星发布8nm芯片Exynos 850
  13. Veeam 9.5U3集中管理Agent详解
  14. cas4.0 mysql_【SSO单点系列】:CAS4.0 CAS整合SpringMVC+MyBatis实现数据库校验(04)
  15. Java从入门到精通 第0章Java学习指南
  16. 模型训练测试之三:yolov5 模型训练及windows部署(一)
  17. 印象笔记打开错误_了不起的“印象”
  18. fw313r手机登录_迅捷(FAST)fw313r路由器手机设置教程 | 192路由网
  19. 2020-10-27
  20. 学习3D建模电脑配置要求

热门文章

  1. 基于IjkPlayer的视频播放器
  2. openGauss安装软硬件安装环境
  3. FL Studio21中文版免费下载,fl studio哪个版本好
  4. 动手练一练,手写一个价格对比、固定表头滚动的表格
  5. 十个计算机快捷键,10个常用的电脑快捷键,学会了可以让你进一步提升工作效率...
  6. vue中使用axios post上传头像/图片并实时显示到页面
  7. 写pyspider遇到的问题
  8. [kpw] Kindle Paperwhite 升级到 5.6.5 后,kterm无法启动
  9. 如何通过腾讯SOSO问问获得巨大IP流量?
  10. 计算机组成原理总复习文档