2020-12-01 13:03:12

在数学领域,特征值与特征向量是十分重要的两个概念,高校课本上都表明这两个概念在工程技术方面有着广泛应用。

但还不止于此,在蓬勃发展的数字化智能时代,特征值和特征向量对于AI算法的开发以及AI训练与应用有着重要价值,可以说是人工智能(AI)的基石。

当前,随着5G、物联网、云计算等技术的普及,AI开发与应用规模也在不断扩大,企业除了要面对数据爆发挑战,还需要对海量的特征向量进行存储和计算,这进一步加大了基础设施的性能压力。

为了给AI领域的向量检索提供基础系统支撑与保障,京东与英特尔合作,在基于英特尔®至强®可扩展处理器的服务器上对分布式特征向量检索系统Vearch 进行优化,借助英特尔软硬结合优势,帮助企业改进重复图片去重、相似性商品图片搜索、人脸识别等 AI 应用的响应速度,并大幅降低特征向量检索系统总体拥有成本(TCO)。

1 AI特征向量检索新困境

今年是AI与行业融合最为关键的一年,随着企业对AI技术的深入了解与应用,一些新的难题也逐渐显现出来,成为制约AI场景应用的新壁垒。

在数学学科中,特征向量是线性变换中的一个专业名词,它是一个非退化向量,其方向在变换下保持不变,而该向量在此变换下缩放的比例就是特征值。在人工智能领域,特征向量代表的是一组属性的集合,主要用来描述特定目标的不同特征属性,也是AI应用的重要基础性数据。

随着算法能力的不断提升,越来越多的数据文本,如图像、音视频等,都可以通过机器学习算法抽取大量特征应用于业务场景,形成我们常用的一些AI应用,如图片检测、听音识曲、人脸识别等。

当前,AI技术的应用范围持续增长,企业业务场景日趋复杂,海量特征向量的存储与处理需求也在不断扩大。然而,目前行业内并没有一套完整的系统解决方案来满足高维特征向量的存储与计算,一些开源机器学习算法基础库能够支持各种向量检索模型,但却不能支持分布式、实时索引和检索等相对复杂的功能。

以零售产业的AI应用场景为例,常见的特征向量包括用于描述用户的向量和用于描述商品的向量,而当下深度学习等AI应用在企业内部的规模越来越大,这就使得特征向量的规模常常会达到 10/100 亿,甚至千亿量级,对内存和磁盘资源有着巨大的需求。

此外,在向量检索中,企业往往会在AI训练之后将用户向量和商品向量存储到基础向量检索系统中,并通过用户ID等方式定位到特定的特征向量,使用该特征向量在向量集中进行检索,可以召回Top-N个结果。而为了满足特征向量存储及向量检索对内存和磁盘资源的需求,业界通常会采用部署大量容器的方式。且为了最大化利用资源,企业会将单个容器的资源控制在较小范围内,这同样对系统整体的性能产生了挑战。

为了应对海量高维特征的存储及特征向量检索两个问题,京东零售技术与数据中心基础架构团队基于现有部分业务及应用场景,抽象提炼出一个服务于AI时代的基础向量检索系统——Vearch,并与英特尔合作,借助英特尔软硬结合优势,打造了一个功能强大、灵活易用的特征向量检索方案,再通过优化解决内存和存储资源占用过多问题,以此帮助工程师更加专注于算法创新本身。

2Vearch带来向量检索新方式

Vearch是一个分布式向量搜索系统,主要针对大规模深度学习向量进行高性能相似搜索,解决亿级及数亿级向量的存储和计算问题。

Vearch整体架构有三部分组成:Master,Router 和 Partition Server(PS)。其中Master负责对整个Vearch集群的资源进行调度和管理;Router负责对用户所有的请求进行解析路由和转发;Partition Server(PS)则是存储及重要的计算节点,可以提供存储、检索文档、向量、标量的能力。

为了进一步提升Vearch系统在性能和资源利用方面的能力,京东与英特尔合作,在基于英特尔®至强®可扩展处理器的服务器上,通过原始向量压缩、string字段压缩、内存整理、图+量化组合索引等方式对系统进行优化。

比如在软件方面,京东在某些向量召回场景使用“图+量化”的组合索引方式,它可以召回有序结果,避免了二次排序时需要存储原始向量的做法。数据表明,使用“图+量化”的组合索引方式后,在保证Top-1较高召回率的情况下,存储资源的使用量只有原来的1/4或更少。

除了软件层面的优化,英特尔的硬件优势是特征向量索引性能提升的关键因素。京东采用的是英特尔®至强®可扩展处理器,不仅拥有强大的通用计算能力,其上还集成了增强单指令多数据流(Single Instruction Multiple Data,SIMD)的英特尔®AVX-512指令集等创新技术,可以为单条指令提供双倍数量的操作数,从而大大提升指令的吞吐能力。

也是基于此,英特尔®至强®可扩展处理器不仅实现了对通用计算能力和并行计算能力的兼顾,还为存储与计算密集型应用提供了卓越的性能基础。

得益于英特尔软硬实力的加持,Vearch向量检索系统在多个应用场景中都有着十分突出的表现。在IVFPQ测试中,通过Vearch优化版IVFPQ与Faiss原生版IVFPQ进行性能对比测试发现,相比于后者,Vearch优化版不仅针对IVFPQ算法的数据访问特点重构了数据的内存布局,还极大提升了L1 Cache的命中率。不仅如此,利用英特尔AVX-512指令集,IVFPQ在线数据访问的并行度也得到大幅提升。

实际应用中,Vearch向量检索系统能够在多个场景中为企业和用户带来更切实的体会。比如在人脸识别应用中,该方案可以帮助企业相关业务系统在不对基础设施进行大幅投资的前提下,提升特征向量检索的速度,降低存储资源消耗,节约总体拥有成本(TCO),从而助力构建更加敏捷高效的AI应用。而在用户体验上,通过基于Vearch的实时在线相似性图片搜索服务,电商平台能够为用户提供同款商品的搜索服务,让用户体验更加便捷、直观的购物方式。

3 强强联合共同推动AI平台优化一直以来,英特尔都希望通过连接、存储与计算的全方位能力来凝聚整个行业生态的力量,充分发挥自身软硬结合优势,帮助企业在智能化转型中不断提升。

京东与英特尔联合持续优化Vearch系统在行业场景中的应用。据了解,Vearch自去年9月份开源以来,华为、科大讯飞、爱奇艺、趣头条、OPPO、汽车之家和网易严选等数十家知名公司的团队或个人,已经在一些业务场景中尝试或使用。

目前,Vearch最新3.2.0版已经支持实时IVFPQ、实时HNSW、IVFFLAT、BINARY和FLAT(暴力搜索)等多种ANN检索模型,而更多的检索模型也在集成中,如IMI、OPQ、SSG 等,以覆盖更丰富多元的业务使用场景。

不仅如此,京东也将在Vearch中提供更丰富的算法插件,包括文本语义embedding算法插件,音频embedding算法插件等。而依托在技术和产品方面的深厚积累,英特尔将帮助京东等合作伙伴对广泛的应用系统进行优化,促进软硬件协同调优与验证,进一步发挥英特尔架构在性能、扩展性、稳定性、可用性等领域的优势。

双方强强联合,共同推动Vearch系统在AI领域的应用,为互联网、零售和金融等行业的AI技术应用提供强大助力,同时也将智能时代数据带来的价值最大化释放,加速各行业向数字化迈进的步伐。

英特尔与京东联合强化AI武器:让创新更专注相关推荐

  1. 英特尔推出业界领先的AI与数据分析平台,全新处理器、内存、存储、FPGA解决方案集体亮相

    英特尔公司今日正式发布第三代英特尔®至强®可扩展处理器及全新的AI软硬件产品组合,旨在进一步助力客户在数据中心.网络及智能边缘环境中加速开发和部署AI及数据分析工作负载.作为业界首个内置bfloat1 ...

  2. 加速智能边缘应用落地 英特尔携生态伙伴展示AI计算盒参考设计最新成果

    7月28日,在以"同芯智远,共赢边缘"为主题的2021英特尔AI计算盒参考设计(以下简称"AI计算盒")主题分享会上,英特尔携手边缘AI领域的众多合作伙伴一同见 ...

  3. 加速智能边缘应用落地,英特尔携生态伙伴展示AI计算盒参考设计最新成果

    ↑ 收听本条新闻的音频版,请猛戳这里 ↑ 今日,在以**"同芯智远,共赢边缘"为主题的2021英特尔AI计算盒参考设计(以下简称"AI计算盒")主题分享会**上 ...

  4. 英特尔 x Datawhale联合认证发布!

    Datawhale学习 贡献方:Intel.Datawhale 为了培养更多AI领域应用人才,英特尔联合Datawhale,推出人工智能的开源学习计划.完成认证课程的学习者,将获得由Datawhale ...

  5. 英特尔® 至强® 平台集成 AI 加速构建数据中心智慧网络

    英特尔® 至强® 平台集成 AI 加速构建数据中心智慧网络 SNA 通过 AI 方法来实时感知网络状态,基于网络数据分析来实现自动化部署和风险预测,从而让企业网络能更智能.更高效地为最终用户业务提供支 ...

  6. 英特尔ROG京东三强携手,最强电竞装备亮相斗鱼嘉年华

    4月29日,"史上最强"斗鱼嘉年华在武汉火热开展.与一年前相比,今年的斗鱼嘉年华不仅场地扩大至去年的三倍,参与主播更是超过千名.其中ROG助力的斗鱼嘉年华英特尔大师挑战赛武汉站,华 ...

  7. 英特尔人工智能副总裁:AI不是一种技能,而是一种对于工作的描述

    来源:网络大数据 人工智能领域的迅速发展,相关人才不能满足需求已经成为业界共识.有报道称,因为人工智能工程师庞大的缺口,一些公司为了获得人才不得不支付数百万美元的薪水.如何满足对人工智能工程师不断增长 ...

  8. 英特尔赋能智能边缘与AI产业,践行环境可持续发展

    近日,在2021世界人工智能大会(WAIC 2021)期间,英特尔公司物联网事业部中国区首席技术官及高级首席工程师张宇博士以"保护地球,从'芯'起步"为主题发表演讲,全面阐述了英特 ...

  9. 英特尔牵手京东,第九代智能酷睿处理器登陆中国

    继在美国纽约全球首发一周之后,英特尔第九代智能酷睿桌面级处理器新品发布会终于来到了中国,地点选择了京东总部.京东这位合作伙伴在英特尔心目中的重要地位,由此也可见一斑. 在京东&英特尔第九代智能 ...

最新文章

  1. CentOS7安装bind域名服务
  2. MM模块在做GR的时候几个需要注意的地方
  3. QT绘制具有向下钻取效果的园饼图
  4. python读取配置文件使用_python 使用 ConfigParser 读取和修改INI配置文件
  5. java检测用户是否重复登录_Java web工程判断用户是否重复登录
  6. 5.3 使用SQL还是NoSQL
  7. Linux检查当前运行级别
  8. javascript案例---简单的视觉效应
  9. 如何连接禅道的mysql_禅道一键安装包如何实现mysql异机连接
  10. 通达信波段王指标公式主图_通达信股票波段王+精准买卖提示主图指标源码公式_通达信指标公式_指标公式网...
  11. 计算机蠕虫病毒,电脑中蠕虫病毒怎么办
  12. mil与mm单位换算工具
  13. 金融量化分析【day112】:量化平台的使用-第一个策略
  14. 5G技术—5G网络架构及关键技术详述测试题目
  15. XGBoost导读与实战阅读记录(一)——rabit和allreduce
  16. sqlmap tamper mysql_sqlmap之常用tamper脚本
  17. Leetcode:NO.15 三数之和 夹逼
  18. 不锈钢常识 - Powered by Discuz!
  19. turtle库描绘彩虹旋转图
  20. Terraria及tModloader开服教程

热门文章

  1. 转 机器学习系列 08:深入理解拉格朗日乘子法、KKT 条件和拉格朗日对偶性
  2. VUE3.0 二. vue-cli3 配置指南
  3. 海淀城市大脑建设单位“中海纪元”调研“智源研究院”
  4. 牛顿的另一面:夺权、严惩罪犯,以一己之力挽救英国危机
  5. 一个量子物理学家是怎样研究 AI 的? | 8月书讯
  6. 结合深度学习的图像修复怎么实现?
  7. TX2更新源失败的问题
  8. nginx反向代理,负载均衡
  9. 娓娓道来!那些BERT模型压缩方法
  10. 收藏|万字 Matplotlib 实操干货