4 月 24 日,腾讯正式宣布开源 Transformer 推理加速工具 TurboTransformers。该工具面向自然语言处理领域中 Transformers 相关模型丰富的线上预测场景,在微信、腾讯云、QQ 看点等产品的线上服务中已经广泛应用,这也是腾讯通过 Github 对外开源的第 100 个项目。

据了解,TurboTransformers 的诞生源于腾讯内部对开源协同的推动。2019 年初,腾讯技术委员会成立,下设开源协同、自研上云两个项目组和对外开源管理办公室,以此来促进内部代码的开放共享和协同共建。TurboTransformers 来自于深度学习自然语言处理基础平台 TencentNLP Oteam,作为基础性技术版块,率先进行了开源协同的实践,旨在搭建统一的深度学习 NLP (Natural Language Processing,自然语言处理)基础平台、提升研发效能。在内部对技术反复打磨的基础上,该项目进一步对外开源。

在自然语言处理领域中,以 BERT 为代表的 Transformers 相关神经网络模型是近年来最重要的模型创新。可以为阅读理解、文章摘要、语义分类、同义改写等 NLP 任务提供显著的效果提升。但提高模型精度的同时,Transformes 相关模型也带来了更多的计算量。由于深度学习的训练和推理任务存在差异,训练框架直接应用于线上推理并不能得到极致的性能。众多模型算法工程师都遇到了训练的模型效果很好,但因为响应延迟不满足要求,导致模型无法上线的问题。

图片包含 游戏机, 截图 描述已自动生成

TurboTransformers 是一款小而美的 Transformer 加速工具,就像它的名字所寓意的,Turbo(涡轮)可以增加发动机氧气含量,从而带来更大动力,使用 TurboTransformers 也可以让你的推理引擎更加强劲。具体来说,它具有高速、实用、简单三个特点:

1.优异的 CPU/GPU 性能表现。面向 Intel 多核 CPU 和 NVIDIA GPU 硬件平台,通过核心融合和并行算法优化,TurboTransformers 充发挥硬件的各层级并行计算的能力。在多种 CPU 和 GPU 硬件上获得了超过 PyTorch/TensorFlow 和目前主流优化引擎(如 onnxruntime-mkldnn/onnxruntime-gpu, torch JIT, NVIDIA faster transformers)的性能表现。

2.为 NLP 推理任务特点量身定制。TurboTransformers 可以支持变长输入序列处理,无需序列补零、截断或者分桶带来的无用计算,也无需任何针对计算图在推理前进行预调优的过程。

3.简单的使用方式。TurboTransformers 支持 python 和 C++接口进行调用。TurboTransformers 支持 TensorFlow 和 PyTorch 预训练模型的载入。它可以作为 huggingface/transformers 的推理加速插件,通过加入几行 python 代码获得的 BERT 模型的端对端加速效果。

此前 TurboTransformers 已应用在腾讯内部多个线上 BERT 服务服务场景。其中微信常用问题回复服务获得 1.88x 加速,公有云情感分析服务获得 2.11x 加速,QQ 看点推荐服务获得 13.6x 加速。和其他相关工具对比,TurboTransformers 在性能、使用方式上都具备优势。

据了解,目前 TurboTransformers 的功能还相对有限,未来腾讯还会进一步对其优化,在开源后,TurboTransformers 也期待与社区和开发者一起共建。

随着技术能力的不断累积,以及以开源为代表的腾讯新代码文化的兴起,腾讯在开源领域表现亮眼:在全球最大的代码托管平台 Github 上,腾讯已经累计开源了 100 个项目,覆盖云原生、大数据、AI、安全、硬件等多个热门的技术方向,并累计获得了超过 29 万 Star 数,跻身国际上有影响力的开源企业之一。“腾讯希望在科研领域投入更多力量,把‘科技向善’纳入公司新的使命与愿景。我们将通过内外部开放源代码等方式,积极参与‘全球科技共同体’的共建。”在 2019 年智博会上,腾讯公司董事会主席兼首席执行官马化腾表明了腾讯对开源的重视。

今年年初,腾讯高级执行副总裁、云与智慧产业事业群总裁汤道生也谈及开源对腾讯的重要意义,他表示:“开源不再是开发者的个人热情,它已成为许多技术驱动型产业背后重要的创新推动力。在科技向善的使命与愿景指引下,腾讯将进一步拥抱开源,与广大开发者一起创造正向价值。”

在 2020 年,腾讯陆续推出了针对云的场景研发的 Linux 操作系统 TencentOS Server、视频评估算法 DVQA 等多个开源项目,同时也积极用科技力量助力全球抗击疫情,3 月 27 日,腾讯健康新冠疫情模块国际版(TH_COVID19_International)、“新冠肺炎 AI 自查助手”(COVID-19 self-triage assistant)也接连开源,向全球开放科技能力。

腾讯开源 TurboTransformers:自然语言处理推理加速工具相关推荐

  1. 腾讯第100个开源项目:微信开源推理加速工具TurboTransformers

    出品 | AI科技大本营(ID:rgznai100) 4月24日,腾讯正式宣布开源Transformer推理加速工具TurboTransformers.该工具面向自然语言处理领域中Transforme ...

  2. 微信开源推理加速工具 TurboTransformers,性能超越 PyTorch/TensorFlow 与主流优化引擎

    腾讯宣布开源 Transformer 推理加速工具 TurboTransformers.该工具面向自然语言处理领域中 Transformers 相关模型丰富的线上预测场景,据介绍,其在微信.腾讯云.Q ...

  3. 苹果回应iPhone邮件漏洞;GitHub连续3天爆严重宕机情况;腾讯开源Transformer推理加速工具| 极客头条...

    整理 | 屠敏 头图 | CSDN 下载自东方 IC 快来收听极客头条音频版吧,智能播报由标贝科技提供技术支持. 「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦 ...

  4. MLeaksFinder :腾讯开源的 iOS 内存泄漏检测工具

    一.工具简介 MLeaksFinder :腾讯开源的 iOS 内存泄漏检测工具 工具优势:在日常开发调试或测试业务逻辑过程中,可以自动发现并警告内存泄漏.暂时没有发现误报:基本上报了leak的  进去 ...

  5. Transformer家族5 -- 推理加速(Faster-Transformer、TurboTransformers)

    系列文章,请多关注 Transformer家族1 – Transformer详解和源码分析 Transformer家族2 – 编码长度优化(Transformer-XL.Longformer) Tra ...

  6. 腾讯开源推理框架TNN Android编译不通过

    腾讯Tnn https://github.com/Tencent/TNN 环境: Ubuntu 20.04 看到腾讯开源了tnn 迫不及待编译使用了一下.  在Android 上编译的官方demo 出 ...

  7. 阿里巴巴开源轻量级深度神经网络推理引擎MNN

    点击我爱计算机视觉标星,更快获取CVML新技术 导读:在移动端进行深度神经网络推理,可以使用腾讯开源的ncnn,或者小米开源的Mace,还有百度家的Paddle-Mobile,他们可以帮助开发者在无需 ...

  8. 从零实现Transformer、ChatGLM-6B、本地知识库、模型(训练/推理)加速

    前言 最近一直在做类ChatGPT项目的部署 微调,关注比较多的是两个:一个LLaMA,一个ChatGLM,会发现有不少模型是基于这两个模型去做微调的,说到微调,那具体怎么微调呢,因此又详细了解了一下 ...

  9. OpenVINO整合TensorFlow实现推理加速

    作者: Arindam, Yamini, Mustafa, Ritesh, Priya, Chandrakant, Surya, Amar, Sesh 编译:李翊玮 技术的传播采用通常是由用户体验的飞 ...

最新文章

  1. Python运维项目中用到的redis经验及数据类型
  2. bootstrap-table对前台页面表格的支持
  3. WebService它CXF注释错误(两)
  4. Sales Volume Analysis PoC app test - environment setup finished
  5. DESUtils 加解密时 Given final block not properly padded bug小记
  6. C语言怎么定义001为int,C语言基础-01-基本数据类型
  7. 关于 SpringCloud 配置,你了解多少?
  8. ORACLE因为字符集不同,进行中文条件查询,查询结果为空
  9. 使用JMeter测试WebSocket接口
  10. IOS开发 ios7适配
  11. ASP.NET中的回调技术(CallBack)
  12. 洛谷OJ P1802 5倍经验日 动态规划
  13. 网站点击量太大崩溃怎么办_网站崩溃时该怎么办
  14. python修改word文本框中的内容
  15. 【Bug解决】 -1073740791 (0xC0000409)
  16. 四年开发,待业半年本想放弃Java,抱着试试的心态面试某C轮金融科技公司居然过了!
  17. 苹果手机投影_智能投影机和手机无线同屏
  18. 投机之王杰西·利弗莫尔的经典炒股语录
  19. Blender插件天空地形山水自然环境生成器 TerrainScapes V2.0
  20. CSS禅意花园 —— 设计

热门文章

  1. [Bootstrap]全局样式(四)
  2. iphone开发JSON库之BSJSONAdditions
  3. 什么是 Visual VM?
  4. OutLook最小化到托盘
  5. HDU - 4685 Prince and Princess(强连通缩点+二分图完备匹配)
  6. PAT (Advanced Level) 1003 Emergency(最短路+动态规划)
  7. HDU - 2049 不容易系列之(4)——考新郎(错排问题+组合数学)
  8. 贝叶斯学习及共轭先验
  9. register---C语言中最快的关键字
  10. 8.元组tup.rs