Angle和XBGoost以及Spark的性能对比
性能优势
新版本的Angel,添加了诸多新功能,最终的目的,就是让算法工程师能更加从容地进行算法优化,融入更多的算法的Trick,让算法的性能,得到了一个飞跃的提升。
相关性能的细节数据,在Github的各个算法介绍文档都可以看到,欢迎点击文末“阅读原文”移步GitHub。
1.GBDT
众所周知,XGBoost的强项之一,就是GBDT算法,性能飞快,使用简单,在众多算法比赛中,是选手们的最爱。尽管如此,Angel的GBDT算法,却还是超越了它,这是一个非常不错的性能背书。
性能比较
数据:腾讯内部某性别预测数据集,3.3×10^5 特征,1.2×10^8 样本
详细文档:GBDT on Angel
2.LDA
众所周知,LDA是一个非常消耗资源的主题模型算法,新一代的Angel,在LDA上的性能,不但超越了Spark,也已经超越了之前开源过的Petuum。(由于Petuum已经不开源多时,所以比对数据,这里就不再贴出了)
数据:PubMED
详细文档: LDA on Angel
3.GD-LR
LR是广告推荐中广泛应用的一个算法,Angel分别提供了利用Gradient Descent、ADMM两种优化方法计算的LR算法。这两种算法,无论是耗费的资源,还是性能、收敛速度,都远比原生的Spark实现优越。
GD-LR
数据: 腾讯内部某推荐数据,5×10^7 特征,8×10^7 样本
详细文档: LR on Angel
ADMM-LR
数据:腾讯内部某推荐数据,5千万特征,1亿样本
Angle和XBGoost以及Spark的性能对比相关推荐
- Hadoop、Spark、Storm对比
Hadoop.Spark.Storm对比 1 Hadoop.Spark.Storm基本介绍 1.1 Hadoop Hadoop项目是开发一款可靠的.可扩展性的.分布式计算的开源软件.通过编写MapRe ...
- 基于逻辑回归/决策树/随机森林/多层感知分类器/xgboost/朴素贝叶斯分类的资讯多分类性能对比
在上一篇(https://blog.csdn.net/baymax_007/article/details/82748544)中,利用逻辑回归实现资讯多分类.本文在之前基础上,又引入决策树.随机森林. ...
- Java常用消息队列原理介绍及性能对比
消息队列使用场景 为什么会需要消息队列(MQ)? 解耦 在项目启动之初来预测将来项目会碰到什么需求,是极其困难的.消息系统在处理过程中间插入了一个隐含的.基于数据的接口层,两边的处理过程都要实现这一 ...
- golang连接postgresql too many client_MySQL和PostgreSQL压测性能对比
阅读使人充实,讨论使人敏捷,写作使人精确. >>> 压测业务场景文章属于互联网社区动态类场景核心功能压测案例.至于题目涉及的MySQL和PostgreSQL之间的关系,主要为业务选型 ...
- php下curl与file_get_contents性能对比
为什么80%的码农都做不了架构师?>>> 上一篇讲了 <php使用curl替代file_get_contents>, 后续贴出了curl和file_get_cont ...
- Apache Spark Jobs 性能调优
当你开始编写 Apache Spark 代码或者浏览公开的 API 的时候,你会遇到各种各样术语,比如transformation,action,RDD(resilient distributed d ...
- p40与p100训练性能对比
深度学习训练,选择P100就对了 原文:https://yq.aliyun.com/articles/238764 摘要: 本文使用NVCaffe.MXNet.TensorFlow三个主流开源深度学习 ...
- php vs lua,解析LUA与PHP在WEB应用的性能对比
解析LUA与PHP在WEB应用的性能对比是本文要介绍的内容,这几天用在WEB开发的LUA框架已经完成,框架中已包括数据库操作和模板操作的功能,能够很简单方便的应用在WEB开发上.在此时我对这个LUA框 ...
- Jetson Nano and VIM3硬件参数对比及目标检测性能对比
文章目录: 1 Jetson Nano and VIM3硬件参数对比及目标检测性能对比 2 Jetson nano在yolov4目标检测性能 3 VIM在yolov3.yolov3-tiny.yolo ...
最新文章
- sohu广告js代码调研
- 28岁女博士生被骂“学术媛”,只因在网上分享自己牛津年级第一成绩毕业......
- FPGA之道(7)时钟网络资源
- OpenCV:Python3使用OpenCV
- 离线使用iPhone SDK文档的方法
- python网络爬虫系列(十)——chrome在爬虫中的使用
- MagicRecord For IOS 简介
- 阿里二面:怎么解决MySQL死锁问题的?
- ActiveRecord 模式杂谈
- 笨办法学 Python · 续 练习 1:流程
- Django怎么配置mysql数据库_Django如何配置mysql数据库
- Egret之属性绑定
- C++基础知识:C++语言中的表达式求值
- Android之Handler,举例说明如何更新UI
- javascript创建对象过程
- [Flash开发笔记] Flash 执行exe文件
- JDK:native2ascii命令详解
- C++三种方法求解两个数最大公因数和最小公倍数
- Ubuntu18.04下,QT5移植到ARM板上运行程序发生异常:could not find or load the Qt platform plugin linuxfb原因
- opencv 手指位置检测
热门文章
- 怎么把系统中的桌面文件夹放到别的盘里
- 新增Skin-watercolor
- POJ - 3680 Intervals(最大费用最大流+思维建边)
- CodeForces - 1213E Two Small Strings(暴力+构造)
- HDU - 5874 Friends and Enemies(思维)
- 安装翻译_【现象】面对日益增多的外国人 日本安装远程翻译设施
- python 逻辑回归权重_Python 逻辑回归
- 行健设计_广西大学行健文理学院参加2019年第七届广西大学生工业设计大赛
- 通讯故障_伦茨lenze全数字直流调速器通讯故障维修经验很丰富
- JSP中的include指令