阿里对商家作弊行为检测主要用了逻辑回归而分类,线性支持向量机,随机森林和GBDT

特征列让我陌生了。除了F_score,还有a_score, b_score, p_score,r_score, ri_score, v_score;仔细一想,其实就是accuracy那一堆一般的概念。

这里直接照抄书里的一点内容了^_^

ROC曲线最初用来评价雷达性能,被称为接收者操作特性曲线,ROC曲线是根据一系列不同的阈值,得到相应的一系列而分类预测方式,每一个预测结果以一个点表示,每个点以真阳性率TPR为纵坐标,以假阳性率FPR为横坐标,再将所有的点连接起来,绘制成曲线。真阳性率代表获利能力,值越高获利越多。假阳性代表成本。斜率高的一段获利高,成本小。

ROC曲线的范围是由(0,1)、(1,1)、(1,0)、(0,0)四点构成的单位正方形区域。(0,1)代表灵敏(没有假阴性)和100%特异(没有假阳性),被称为完美分类器。而从左下到右上的线上的点为随机预测的结果。ROC曲线以上的代表好的预测结果,ROC曲线以下的代表差的一个结果。

最近GBDT比较火,仔细一看实际就是一种非线性回归。(深度学习本质也是非线性回归)

另外就是SOFTMAX。如果要求解的问题本身是个多分类问题,先使用softmax模型来处理,比如数据有4个特征,一共有三个分类情况,每个特征对分类结果的贡献权重为wi,k,对于输入加权求和,再分别加上偏置项,通过softmax函数将z1,z2,z3变成y1,y2,y3

转载于:https://www.cnblogs.com/ubiwind/p/8376841.html

读阿里机器学习平台的一些总结相关推荐

  1. 刚刚,阿里重磅发布机器学习平台PAI 3.0!

    \u003cblockquote\u003e\n\u003cp\u003e3月21日,2019 阿里云峰会在北京召开,会上阿里巴巴重磅发布了机器学习平台PAI 3.0版本.距离PAI 2.0发布已经过 ...

  2. 独家解读!阿里重磅发布机器学习平台PAI 3.0

    策划编辑|Natalie 编辑|Debra AI 前线导读:3 月 21 日,2019 阿里云峰会在北京召开,会上阿里巴巴重磅发布了机器学习平台 PAI 3.0 版本.距离 PAI 2.0 发布已经过 ...

  3. 喜马拉雅基于阿里云机器学习平台PAI-HybridBackend的深度学习模型训练优化实践

    喜马拉雅作者:李超.陶云.许晨昱.胡文俊.张争光.赵云鹏.张玉静 喜马拉雅AI云借助阿里云提供的HybridBackend开源框架,实现了其推荐模型在 GPU 上的高效训练. 业务介绍 推荐场景是喜马 ...

  4. 【图文】云栖大会深圳峰会:阿里云ET医疗大脑与工业大脑,机器学习平台PAI2.0...

    阿里云新征程:通往智能之路!正式发布ET工业大脑,ET医疗大脑和机器学习平台PAI2.0,阿里云的目标是成为万物智能化的基础设施和智能引擎! 2017年3月27日至29日,云栖大会于深圳举行.29日为 ...

  5. 阿里大数据分析与应用(part7)--机器学习平台PAI

    学习笔记,仅供参考,有错必纠 文章目录 机器学习平台PAI 机器学习PAI PAI的使用流程 PAI的数据建模 PAI三种建模方式 PAI的在线预测.离线调度 机器学习平台PAI 机器学习PAI ** ...

  6. 4月24日云栖精选夜读 | 阿里云POLARDB如何助力轻松筹打造5亿用户信赖的大病筹款平台?...

    [点击订阅云栖夜读周刊] 轻松筹首创了"大病救助"模式,帮助了众多病患在第一时间解決了医疗资金等问题,为了从源头解决了医疗资金问题.而在轻松筹这样全球5.5亿用户信赖的大病筹款平台 ...

  7. 阿里云机器学习平台PAI+AI开源项目测评来啦

    一.背景介绍 阿里AI(阿里灵杰)依托阿里领先的云基础设施.大数据和AI工程能力.场景算法技术和多年行业实践,一站式地为企业和开发者提供云原生的AI能力体系.帮助提升AI应用开发效率,促进AI在产业中 ...

  8. 如何搭建大规模机器学习平台?以阿里和蚂蚁的多个实际场景为例

    近年来,随着"大"数据及"大"模型的出现,学术界和工业界对分布式机器学习算法引起了广泛关注.针对这一刚需,本论文设计了一个独一无二的分布式平台--鲲鹏.它无缝的 ...

  9. 【对标TensorFlow】阿里公开内部超大规模分布式机器学习平台

    摘要:近年来,随着"大"数据及"大"模型的出现,学术界和工业界对分布式机器学习算法引起了广泛关注.针对这一刚需,阿里集团和蚂蚁金服设计了自己的分布式平台--鲲鹏 ...

最新文章

  1. L - Oil Deposits HDU - 1241
  2. 【alibaba-cloud】Gateway网关
  3. 【数据算法】Java实现二叉树存储以及遍历
  4. idea spring helloworld
  5. 使用outlet在SAP Spartacus中添加自定义UI
  6. (转)WebSphere的web工程中怎么获取数据源
  7. Oracle函数初探
  8. MFC CStringArray 字符串数组类 使用方法
  9. HTML--注册页面案例
  10. Python数模笔记-PuLP库(1)线性规划入门
  11. OpenVINO Inference Engine之GetAvailableDevices
  12. 关于java.lang.ArithmeticException: divide by zero的异常
  13. 关于PHP各种循环,关于php迭代循环(无限分类)
  14. Java 实现图片合成
  15. ASCLL码对照表01(控制字符)
  16. 不是技术也能看懂云计算,大数据,人工智能
  17. Matplotlib:面积图、填图、饼图
  18. GITC--2014全球互联网技术大会正式开始售票
  19. photoshop插件制作_使用Photoshop更快地制作全景
  20. mac常用快捷键--在摸爬滚打中熟练

热门文章

  1. 中国开源正在走向成熟!
  2. 作业——08 爬虫综合大作业
  3. Hanlp在java中文分词中的使用介绍
  4. 使用Telnet与ssh协议远程登录linux系统
  5. UTF-8 GBK 联系和区别
  6. Netdata---Linux系统性能实时监控平台部署记录
  7. Fuel4d 2.3 公布
  8. 怎样只接受固定长度数组为参数 数组形参
  9. Android官方命令深入分析之Device Monitor
  10. SharePoint 2010自定义母版页小技巧——JavaScript和CSS引用