《BI那点儿事》Microsoft 决策树算法
原文:《BI那点儿事》Microsoft 决策树算法

Microsoft 决策树算法是由 Microsoft SQL Server Analysis Services 提供的分类和回归算法,用于对离散和连续属性进行预测性建模。
对于离散属性,该算法根据数据集中输入列之间的关系进行预测。它使用这些列的值(也称之为状态)预测指定为可预测的列的状态。具体地说,该算法标识与可预测列相关的输入列。例如,在预测哪些客户可能购买自行车的方案中,假如在十名年轻客户中有九名购买了自行车,但在十名年龄较大的客户中只有两名购买了自行车,则该算法从中推断出年龄是自行车购买情况的最佳预测因子。决策树根据朝向特定结果发展的趋势进行预测。
对于连续属性,该算法使用线性回归确定决策树的拆分位置。
如果将多个列设置为可预测列,或输入数据中包含设置为可预测的嵌套表,则该算法将为每个可预测列生成一个单独的决策树。

示例
Adventure Works Cycles 公司的市场部希望标识以前的客户的某些特征,这些特征可能指示这些客户将来是否有可能购买其产品。AdventureWorks2008R2 数据库存储描述其以前客户的人口统计信息。通过使用 Microsoft 决策树算法分析这些信息,市场部可以生成一个模型,该模型根据有关特定客户的已知列的状态(如人口统计或以前的购买模式)预测该客户是否会购买产品。
下面我们进入主题,通过简单的过程配置我们来实现整个数据挖掘的过程,依次步骤如下:






posted on 2014-12-02 09:14 NET未来之路 阅读(...) 评论(...) 编辑 收藏

转载于:https://www.cnblogs.com/lonelyxmas/p/4136603.html

《BI那点儿事》Microsoft 决策树算法相关推荐

  1. 《BI那点儿事》Microsoft 决策树算法——找出三国武将特性分布,献给广大的三国爱好者们...

    <BI那点儿事>Microsoft 决策树算法--找出三国武将特性分布,献给广大的三国爱好者们 原文:<BI那点儿事>Microsoft 决策树算法--找出三国武将特性分布,献 ...

  2. 《BI那点儿事》Microsoft 线性回归算法

    Microsoft 线性回归算法是 Microsoft 决策树算法的一种变体,有助于计算依赖变量和独立变量之间的线性关系,然后使用该关系进行预测. 该关系采用的表示形式是最能代表数据序列的线的公式.例 ...

  3. 《BI那点儿事》数据挖掘初探

    什么是数据挖掘? 数据挖掘(Data Mining),又称信息发掘(Knowledge Discovery),是用自动或半自动化的方法在数据中找到潜在的,有价值的信息和规则. 数据挖掘技术来源于数据库 ...

  4. 《BI那点儿事》Microsoft 聚类分析算法——三国人物身份划分

    <BI那点儿事>Microsoft 聚类分析算法--三国人物身份划分 原文:<BI那点儿事>Microsoft 聚类分析算法--三国人物身份划分 什么是聚类分析?  聚类分析属 ...

  5. 《BI那点儿事》数据挖掘各类算法——准确性验证

    <BI那点儿事>数据挖掘各类算法--准确性验证 原文:<BI那点儿事>数据挖掘各类算法--准确性验证 准确性验证示例1:--基于三国志11数据库 数据准备: 挖掘模型: 依次为 ...

  6. 【机器学习入门】(5) 决策树算法实战:sklearn实现决策树,实例应用(沉船幸存者预测)附python完整代码及数据集

    各位同学好,今天和大家分享一下python机器学习中的决策树算法,在上一节中我介绍了决策树算法的基本原理,这一节,我将通过实例应用带大家进一步认识这个算法.文末有完整代码和数据集,需要的自取.那我们开 ...

  7. 【机器学习入门】(4) 决策树算法理论:算法原理、信息熵、信息增益、预剪枝、后剪枝、算法选择

    各位同学好,今天我向大家介绍一下python机器学习中的决策树算法的基本原理.内容主要有: (1) 概念理解:(2) 信息熵:(3) 信息增益:(4) 算法选择:(5) 预剪枝和后剪枝. python ...

  8. 决策树算法原理(ID3,C4.5)

    决策树算法原理(CART分类树) CART回归树 决策树的剪枝 决策树可以作为分类算法,也可以作为回归算法,同时特别适合集成学习比如随机森林. 1. 决策树ID3算法的信息论基础   1970年昆兰找 ...

  9. 每日一问 - 关于决策树算法

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 来源:Datawhale优秀回答者 将在留言区,Datawhale高校群 ...

  10. 最常用的决策树算法!Random Forest、Adaboost、GBDT 算法

    点击上方"Datawhale",选择"星标"公众号 第一时间获取价值内容 本文主要介绍基于集成学习的决策树,其主要通过不同学习框架生产基学习器,并综合所有基学习 ...

最新文章

  1. CentOS7.4 安装mongodb
  2. 用最骚的话让你彻底弄懂贝叶斯!
  3. 计算机组成原理国防科大课件,中科大计算机组成原理课件ppt.pdf
  4. 关于div的outline-offset属性和focus事件的接收
  5. java邮件实例_java邮件小实例
  6. JAVA蓝桥杯:字母图形
  7. 常用播放器替换解码器实现播放10bit编码方式的高清视频
  8. 【第四章】 资源 之 4.4 Resource通配符路径 ——跟我学spring3
  9. java 象限分析_用四种象限分析你(未来的人生走向)
  10. java interruptedexception_如何正确的处理InterruptedException
  11. 运动会管理系统(JAVA,JSP,SERVLET,SQLSERVER)
  12. 佳能MP258mp259清零软件
  13. iOS定位获取城市名
  14. android系统程序卸载,怎样卸载Android系统程序
  15. 小米路由器MINI刷潘多拉
  16. asp.net 邮件功能
  17. github python100天_GitHub - CherryXuan/Python-100-Days: Python - 100天从新手到大师
  18. JAVA中Object类中的equal方法
  19. Android x86安装教程
  20. 毕业设计之 ---基于大数据分析的航空公司客户价值分析

热门文章

  1. mysql可靠性优先策略
  2. hive判断是否包含
  3. Hive 数据质量检测
  4. spark Drive 与Executor
  5. CentOS / RHEL Cachefiles 加速网络文件系统NFS访问速度
  6. 微服务架构 SpringCloud(一)组件和概念介绍
  7. 关于x210开发板和主机、虚拟机ping通问题
  8. ES6:Rest 参数和参数默认值【转】
  9. ABP源码分析二十八:ABP.MemoryDB
  10. 详解谷歌官方教程 Android插件ADT 9.0.0