《BI那点儿事》数据挖掘各类算法——准确性验证
原文:《BI那点儿事》数据挖掘各类算法——准确性验证

准确性验证示例1:——基于三国志11数据库

数据准备:

挖掘模型:
依次为:Naive Bayes 算法、聚类分析算法、决策树算法、神经网络算法、逻辑回归算法、关联算法

提升图:

依次排名为:
1. 神经网络算法(92.69% 0.99)
2. 逻辑回归算法(92.39% 0.99)
3. 决策树算法(91.19% 0.98)
4. 关联算法(90.60% 0.98)
5. 聚类分析算法(89.25% 0.96)
6. Naive Bayes 算法(87.61 0.96)

Naive Bayes算法——分类矩阵

说明:
其他类的538个样本有482个预测正确,32个错分为军师类,24个错分为将军类,预测正确率为89.59%;
军师20个样本有13个预测正确,7个错分为其他类,预测正确率为65%;
将军112个样本有92个预测正确,16个错分为其他类,4个错分为军师类,预测正确率为82.14%。
聚类分析算法——分类矩阵

说明:
其他类的538个样本有536个预测正确,2个错分为将军类,预测正确率为99.63%;
军师20个样本有0个预测正确,20个错分为其他类,预测正确率为0%;
将军112个样本有62个预测正确,50个错分为其他类,预测正确率为55.36%。
决策树算法——分类矩阵

说明:
其他类的538个样本有538个预测正确,预测正确率为100%;
军师20个样本有0个预测正确,20个错分为其他类,预测正确率为0%;
将军112个样本有73个预测正确,39个错分为其他类,预测正确率为65.18%。
神经网络算法——分类矩阵

说明:
其他类的538个样本有524个预测正确,5个错分为军师类,9个错分为将军类,预测正确率为97.40%;
军师20个样本有5个预测正确,15个错分为其他类,预测正确率为25%;
将军112个样本有92个预测正确,20个错分为其他类,预测正确率为82.14%。
逻辑回归算法——分类矩阵

说明:
其他类的538个样本有526个预测正确,6个错分为军师类,6个错分为将军类,预测正确率为97.77%;
军师20个样本有5个预测正确,15个错分为其他类,预测正确率为25%;
将军112个样本有88个预测正确,24个错分为其他类,预测正确率为78.57%。
关联算法——分类矩阵

说明:
其他类的538个样本有519个预测正确,19个错分为军师类,预测正确率为96.47%;
军师20个样本有0个预测正确,20个错分为其他类,预测正确率为0%;
将军112个样本有88个预测正确,24个错分为其他类,预测正确率为78.57%。
分类矩阵——预测正确率汇总分析:

其他

军师

将军

神经网络算法

97.40%

25%

82.14%

逻辑回归算法

97.77%

25%

78.57%

决策树算法

100%

0%

65.18%

关联算法

96.47%

0%

78.57%

聚类分析算法

99.63%

0%

55.36%

Naive Bayes 算法

89.59%

65%

82.14%

可以看出Naive Bayes 算法在预测军师身份正确率最高,达到65%,决策树算法、关联算法、聚类分析算法为0%,神经网络算法、逻辑回归算法为25%;
决策树算法在预测其他身份正确率最高,达到100%;
神经网络算法、Naive Bayes 算法在预测将军身份正确率并列,达到82.14%。

准确性验证示例2:——基于个股数据
数据准备:

挖掘模型依次为:
StockClustering 聚类分析算法
StrockDecisionTrees 决策树算法
StockNeuralNetWork 神经网络算法
StockLogistic 逻辑回归算法

提升图:

依次排名为:
1. 逻辑回归算法(49.73% 0.52)
2. 神经网络算法(49.63% 0.53)
3. 聚类分析算法(48.13% 0.51)
4. 决策树算法(47.28% 0.50)
聚类分析算法——分类矩阵:

说明:
持平的114个样本有0个预测正确,91个错分为跌,23个错分为涨,预测正确率为0%;
跌的443个样本有340个预测正确,103个错分为涨,预测正确率为76.75%;
涨的380个样本有111个预测正确,269个错分为跌,预测正确率为29.21%。

决策树算法——分类矩阵:

说明:
持平的114个样本有0个预测正确,114个错分为跌,预测正确率为0%;
跌的443个样本有443个预测正确,预测正确率为100.00%;
涨的380个样本有0个预测正确,380个错分为跌,预测正确率为0%。

神经网络算法——分类矩阵:

说明:
持平的114个样本有0个预测正确,60个错分为跌,54个错分为涨,预测正确率为0%;
跌的443个样本有277个预测正确,166个错分为涨,预测正确率为62.53%;
涨的380个样本有188个预测正确,192个错分为跌,预测正确率为49.47%。

逻辑回归算法——分类矩阵:

说明:
持平的114个样本有0个预测正确,89个错分为跌,25个错分为涨,预测正确率为0%;
跌的443个样本有380个预测正确,63个错分为涨,预测正确率为85.78%;
涨的380个样本有86个预测正确,294个错分为跌,预测正确率为22.63%。

分类矩阵——预测正确率汇总分析:

 

持平

逻辑回归算法

0%

85.78%

22.63%

神经网络算法

0%

62.53%

49.47%

聚类分析算法

0%

76.75%

29.21%

决策树算法

0%

100.00%

0%

posted on 2014-12-02 09:21 NET未来之路 阅读(...) 评论(...) 编辑 收藏

转载于:https://www.cnblogs.com/lonelyxmas/p/4136624.html

《BI那点儿事》数据挖掘各类算法——准确性验证相关推荐

  1. 《BI那点儿事》Microsoft 聚类分析算法——三国人物身份划分

    <BI那点儿事>Microsoft 聚类分析算法--三国人物身份划分 原文:<BI那点儿事>Microsoft 聚类分析算法--三国人物身份划分 什么是聚类分析?  聚类分析属 ...

  2. 数据挖掘分类算法的学习总结

    一.中文摘要 大数据时代的我们每时每刻都在产生海量数据,如何快速准确获取其中有价值的数据一直是亟待解决的问题.数据挖掘技术的应运而生为该问题提供了解决手段,作为数据挖掘核心内容之一的分类算法同样发挥了 ...

  3. 《BI那点儿事》数据流转换——排序

    <BI那点儿事>数据流转换--排序 原文:<BI那点儿事>数据流转换--排序 排序转换允许对数据流中的数据按照某一列进行排序.这是五个常用的转换之一.连接数据源打开编辑界面,编 ...

  4. 数据挖掘Apriori算法

    数据挖掘Apriori算法 数据挖掘(Data Mining)就是从大量的.不完全的.有噪声的.模糊的.随机的实际应用数据中,提取隐含在其中的.人们事先不知道的.但又是潜在有用的信息和知识的过程.挖掘 ...

  5. 《BI那点儿事》Microsoft 决策树算法——找出三国武将特性分布,献给广大的三国爱好者们...

    <BI那点儿事>Microsoft 决策树算法--找出三国武将特性分布,献给广大的三国爱好者们 原文:<BI那点儿事>Microsoft 决策树算法--找出三国武将特性分布,献 ...

  6. 《BI那点儿事》三国数据分析系列——蜀汉五虎上将与魏五子良将武力分析,绝对的经典分析...

    <BI那点儿事>三国数据分析系列--蜀汉五虎上将与魏五子良将武力分析,绝对的经典分析 原文:<BI那点儿事>三国数据分析系列--蜀汉五虎上将与魏五子良将武力分析,绝对的经典分析 ...

  7. 《BI那点儿事》数据流转换——派生列

    原文:<BI那点儿事>数据流转换--派生列 派生列转换通过对转换输入列应用表达式来创建新列值. 表达式可以包含来自转换输入的变量.函数.运算符和列的任意组合. 结果可作为新列添加,也可作为 ...

  8. 《BI那点儿事》数据流转换——透视

    原文:<BI那点儿事>数据流转换--透视 这个和T-SQL中的PIVOT和UNPIVOT的作用是一样的.数据透视转换可以将数据规范或使它在报表中更具可读性. 通过透视列值的输入数据,透视转 ...

  9. 数据挖掘——时间序列算法之ARCH模型

    数据挖掘--时间序列算法之ARCH模型 先占个坑 1.平滑法 2.趋势拟合法 3.组合模型 4.AR模型 5.MA模型 6.ARMA模型 7.ARIMA模型 8.ARCH模型 9.GARCH模型及其衍 ...

最新文章

  1. android studio adb
  2. Service Manger的初始化分析
  3. Edward Gaming, the Champion 字符串,模拟(2021.11.沈阳)
  4. 《TensorFlow 机器学习方案手册》(附 pdf 和完整代码)
  5. 大数的相加 乘 余 幂
  6. Hibernate框架(1)
  7. oracle 插入出错_使用sqlca打印错误原因,ORACLE-Proc:SQLCA
  8. 《Linux内核完全注释》《完全剖析》 » 阅读本书所需的基础知识 -- 再次强调。
  9. docker清理磁盘占用
  10. 解决PyScripter中文乱码问题
  11. catia 二次开发:高版本的catia vba项目在低版本的catia上运行,报错
  12. HTTP 权威指南 详解 (推荐阅读 )
  13. 小米 note3 android,小米NOTE3 MIUI9.6稳定版 开启全面屏手势和屏蔽经典物理按键全攻略...
  14. 根据身高体重计算BMI指数
  15. win10禁用笔记本自带键盘、触摸盘
  16. 神经网络调参-warmup and decay
  17. 「Activiti精品 悟纤出品」核心类以及如何在SpringBoot集成说明 - 第328篇
  18. 【Gaze】A Survey on Using Gaze Behaviour for Natural Language Processing
  19. 数据库-MySQL环境(5.x、Windows、解压版、安装版、安装、卸载)
  20. --如何用PhotoShop制作真人头像表情包--

热门文章

  1. 一条SQL查询语句是如何执行的? MySql杂谈
  2. React基础篇(三)之 webpack打包项目配制
  3. Android自定义View 开发流程综合简述 Android自定义View(三)
  4. Android RecyclerView(九)滑动监听综述
  5. “unauthorized: authentication required” -- openshift3.9 docker push 报错
  6. 单点登录的原理与简单实现
  7. Linux Shell 文本处理工具集锦 zz
  8. jvm原理及性能调优系列(jvm调优)
  9. 朋友面试被问到---静态构造函数
  10. MySQL_存储引擎