# copyright by huatianxue 2021年10月13日16:08:25 for my wife
# 尝试一下随机森林进行分类
from sklearn.preprocessing import StandardScaler
from sklearn.ensemble import RandomForestClassifier
import numpy as np
import read_data as rd
# read_data 是我自己写的函数,用作封装读取数据这个环节的
path = './data/all_data.csv'
train_data, test_data = rd.import_data(path=path)
# print(train_data)
# print(test_data)x_train_data = np.array(train_data.drop(['class'], axis=1))
# 训练数据的自变量
y_train_data = np.array(train_data['class'])
# 训练数据的标签
x_test_data = np.array(test_data.drop(['class'], axis=1))
# 测试数据的自变量
test_true_label = np.array(test_data['class'])
# 训练数据的标签
# 现在这些格式都是dataframe格式,标签转换为array格式
scaler = StandardScaler()
# 测试数据标准化
scaler.fit(x_test_data)
x_test_Standard = scaler.transform(x_test_data)
# 训练数据标准化
scaler.fit(x_train_data)
x_train_Standard = scaler.transform(x_train_data)clf = RandomForestClassifier(max_depth=4, random_state=0)
clf.fit(x_train_Standard, y_train_data.astype('int'))test_pre = clf.predict(x_test_Standard)
pre_true_sum = 0
# 做一个循环
for i in range(0, len(test_true_label)):# 如果预测值和真实值相等if test_true_label[i] == test_pre[i]:# 那么正确预测的数值加上1pre_true_sum = pre_true_sum + 1print("预测的分类:")
print(test_pre)
print("实际的分类:")
print(test_true_label)
print("正确分类的个数")
print(pre_true_sum)
acc = pre_true_sum/len(test_true_label)
print("分类正确率:")
print(str(acc * 100) + "%")
# 输出的结果,将test后面再加上一列,就是预测值
test_data['pre_class'] = test_pre
# print(test_data)
# 然后把最终的test_data保存下来就好了
test_data.to_excel('test_data_RandomForest.xls')

其中read_data.py函数见上一篇文档

2021-10-13企业财务数据风险预警之随机森林相关推荐

  1. 电动力学每日一题 2021/10/13 用Fourier变换法计算静止电荷产生的电场

    电动力学每日一题 2021/10/13 用Fourier变换法计算静止电荷产生的电场 静止点电荷 具有均匀线密度的静止电荷产生的电场 具有均匀面密度的静止电荷产生的电场 用Fourier变换法计算电场 ...

  2. 科恩第一章Friday, October 29, 2021 10:13 AM

    文章目录 Chapeter 1 Part A Electromagnetic Waves and Photons **Wave-particle Duality** Chapeter 1 Friday ...

  3. 首页 干货教程 大数据动向 大数据应用 数据可视化 数据分析 投资并购 企业专区 注册 登录 随机森林入门攻略(内含R、Python代码)

    转载 原文链接:http://www.analyticsvidhya.com/blog/2015/09/random-forest-algorithm-multiple-challenges/ 近年来 ...

  4. 第13章 集成学习和随机森林

    1.什么是集成学习? kNN,逻辑回归,SVM,决策树,神经网络,贝叶斯->>用多数算法最终给出的结果当做最终的决策依据,投票:少数服从多数 Voting Classifier(sciki ...

  5. Bootstrap 响应式开发(2021.10.13)

    目录 一.响应式开发 1.框架含义 2.响应式 3.响应式尺寸划分 二.Bootstrap简介 1.Bootstrap概念 2.查阅Bootstrap文档 3.Bootstrap的使用 (1)创建文件 ...

  6. 2021.10.13会议记录

    根据需求具体内容和讨论补充功能确定平台定位以及可提供服务的设备类型(网页端/移动端). 仍然选择哔哩哔哩直播作为调研对象,对PC端直播进行具体开播流程.直播设置和直播中可操作内容进行具体调研. 针对无 ...

  7. 2021.10.13股票小计

    今天大盘上午低开的意思,不过到了下午稍微有点起色,今天总体是低开高走的状态.证券方面今天整个证券板块涨了0.64个点,华林证券昨天板块大跌的时候涨了,所以今天板块涨的时候没怎么跟涨,收跌1.68个点, ...

  8. Li‘s 影像组学视频学习笔记(10)-T检验+lasso+随机森林、Li‘s have a solution and plan.

    本笔记来源于B站Up主: 有Li 的影像组学系列教学视频 本节(10)主要介绍: T检验+lasso+随机森林 李博士借用和女朋友一起吃饭这个实例来说明:爱情和机器学习一样,复杂深奥.难以揣测. im ...

  9. Python数据分析案例-利用多元线性回归与随机森林回归算法预测笔记本新品价格

    1.前言 目的: 本文通过多元线性回归与随机森林算法预测笔记本新品的发售价 工具: 语言:Python 3.8 软件:Jupyter Notebook 库:pandas.numpy.matplotli ...

最新文章

  1. spark如何防止内存溢出_Spark 理论基石 —— RDD
  2. prometheus之DCGM监控GPU
  3. .Net高级技术——对象序列化
  4. 新闻发布项目——业务逻辑层(categoryTBService)
  5. 【飞秋教程】查找/备份/还原
  6. linux 如何查看进程内用户虚拟空间分布
  7. 一起玩转玩转LiteOS组件:Opus
  8. 在Ubuntu下安装软件
  9. markdown与latex:如何写出具有数学符号意味的ln3\ln
  10. 昨天我上午下单买的电池,已经到了长沙
  11. 开发机器学习应用程序的步骤
  12. dmg为什么下载成php,解答:dmg是什么意思,dmg文件如何打开,及怎么把dmg转换成iso
  13. 美国节日(求某天是星期几)
  14. JSON.stringify(value[, replacer [, space]])
  15. 897-了解微服务网关
  16. C语言指针基础与深入
  17. 【Pytorch的优化器总结归纳】
  18. php notice undefined variable,PHP错误提示,Notice: Undefined variable
  19. Tests run: 1, Failures: 0, Errors: 1, Skipped: 0, Time elapsed: 8.074 s <<< FAILURE - in com.xxx.X
  20. C语言 exit 函数 - C语言零基础入门教程

热门文章

  1. WebSocket转载
  2. python常用工具
  3. 2016012072+张济吨+散列函数的应用及其安全性
  4. js与jquery操作
  5. 步步为营-75-Cookie简介
  6. p内的a截取字符串,会将a与p的其他内容撑开(IE6、IE7)
  7. this关键字实现串联构造函数调用
  8. RTT的IPC机制篇——邮箱
  9. HTML表div布局,html使用列表 以及div的布局和table的布局
  10. 已知前序中序求层序 c语言递归,二叉树的遍历:前序,中序,后序,层序--包括递归和非递归实现...