2021-10-13企业财务数据风险预警之随机森林

# copyright by huatianxue 2021年10月13日16:08:25 for my wife
# 尝试一下随机森林进行分类
from sklearn.preprocessing import StandardScaler
from sklearn.ensemble import RandomForestClassifier
import numpy as np
import read_data as rd
# read_data 是我自己写的函数，用作封装读取数据这个环节的
path = './data/all_data.csv'
train_data, test_data = rd.import_data(path=path)
# print(train_data)
# print(test_data)x_train_data = np.array(train_data.drop(['class'], axis=1))
# 训练数据的自变量
y_train_data = np.array(train_data['class'])
# 训练数据的标签
x_test_data = np.array(test_data.drop(['class'], axis=1))
# 测试数据的自变量
test_true_label = np.array(test_data['class'])
# 训练数据的标签
# 现在这些格式都是dataframe格式，标签转换为array格式
scaler = StandardScaler()
# 测试数据标准化
scaler.fit(x_test_data)
x_test_Standard = scaler.transform(x_test_data)
# 训练数据标准化
scaler.fit(x_train_data)
x_train_Standard = scaler.transform(x_train_data)clf = RandomForestClassifier(max_depth=4, random_state=0)
clf.fit(x_train_Standard, y_train_data.astype('int'))test_pre = clf.predict(x_test_Standard)
pre_true_sum = 0
# 做一个循环
for i in range(0, len(test_true_label)):# 如果预测值和真实值相等if test_true_label[i] == test_pre[i]:# 那么正确预测的数值加上1pre_true_sum = pre_true_sum + 1print("预测的分类:")
print(test_pre)
print("实际的分类:")
print(test_true_label)
print("正确分类的个数")
print(pre_true_sum)
acc = pre_true_sum/len(test_true_label)
print("分类正确率：")
print(str(acc * 100) + "%")
# 输出的结果，将test后面再加上一列，就是预测值
test_data['pre_class'] = test_pre
# print(test_data)
# 然后把最终的test_data保存下来就好了
test_data.to_excel('test_data_RandomForest.xls')

其中read_data.py函数见上一篇文档

2021-10-13企业财务数据风险预警之随机森林相关推荐

电动力学每日一题 2021/10/13 用Fourier变换法计算静止电荷产生的电场
电动力学每日一题 2021/10/13 用Fourier变换法计算静止电荷产生的电场静止点电荷具有均匀线密度的静止电荷产生的电场具有均匀面密度的静止电荷产生的电场用Fourier变换法计算电场 ...
科恩第一章Friday, October 29, 2021 10:13 AM
文章目录 Chapeter 1 Part A Electromagnetic Waves and Photons **Wave-particle Duality** Chapeter 1 Friday ...
首页干货教程大数据动向大数据应用数据可视化数据分析投资并购企业专区注册登录随机森林入门攻略（内含R、Python代码）
转载原文链接:http://www.analyticsvidhya.com/blog/2015/09/random-forest-algorithm-multiple-challenges/ 近年来 ...
第13章集成学习和随机森林
1.什么是集成学习? kNN,逻辑回归,SVM,决策树,神经网络,贝叶斯->>用多数算法最终给出的结果当做最终的决策依据,投票:少数服从多数 Voting Classifier(sciki ...
Bootstrap 响应式开发(2021.10.13)
目录一.响应式开发 1.框架含义 2.响应式 3.响应式尺寸划分二.Bootstrap简介 1.Bootstrap概念 2.查阅Bootstrap文档 3.Bootstrap的使用 (1)创建文件 ...
2021.10.13会议记录
根据需求具体内容和讨论补充功能确定平台定位以及可提供服务的设备类型(网页端/移动端). 仍然选择哔哩哔哩直播作为调研对象,对PC端直播进行具体开播流程.直播设置和直播中可操作内容进行具体调研. 针对无 ...
2021.10.13股票小计
今天大盘上午低开的意思,不过到了下午稍微有点起色,今天总体是低开高走的状态.证券方面今天整个证券板块涨了0.64个点,华林证券昨天板块大跌的时候涨了,所以今天板块涨的时候没怎么跟涨,收跌1.68个点, ...
Li‘s 影像组学视频学习笔记(10)-T检验+lasso+随机森林、Li‘s have a solution and plan.
本笔记来源于B站Up主: 有Li 的影像组学系列教学视频本节(10)主要介绍: T检验+lasso+随机森林李博士借用和女朋友一起吃饭这个实例来说明:爱情和机器学习一样,复杂深奥.难以揣测. im ...
Python数据分析案例-利用多元线性回归与随机森林回归算法预测笔记本新品价格
1.前言目的: 本文通过多元线性回归与随机森林算法预测笔记本新品的发售价工具: 语言:Python 3.8 软件:Jupyter Notebook 库:pandas.numpy.matplotli ...

2021-10-13企业财务数据风险预警之随机森林

2021-10-13企业财务数据风险预警之随机森林相关推荐

最新文章

热门文章