统计学习方法读书笔记11-决策树课后习题

文章目录

1.课本课后习题
2.视频课后作业

1.课本课后习题

import graphviz
import numpy as np
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn import preprocessing
from sklearn import tree
import matplotlib.pyplot as pltfeatures = ["年龄", "有工作", "有自己的房子", "信贷情况"]
x_train = pd.DataFrame([["青年", "否", "否", "一般"],["青年", "否", "否", "好"],["青年", "是", "否", "好"],["青年", "是", "是", "一般"],["青年", "否", "否", "一般"],["中年", "否", "否", "一般"],["中年", "否", "否", "好"],["中年", "是", "是", "好"],["中年", "否", "是", "非常好"],["中年", "否", "是", "非常好"],["老年", "否", "是", "非常好"],["老年", "否", "是", "好"],["老年", "是", "否", "好"],["老年", "是", "否", "非常好"],["老年", "否", "否", "一般"]
])
y_train = pd.DataFrame(["否", "否", "是", "是", "否", "否", "否", "是", "是", "是", "是", "是", "是", "是", "否"])# 数据预处理
# LabelEncoder()打标签，对特征进行硬编码
le_x = preprocessing.LabelEncoder()
le_x.fit(np.unique(x_train))
x_train = x_train.apply(le_x.transform)le_y = preprocessing.LabelEncoder()
le_y.fit(np.unique(y_train))
y_train = y_train.apply(le_y.transform)# 建立模型
model_tree = DecisionTreeClassifier()
model_tree.fit(x_train,y_train)# 可视化
dot_data = tree.export_graphviz(model_tree,out_file='tree.dot',feature_names=features,class_names=[str(k) for k in np.unique(y_train)],filled= True,rounded=True,special_characters=True)graph = graphviz.Source(dot_data)

解决graphiz使用问题

链接

2.视频课后作业

一般默认使用基尼指数即可，因为熵中有对数运算，耗时

from sklearn.tree import DecisionTreeClassifier
from sklearn import preprocessing
import numpy as np
import pandas as pd
import time# 可视化
from IPython.display import Image
from sklearn import tree
import pydotplusdef show(clf,features,y_types):"""决策树的可视化"""dot_data = tree.export_graphviz(clf, out_file=None,feature_names=features,class_names=y_types,filled=True, rounded=True,special_characters=True)graph = pydotplus.graph_from_dot_data(dot_data)Image(graph.create_png())  #jupyter里可以显示，pycharm显示不出graph.write_png(r'DT_show.png')def main():star=time.time()# 原始样本数据features=["age","work","house","credit"]X_train=pd.DataFrame([["青年", "否", "否", "一般"],["青年", "否", "否", "好"],["青年", "是", "否", "好"],["青年", "是", "是", "一般"],["青年", "否", "否", "一般"],["中年", "否", "否", "一般"],["中年", "否", "否", "好"],["中年", "是", "是", "好"],["中年", "否", "是", "非常好"],["中年", "否", "是", "非常好"],["老年", "否", "是", "非常好"],["老年", "否", "是", "好"],["老年", "是", "否", "好"],["老年", "是", "否", "非常好"],["老年", "否", "否", "一般"]])y_train = pd.DataFrame(["否", "否", "是", "是", "否", "否", "否", "是", "是", "是", "是", "是", "是", "是", "否"])# 数据预处理le_x=preprocessing.LabelEncoder()le_x.fit(np.unique(X_train))X_train=X_train.apply(le_x.transform)le_y=preprocessing.LabelEncoder()le_y.fit(np.unique(y_train))y_train=y_train.apply(le_y.transform)# 调用sklearn.DT建立训练模型clf=DecisionTreeClassifier()clf.fit(X_train,y_train)# 可视化show(clf,features,[str(k) for k in np.unique(y_train)])# 用训练得到模型进行预测X_new=pd.DataFrame([["青年", "否", "是", "一般"]])X=X_new.apply(le_x.transform)y_predict=clf.predict(X)# 结果输出X_show=[{features[i]:X_new.values[0][i]} for i in range(len(features))]print("{0}被分类为:{1}".format(X_show,le_y.inverse_transform(y_predict)))print("time:{:.4f}s".format(time.time()-star))if __name__=="__main__":main()

[{'age': '青年'}, {'work': '否'}, {'house': '是'}, {'credit': '一般'}]被分类为:['是']
time:0.1602s

统计学习方法读书笔记11-决策树课后习题相关推荐

统计学习方法读书笔记（六）-逻辑斯蒂回归与最大熵模型（迭代尺度法（IIS））
全部笔记的汇总贴:统计学习方法读书笔记汇总贴逻辑斯谛回归 (logistic regression )是统计学习中的经典分类方法.最大熵是概率模型学习的一个准则,将其推广到分类问题得到最大熵模型(m ...
统计学习方法读书笔记（九）-EM算法及其推广
全部笔记的汇总贴:统计学习方法读书笔记汇总贴 EM算法用于含有隐变量(hidden variable)的概率模型参数的极大似然估计,或极大后验概率估计.EM算法的每次迭代由两步组成:E步,求期望(ex ...
统计学习方法读书笔记15-逻辑斯蒂回归习题
文章目录 1.课后习题 2.视频课后习题 1.课后习题 import numpy as np import time import matplotlib.pyplot as plt from mpl_ ...
统计学习方法读书笔记（五）
读书笔记仅供个人学习使用本文主要参考书籍为<统计学习方法>(李航)第二版参考 Sunning_001的博客决策树决策树的定义 if-then 的理解条件概率分布的理解决策树学习 ...
李航《统计学习方法》AdaBoost算法（课后习题）
AdaBoost:https://blog.csdn.net/v_JULY_v/article/details/40718799 提升树:https://www.cnblogs.com/daguank ...
大数据之路读书笔记-11事实表设计
大数据之路读书笔记-11事实表设计文章目录大数据之路读书笔记-11事实表设计 11.1 事实表基础 11.1.1 事实表特性 11.1.2 事实表设计原则 11.1.3 事实表设计方法 11.2 ...
李航《统计学习方法》第四章课后答案链接
李航<统计学习方法>第四章课后答案链接本博客转载自:http://blog.csdn.net/xiaoxiao_wen/article/details/54097917
李航《统计学习方法》第三章课后答案链接
李航<统计学习方法>第三章课后答案链接我的天呐竟然木有百度到...是因为太简单了吗...
统计学习方法学习笔记（十）：决策树
这一个学习笔记将要了解决策树,在研一上机器学习这门课的时候,老师在讲到这一节的时候,举了一个例子我现在还能记得:你们坐在这里上课,就像这个决策树一样,在你人生中的每一个重要结点,你都做出了选择,经过多 ...
复现经典：《统计学习方法》第 11 章条件随机场
本文是李航老师的<统计学习方法>[1]一书的代码复现. 作者:黄海广[2] 备注:代码都可以在github[3]中下载. 我将陆续将代码发布在公众号"机器学习初学者", ...

统计学习方法读书笔记11-决策树课后习题

文章目录

1.课本课后习题

2.视频课后作业

统计学习方法读书笔记11-决策树课后习题相关推荐

最新文章

热门文章