ML之DT:机器学习根据大量数据,已知年龄、收入、是否上海人、私家车价格的一个人,预测是否有真实购买上海黄浦区楼房的能力

目录

输出结果​​

实现代码


输出结果

实现代码

from sklearn.feature_extraction import DictVectorizer
import csv
from sklearn import tree
from sklearn import preprocessing
from sklearn.externals.six import StringIOallElectronicsData = open(r'F:/AI/DL_month1201/01DTree/niu.csv', 'rt')
reader = csv.reader(allElectronicsData)
headers = next(reader)
print(headers)
featureList = []
labelList = []
for row in reader: labelList.append(row[len(row)-1])  rowDict = {}for i in range(1, len(row)-1):  rowDict[headers[i]] = row[i] featureList.append(rowDict)      print(featureList)vec = DictVectorizer()
dummyX = vec.fit_transform(featureList) .toarray()print("dummyX: " + str(dummyX))
print(vec.get_feature_names())print("labelList: " + str(labelList))lb = preprocessing.LabelBinarizer()
dummyY = lb.fit_transform(labelList)
print("dummyY: " + str(dummyY))clf = tree.DecisionTreeClassifier(criterion='entropy')
clf = clf.fit(dummyX, dummyY)
print("clf: " + str(clf))with open("niu.dot", 'w') as f: f = tree.export_graphviz(clf, feature_names=vec.get_feature_names(), out_file=f)  oneRowX = dummyX[0, :]
print("oneRowX: " + str(oneRowX))newRowX = oneRowX
newRowX[0] = 1
newRowX[2] = 0
print("newRowX: " + str(newRowX))predictedY = clf.predict([newRowX])
print("predictedY: " + str(predictedY))

相关文章
ML之DT:机器学习根据大量数据,已知年龄、收入、是否上海人、私家车价格的一个人,预测是否有真实购买上海黄浦区楼房的能力

ML之DT:机器学习根据大量数据,已知年龄、收入、是否上海人、私家车价格的一个人,预测是否有真实购买上海黄浦区楼房的能力相关推荐

  1. ML之回归预测:利用13种机器学习算法对Boston(波士顿房价)数据集【13+1,506】进行回归预测(房价预测)+预测新数据得分

    ML之回归预测:利用13种机器学习算法对Boston(波士顿房价)数据集[13+1,506]进行回归预测(房价预测)+预测新数据得分 导读 本文章基于前边的一篇文章,对13种机器学习的回归模型性能比较 ...

  2. 机器学习建模神器PyCaret已开源!提升效率,几行代码轻松搞定模型

    Datawhale干货 编译:张峰,Datawhale成员 寄语:PyCaret,是一款 Python中的开源低代码(low-code)机器学习库,支持在「低代码」环境中训练和部署有监督以及无监督的机 ...

  3. Competition——ML/DL:机器学习、深度学习各种计算机视觉、自然语言处理、科学预测等等比赛竞赛简介

    Competition--ML/DL:机器学习.深度学习各种计算机视觉.自然语言处理.科学预测等等比赛竞赛简介 相关内容 Competition--互联网比赛(编程相关):国内外各种互联网比赛举办时间 ...

  4. Core ML介绍 (Apple机器学习框架)

    概览 借助 Core ML,您可以将已训练好的机器学习模型,集成到自己的应用当中. 所谓已训练模型 (trained model),指的是对一组训练数据应用了某个机器学习算法后,所生成的一组结果.举个 ...

  5. ML大杂烩:**常见机器学习算法公式梳理

              机器学习方法有一个进阶的过程,不同的方法族,都有其基础和逐渐进化的模型.每一个更新的模型一般是对上一个简单模型的改进,比如SVM就直接改进了近邻方法,降低了保留的实例个数.     ...

  6. 推荐文章:机器学习:“一文读懂机器学习,大数据/自然语言处理/算法全有了...

    PS:文章主要转载自CSDN大神"黑夜路人"的文章:           http://blog.csdn.NET/heiyeshuwu/article/details/43483 ...

  7. azure机器学习_Azure机器学习中的数据清理

    azure机器学习 介绍 (Introduction) After discussing the basic features of Azure Machine Learning in my prev ...

  8. 机器学习科普文章:“一文读懂机器学习,大数据/自然语言处理/算法全有了”

    PS:文章主要转载自CSDN大神"黑夜路人"的文章:           http://blog.csdn.net/heiyeshuwu/article/details/43483 ...

  9. ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

    ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻 ...

最新文章

  1. 最早接触到的计算机编程语言——c语言
  2. 迎接5G普及风暴,还缺这把「万能钥匙」
  3. bzoj 3572 [Hnoi2014]世界树——虚树
  4. React Native Weex 区别
  5. c 类别构造函数需要包含所有成员吗_C++默认成员函数解析
  6. linux命令cp命令行参数,linux命令之cp命令参数及用法详解
  7. 入侵韩国某购物网并提权
  8. linux线程组和进程区别,Linux中进程和线程之间的区别
  9. 【优化预测】基于matlab蝙蝠算法优化SVM预测【含Matlab源码 141期】
  10. 城通网盘文件地址分析器
  11. Qt 将中文汉字转成拼音与简拼
  12. 如何解决上传到github上的图片显示不出来的问题
  13. 计算机专业用学c4d吗,C4D软件学会要多久?学完后好就业吗?
  14. 中英三校合作开发新电池结构,可用于改善可穿戴设备体验
  15. 地面分辨率,空间分辨率(GSD为地面采样间隔)
  16. STM32之ADC实验
  17. 要想富,先有LU,超能鹿战队LU开盘涨幅240%
  18. python数据分析的四阶段以及电商数据描述性分析和探索性分析
  19. STM32G474 基于IRTIM外设实现红外接收
  20. 肖 清华计算机系 北大生命科学,7个清华北大,11+复旦交大,后续还有一大波浙大……他们都是同班同学!...

热门文章

  1. mysql行列转换_Excel、SQL、Python分别实现行列转换
  2. sql跨表查询_跨表查询经常有,何为跨表更新?
  3. ubuntu下使用crontab定时器
  4. C++ STL 常用查找算法
  5. MySQL 参数autoReconnect=true 解决8小时连接失效(转)
  6. Linux运行Java出现“Exception in thread main java.lang.OutOfMemoryError: Java heap space”报错...
  7. 工匠精神,缔造美国净水传奇
  8. DBA(六):MHA集群
  9. Word2016此功能看似已中断...
  10. UEFI引导的系统下装双系统解决方案