Python 决策树预测 分类算法
准备工作:
安装pandas
pip3 install pandas
数据加载和清洗
import os
import numpy as np
import pandas as pd
home_folder = os.path.expanduser("~")#os.path.expanduser(path) 把path中包含的"~"和"~user"转换成用户目录
data_folder = os.path.join(home_folder, "Data", "basketball")
data_filename = os.path.join(data_folder, "leagues_NBA_2014_games_games.csv")#数据文件名
results = pd.read_csv(data_filename)#加载数据集
results.ix[:5]#输出前5行,ix索引数据
#results = pd.read_csv(data_filename, parse_dates=["Date"], skiprows=[0,])#parse_dates解析“Date”的值为日期; skiprows需要跳过的行号列表(从0开始)
results = pd.read_csv(data_filename, parse_dates=["Date"])#当前文件第一行不为空,不需要跳过
results.columns = ["Date", "Start", "Visitor Team", "VisitorPts", "Home Team", "HomePts", "Score Type","OT?", "Notes"]#修改列名results.ix[:5]
提取新特征
results["HomeWin"] = results["VisitorPts"] < results["HomePts"]#找出主场获胜的队伍
y_true = results["HomeWin"].values#保存为类别数据,方便scikit-learn后续分析
print("Home Win percentage:{0:.1f}%".format(100*results["HomeWin"].sum()/results["HomeWin"].count()))#count返回数据长度results["HomeLastWin"] = False#创建新特征
results["VisitorLastWin"] = False#创建新特征from collections import defaultdict
won_last = defaultdict(int)for index, row in results.sort_values("Date").iterrows():#sort_values将results按时间顺序排序,获取每行的index、rowhome_team = row["Home Team"]visitor_team = row["Visitor Team"]row["HomeLastWin"] = won_last[home_team]row["VisitorLastWin"] = won_last[visitor_team]results.loc[index] = row#更新当前行数据 # Set current winwon_last[home_team] = row["HomeWin"]won_last[visitor_team] = not row["HomeWin"]results.ix[20:25]
决策树
scikit-learn库生成决策树的默认算法是分类回归树算法(Classification and Regression Trees, CART)
Python 决策树预测 分类算法相关推荐
- python决策树 多分类_Python中的决策树分类:您需要了解的一切
python决策树 多分类 什么是决策树? (What is Decision Tree?) A decision tree is a decision support tool that uses ...
- 【2016年第1期】基于大数据的小麦蚜虫发生程度决策树预测分类模型
张晴晴,刘勇,牟少敏,温孚江 山东农业大学农业大数据研究中心,山东 泰安 271018 摘要:小麦蚜虫是危害小麦的主要害虫.其发生程度预测特别是短期预测一直是植物保护领域难以解决的科学问题.传统预测方 ...
- python决策树预测_决策树案例:基于python的商品购买能力预测系统
数据分析入门与实战 公众号: weic2c http://www.cnblogs.com/baiboy/p/ml3.html 目录 1 决策树/判定树(decision tree) 2 构造决策树的 ...
- python分类算法_用Python实现KNN分类算法
本文实例为大家分享了Python KNN分类算法的具体代码,供大家参考,具体内容如下 KNN分类算法应该算得上是机器学习中最简单的分类算法了,所谓KNN即为K-NearestNeighbor(K个最邻 ...
- python决策树 value_机器学习 | 算法笔记(四)- 决策树算法以及代码实现
概述 上一篇讲述了<机器学习 | 算法笔记(三)- 支持向量机算法以及代码实现>,本篇讲述机器学习算法决策树,内容包括模型介绍及代码实现. 决策树 决策树(Decision Tree)在机 ...
- 利用python语言实现分类算法_使用python实现kNN分类算法
k-近邻算法是基本的机器学习算法,算法的原理非常简单: 输入样本数据后,计算输入样本和参考样本之间的距离,找出离输入样本距离最近的k个样本,找出这k个样本中出现频率最高的类标签作为输入样本的类标签,很 ...
- Python实现knn分类算法(Iris 数据集)
1.KNN分类算法 KNN分类算法(K-Nearest-Neighbors Classification),又叫K近邻算法,是一个概念极其简单,而分类效果又很优秀的分类算法. 他的核心思想就是,要确定 ...
- 使用Python处理KNN分类算法
简介: 我们在这世上,选择什么就成为什么,人生的丰富多彩,得靠自己成就.你此刻的付出,决定了你未来成为什么样的人,当你改变不了世界,你还可以改变自己. KNN分类算法的介绍 KNN分类算法(K-Nea ...
- 数据挖掘-决策树ID3分类算法的C++实现
数据挖掘课上面老师介绍了下决策树ID3算法,我抽空余时间把这个算法用C++实现了一遍. 决策树算法是非常常用的分类算法,是逼近离散目标函数的方法,学习得到的函数以决策树的形式表示.其基本思路是不断选取 ...
最新文章
- 【keras】Input 0 of layer conv2d is incompatible with the layer. expected ndim=4, found ndim=3
- 辩论届人机大战:IBM新AI完胜人类冠军!
- 信息学奥赛一本通 1059:求平均年龄 | OpenJudge NOI 1.5 01
- 苹果CMSV10仿腾云网模板
- wait_event_interruptible 在驱动中的应用
- suse 安装php5.4_SUSE LINUX 安装Apache2 + PHP5 (普通安装,不是yum)
- python切片的对象_Python 对象切片
- Android App罕见错误和优化方案
- python的一些解释
- 从来如此,那便对么。 鲁迅
- docker 常用命令
- 《深入理解计算机系统》Lab2-Bomblab
- 计算机生命科学研究系,生命科学与计算机科学的结合发展研究
- python使用 docx 库操作 docx 格式文件
- Django创建加法计算器
- 服务器usb驱动安装系统安装失败怎么办,Win7系统安装USB3.0驱动程序失败怎么办?Win7系统安装USB3.0驱动程序失败的解决方法...
- 手撕python_手撕编译器(一)——编译原理简介
- DAPP实现Metamask自动添加网络和切换网络
- 【book 120】My Brief History By Stephen Hawking
- 无线数传GPRS DTU名词详解(TCP/IP、AT指令、GPRS DTU、心跳包)
热门文章
- 百岁老人畅谈百年交大桥梁[转]
- Linux系统装进U盘里,制作随身携带的便捷系统
- wordpress4.4禁用自动保存草稿和去除文章修订的方法
- c#chart 的x轴设置时间格式,第一个坐标从0开始
- 构建Java体系之感悟系列(一)
- mysql8 内存设置_高性能的MySQL(8)优化服务器配置一内存
- Duplicate class com.amap.api.fence.DistrictItem found in modules jetified-3dmap-9.3.1.jar (com.amap.
- 全面质量管理 - TQM Diagram
- 计算机中真值的概念,真值和机器数概念
- 【ICCV19 超分辨】Deep SR-ITM: Joint Learning of Super-Resolution and Inverse Tone-Mapping for 4K UHD HDR