python机器学习——加州房价

跟随kaggle课程练习


学习内容:

L3:
1、 选择建模数据

# 数据经度、纬度、住房年龄中位、一个街区内的总房屋数、一个街区内的总卧室数、
# 人口、家庭总数、收入中位数、房屋价值中位数、是否近海
# 一个街区内的总卧室数有部分缺失值import pandas as pd
from sklearn.tree import DecisionTreeRegressor
house_file_path = 'Datasets\California Housing Prices\housing.csv'
house_data = pd.read_csv(house_file_path)

2、 处理缺失值

filtered_house_data = house_data.dropna(axis=0)
# 过滤有缺失值的行

3、 选择预测目标

house_predict = ['median_house_value']
y = filtered_house_data[house_predict]  # 将房屋价格中位数设置为预测目标y

4、 选择特征

house_features = ['housing_median_age','total_rooms','total_bedrooms','population','households','median_income']
x = filtered_house_data[house_features]  # 设置特征为x(特征:影响目标的因素)

4、 构建模型

house_model = DecisionTreeRegressor(random_state=1)
# 定义模型。为random_state指定一个数字以确保每次运行都得到相同的结果
house_model.fit(x, y)  # 捕获预测目标和特征

5、输出
我们将对训练数据的前几行进行预测,以了解predict函数是如何工作的。

print("Predictions for the following :")
print(house_data.head())
print("The predictions are")
print(house_model.predict(x.head()))

运行结果:

Predictions for the following :longitude  latitude  ...  median_house_value  ocean_proximity
0    -122.23     37.88  ...            452600.0         NEAR BAY
1    -122.22     37.86  ...            358500.0         NEAR BAY
2    -122.24     37.85  ...            352100.0         NEAR BAY
3    -122.25     37.85  ...            341300.0         NEAR BAY
4    -122.25     37.85  ...            342200.0         NEAR BAY[5 rows x 10 columns]
The predictions are
[452600. 358500. 352100. 341300. 342200.]

python机器学习——加州房价相关推荐

  1. 【机器学习实用指南】加州房价中位数预测

    加州房价预测 # 同时支持python2和python3 from __future__ import division,print_function,unicode_literals# 常用库 im ...

  2. 波士顿房价预测python代码_Python之机器学习-波斯顿房价预测

    AI 人工智能 Python之机器学习-波斯顿房价预测 波士顿房价预测 导入模块 import pandas as pd import numpy as np import matplotlib.py ...

  3. Python机器学习/数据挖掘项目实战 波士顿房价预测 回归分析

    Python机器学习/数据挖掘项目实战 波士顿房价预测 回归分析 此数据源于美国某经济学杂志上,分析研究波士顿房价( Boston HousePrice)的数据集. 在这个项目中,你将利用马萨诸塞州波 ...

  4. python机器学习——支持向量机回归与波士顿房价案例

    支持向量机回归与波士顿房价案例 一.从传统回归模型到支持向量回归模型 二.核函数 三.常用的几种核函数 四.SVM 算法的优缺点 五.建模实例 (1)导入数据 (2)划分训练集测试集 (3)数据标准化 ...

  5. Python机器学习框架介绍

    目录 1 为什么选择用Python 2 机器学习和深度学习框架 2.1 Pandas 2.2 Num Py 2.3 Matplotlib 2.4 Seaborn 2.5 Scikit-learn 2. ...

  6. 1-2 用Python编写【房价预测】模型----paddle

    课程>我的课程>百度架构师手把手教深度学习>1-2 用Python编写[房价预测]模型> 1-2 用Python编写[房价预测]模型 paddle初级教程第一章 第二节 王然( ...

  7. Python机器学习--回归

    线性回归 # -*- coding: utf-8 -*- """ Created on Wed Aug 30 19:55:37 2017@author: Administ ...

  8. python常用代码入门-入门十大Python机器学习算法(附代码)

    入门十大Python机器学习算法(附代码) 今天,给大家推荐最常用的10种机器学习算法,它们几乎可以用在所有的数据问题上: 1.线性回归 线性回归通常用于根据连续变量估计实际数值(房价.呼叫次数.总销 ...

  9. 小象python培训班_小象最新Python机器学习升级版视频学习教程 共24节精品课

    小象最新Python机器学习升级版视频学习教程 共24节精品课 本课程特点是从数学层面推导最经典的机器学习算法,以及每种算法的示例和代码实现(Python).如何做算法的参数调试.以实际应用案例分析各 ...

  10. Python机器学习基础篇二《监督学习》

    前言 前期回顾: Python机器学习基础篇一<为什么用Python进行机器学习> 前面说过,监督学习是最常用也是最成功的机器学习类型之一.本章将会详细介绍监督学 习,并解释几种常用的监督 ...

最新文章

  1. 如何在主机win10和虚拟机(virtualbox)中的Ubuntu进行文件传输即共享文件夹的建立
  2. linux 源码目录结构 文件系统目录结构
  3. 有关Visual Studio 2008 SP1和SQL Server 2008的一些说明
  4. Eclipse 创建web项目后没有 Java EE 5 Library,没有web开发相关基础java包,myeclipse中有。...
  5. 16道关于Python基础方面的练习题
  6. 招聘:兼职ASP.NET 开发工程师
  7. 纹理特征:灰度共生矩阵
  8. xss 表单劫持(from通用明文记录)
  9. .php t=,关于php:意外的T_VARIABLE,期望T_FUNCTION
  10. Eclipse 【3.4】 版本安装【插件】时的【dropins】 目录
  11. jquery-ajax请求.NET MVC 后台
  12. 使用docker搭建db2数据库
  13. 读书笔记:Hadoop权威指南 简介
  14. 【华为校招】【校招】【Java】叠积木
  15. 非功能性需求基础概念
  16. 关于软件开发项目任务的横向分解和纵向分解
  17. linux编译文件 no such,Linux中编译或安装程序时提示No such file or directory
  18. 黑客攻防技术宝典Web实战篇(第二版)_读书笔记(第一章~第三章)
  19. 网页.css的文件的写法
  20. python 读取地震道头数据_使用python获取(宜宾市地震信息)地震信息

热门文章

  1. 外星人17r4原版系统_外星人Alienware 17R4 测评/升级
  2. java.util之ArrayList使用
  3. 大数据可视化--全球分布散点图
  4. Windows 小工具软件:截屏,录音,音频转换
  5. element 日期选择器不能选择当天日期以后的日期
  6. 搜索引擎代码资源[转]
  7. 输入身高体重测身材_【测试】你的身材标准吗? 附赠20-39岁成年人身高体重评分标准...
  8. 杂项-Java:JCP
  9. 约分最简分式 (15 分)
  10. c语言静态变量总结,c语言什么是静态变量