数据集下载易一网络科技 - 付费文章​www.intumu.com

加载数据

import pandas as pd

df=pd.read_csv("MYUNOI.csv") # "石景山","丰台","朝阳","海淀","东城","西城"

df.head()

dist roomnum halls AREA floor subway school price 0 chaoyang 1 0 46.06 middle 1 0 48850 1 chaoyang 1 1 59.09 middle 1 0 46540 2 haidian 5 2 278.95 high 1 1 71662 3 haidian 3 2 207.00 high 1 1 57972 4 fengtai 2 1 53.32 low 1 1 71268

import warnings

warnings.filterwarnings("ignore")

是否有空值

df.isnull().any()

dist False

roomnum False

halls False

AREA False

floor False

subway False

school False

price False

dtype: bool

数据分割

X0, y = df.iloc[:,1:-1],df.iloc[:,-1]

from sklearn.preprocessing import OrdinalEncoder, LabelEncoder,OneHotEncoder

# 对非数字列进行编码

X = OrdinalEncoder().fit_transform(X0)

# X = OneHotEncoder().fit_transform(X) #http://localhost:8888/notebooks/20190819yellowbrick/08-Learning

# y = LabelEncoder().fit_transform(y0)

特征分析

features = X0.columns.tolist()

from yellowbrick.features.importances import FeatureImportances

model = LassoCV(alphas=alphas,cv=5)

viz = FeatureImportances(model, labels=features)

viz.fit(X, y)

viz.poof()

注:学区、地铁,这是必然的!

Alpha参数选取

import numpy as np

from sklearn.linear_model import LassoCV

from yellowbrick.regressor import AlphaSelection

alphas = np.logspace(-10, 1, 400)

# 可视化及验证

model = LassoCV(alphas=alphas,cv=5)

visualizer = AlphaSelection(model)

visualizer.fit(X, y)

visualizer.poof()

使用Alpha参数评估预测结果

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

from sklearn.linear_model import Ridge

from yellowbrick.regressor import PredictionError

visualizer = PredictionError(Ridge(alpha=0.4381))

visualizer.fit(X_train, y_train)

visualizer.score(X_test, y_test)

visualizer.poof()

学习曲线

from sklearn.linear_model import RidgeCV

from yellowbrick.model_selection import LearningCurve

model = RidgeCV()

visualizer = LearningCurve(model, scoring='r2')

visualizer.fit(X, y)

visualizer.poof()

持久化(略)

新手可查阅历史目录:yeayee:Python数据分析及可视化实例目录​zhuanlan.zhihu.com

python房价数据挖掘_Python数据分析及可视化实例之帝都房价预测相关推荐

  1. python信用卡违约_Python数据分析及可视化实例之银行信用卡违约预测(24)

    1.项目背景: 银行体系对于信用可违约进行预测,原始数据集如下: 2.分析步骤: (1)数据清洗(Data Cleaning) (2) 探索性可视化(Exploratory Visualization ...

  2. python数据分析可视化实例_Python数据分析及可视化实例之基于Kmean分析RFM进行用户关怀...

    系列文章总目录:Python数据分析及可视化实例目录 数据集下载 Python数据分析及可视化实例之全国各城市房价分析(含数据采集) Python数据分析及可视化实例之帝都房价预测 Python数据分 ...

  3. python信用卡违约预测分析_Python数据分析及可视化实例之银行信用卡违约预测(24)...

    1.项目背景: 银行体系对于信用可违约进行预测,原始数据集如下: 2.分析步骤: (1)数据清洗(Data Cleaning) (2) 探索性可视化(Exploratory Visualization ...

  4. python从mongodb里取出数据进行可视化_Python数据分析及可视化实例之MongoDB增删改查...

    1.MongoDB安装 有时候度娘还是给力的,相反一些博客的安装方法则显得凌乱: 最初使用Win7安装经常会出现意料不到的错误, 比如开机启动服务,服务器日志等. 上面链接安装步骤简单,没有炫技的成分 ...

  5. python数据预测案例_Python数据分析及可视化实例之疾病预测(分类)

    Talk is cheap , show U the code. 该源码注释比较全面,需要对SKlearn有一定的了解, 当然,你也可以把它视作黑箱,做个调包侠也是大侠, 没错,本主用Bokeh进行可 ...

  6. python分析数据走势_Python数据分析及可视化实例之个股走势预测(26)

    1.项目背景: 仅仅用来练手,个股走势如果真预测准确了,都就改行当操盘手了,哈哈! 但话又说回来,如果把数据曲线特征提取出来,再进行对比异常判断,也是可以的. 数据源,请关注微信公众号:海豹战队,回复 ...

  7. python数据分析实例_Python数据分析及可视化实例之爬虫源码(05)

    1.背景介绍 (1)在注册了某网站之后,发现站内个人页面有个关于京杭大运河的征文.再加上之前,九寨沟地震第一时间机器人写了一篇通讯稿.于是我就在想,既然机器可以写通讯稿,那么是不是也可以用来写篇关于京 ...

  8. mongodb 3.4 安装_Python数据分析及可视化实例之CentOS7.2+MongoDB V3.4 安装

    系列文章总目录:Python数据分析及可视化实例目录 我不是程序员,也不是设计师,我只是碰巧有一些想法和一台电脑. I am not a designer nor a coder. I'm just ...

  9. jupyter 数据分析可视化案例_Python数据分析及可视化实例之Anaconda、Jupyter简介

    系列文章总目录:Python数据分析及可视化实例目录 简介部分依然是搬运工的活, 尽可能搬点有用的少占地方. 1.Anaconda 在win平台下用Anaconda再好不过了, 基本上继承了所有数据分 ...

最新文章

  1. 修改windows cmd f2快捷_第三课——win10常用快捷键的使用
  2. finally代码块和return的执行顺序问题
  3. 闲来无事,做了个简单的在线编辑的mock服务
  4. 居家学习的核心操作准则:45分钟的专注
  5. kubectl 命令管理(1)
  6. windows命令提示符_如何个性化Windows命令提示符
  7. 一定质量的封闭气体被压缩后_多晶硅氯氢化装置补充氢隔膜压缩机十字头铜套磨损原因分析与改善探讨...
  8. leetcode - 413. 等差数列划分
  9. 紧急救援 L2-001 dijkstra 打印路径 最短路条数 权值
  10. 别再写 main 方法测试了,太 Low,这才是专业 Java 测试方法
  11. C语言初学者编程游戏(猜数字)
  12. 数学建模笔记——评价类模型(二)
  13. virt-install命令详解
  14. u大侠pe系统桌面计算机,如何使用U大侠PE系统修复引导文件
  15. 首字母排序侧边索引栏:WaveSideBar的简单使用
  16. 全国中学生计算机大赛+试题,全国青少年信息学奥林匹克竞赛(NOI2018)正式开幕(附day1试题)...
  17. csdn中的markdown编辑器如何快速复制粘贴图片?
  18. 5.从键盘接收一百分制成绩 (0~100)
  19. 个人觉得比较好的网站、博客、文章
  20. CC2530的ADC工作原理与应用

热门文章

  1. 使用 Apache Hadoop 处理日志
  2. html怎么做成响应式的,怎么用html5完成响应式布局?
  3. c语言的递归定义有两个要素,C语言-chap8function.ppt
  4. python 库总结_最近用的python 库总结
  5. 常见问题_轴承零件加工常见问题?
  6. 职中计算机应用基础期末考试题,职中计算机应用基础期末试卷.doc
  7. APP UI自动化测试:框架选择、环境搭建、脚本编写……全总结
  8. linux 驱动编译静态,Linux驱动静态编译和动态编译方法详解
  9. matlab图像处理宝典 秦襄培,秦襄培
  10. win10安装ubuntu子系统,然后安装python3.6