Dataset之Boston:Boston波士顿房价数据集的简介、下载、使用方法之详细攻略
Dataset之Boston:Boston波士顿房价数据集的简介、下载、使用方法之详细攻略
目录
Boston波士顿房价数据集的简介
Boston波士顿房价数据集的下载
Boston波士顿房价数据集的使用方法
Boston波士顿房价数据集的简介
该数据集包含美国人口普查局收集的美国马萨诸塞州波士顿住房价格的有关信息, 数据集很小,只有506个案例。
数据集都有以下14个属性:
- CRIM--城镇人均犯罪率 ------【城镇人均犯罪率】
- ZN - 占地面积超过25,000平方英尺的住宅用地比例。 ------【住宅用地所占比例】
- INDUS - 每个城镇非零售业务的比例。 ------【城镇中非商业用地占比例】
- CHAS - Charles River虚拟变量(如果是河道,则为1;否则为0 ------【查尔斯河虚拟变量,用于回归分析】
- NOX - 一氧化氮浓度(每千万份) ------【环保指标】
- RM - 每间住宅的平均房间数 ------【每栋住宅房间数】
- AGE - 1940年以前建造的自住单位比例 ------【1940年以前建造的自住单位比例 】
- DIS -波士顿的五个就业中心加权距离 ------【与波士顿的五个就业中心加权距离】
- RAD - 径向高速公路的可达性指数 ------【距离高速公路的便利指数】
- TAX - 每10,000美元的全额物业税率 ------【每一万美元的不动产税率】
- PTRATIO - 城镇的学生与教师比例 ------【城镇中教师学生比例】
- B - 1000(Bk - 0.63)^ 2其中Bk是城镇黑人的比例 ------【城镇中黑人比例】
- LSTAT - 人口状况下降% ------【房东属于低等收入阶层比例】
- MEDV - 自有住房的中位数报价, 单位1000美元 ------【自住房屋房价中位数】
Boston波士顿房价数据集的下载
下载地址:https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data
from sklearn.datasets import load_bostonboston = load_boston()
print(boston.DESCR) Boston House Prices dataset
===========================Notes
------
Data Set Characteristics: :Number of Instances: 506 :Number of Attributes: 13 numeric/categorical predictive:Median Value (attribute 14) is usually the target:Attribute Information (in order):- CRIM per capita crime rate by town- ZN proportion of residential land zoned for lots over 25,000 sq.ft.- INDUS proportion of non-retail business acres per town- CHAS Charles River dummy variable (= 1 if tract bounds river; 0 otherwise)- NOX nitric oxides concentration (parts per 10 million)- RM average number of rooms per dwelling- AGE proportion of owner-occupied units built prior to 1940- DIS weighted distances to five Boston employment centres- RAD index of accessibility to radial highways- TAX full-value property-tax rate per $10,000- PTRATIO pupil-teacher ratio by town- B 1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town- LSTAT % lower status of the population- MEDV Median value of owner-occupied homes in $1000's:Missing Attribute Values: None:Creator: Harrison, D. and Rubinfeld, D.L.
This dataset was taken from the StatLib library which is maintained at Carnegie Mellon University.
The Boston house-price data of Harrison, D. and Rubinfeld, D.L. 'Hedonic
prices and the demand for clean air', J. Environ. Economics & Management,
vol.5, 81-102, 1978. Used in Belsley, Kuh & Welsch, 'Regression diagnostics
...', Wiley, 1980. N.B. Various transformations are used in the table on
pages 244-261 of the latter.
The Boston house-price data has been used in many machine learning papers that address regression
problems. **References**- Belsley, Kuh & Welsch, 'Regression diagnostics: Identifying Influential Data and Sources of Collinearity', Wiley, 1980. 244-261.- Quinlan,R. (1993). Combining Instance-Based and Model-Based Learning. In Proceedings on the Tenth International Conference of Machine Learning, 236-243, University of Massachusetts, Amherst. Morgan Kaufmann.- many more! (see http://archive.ics.uci.edu/ml/datasets/Housing)
Boston波士顿房价数据集的使用方法
1、更多详见本博客算法案例
X = boston.data
y = boston.target
Dataset之Boston:Boston波士顿房价数据集的简介、下载、使用方法之详细攻略相关推荐
- Dataset:GiveMeSomeCredit数据集的简介、下载、使用方法之详细攻略
Dataset:GiveMeSomeCredit数据集的简介.下载.使用方法之详细攻略 目录 GiveMeSomeCredit数据集的简介 1.数据集基本描述 2.EDA后总结 3.数据集基本形状 G ...
- Dataset之babyboom.dat:babyboom.dat数据集的简介、安装、使用方法之详细攻略
Dataset之babyboom.dat:babyboom.dat数据集的简介.安装.使用方法之详细攻略 目录 babyboom.dat数据集的简介.安装.使用方法 babyboom.dat数据集的简 ...
- Dataset:fetch_20newsgroups(20类新闻文本)数据集的简介、安装、使用方法之详细攻略
Dataset:fetch_20newsgroups(20类新闻文本)数据集的简介.安装.使用方法之详细攻略 目录 fetch_20newsgroups(20类新闻文本)数据集的简介 1.数据集信息 ...
- Dataset之MapillaryVistas:MapillaryVistas数据集的简介、下载、使用方法之详细攻略
Dataset之MapillaryVistas:MapillaryVistas数据集的简介.下载.使用方法之详细攻略 目录 MapillaryVistas数据集的简介 1.数据集特点 Mapillar ...
- Dataset之CamVid:CamVid数据集的简介、下载、使用方法之详细攻略
Dataset之CamVid:CamVid数据集的简介.下载.使用方法之详细攻略 目录 CamVid数据集的简介 CamVid数据集的下载 CamVid数据集的使用方法 CamVid数据集的简介 Ca ...
- Dataset之BDD100K:BDD100K数据集的简介、下载、使用方法之详细攻略
Dataset之BDD100K:BDD100K数据集的简介.下载.使用方法之详细攻略 目录 BDD100K数据集的简介 BDD100K数据集的下载 BDD100K数据集的使用方法 BDD100K数据集 ...
- Dataset之Knifey-Spoony:Knifey-Spoony数据集的简介、下载、使用方法之详细攻略
Dataset之Knifey-Spoony:Knifey-Spoony数据集的简介.下载.使用方法之详细攻略 目录 Knifey-Spoony数据集的简介 ##The Knifey-Spoony Da ...
- Dataset之WebVision:WebVision数据集简介、下载、使用方法之详细攻略
Dataset之WebVision:WebVision数据集简介.下载.使用方法之详细攻略 目录 WebVision数据集简介 1.WebVision数据集挑战 WebVision数据集下载 WebV ...
- Dataset之Fashion-MNIST:Fashion-MNIST数据集简介、下载、使用方法之详细攻略
Dataset之Fashion-MNIST:Fashion-MNIST数据集简介.下载.使用方法之详细攻略 目录 Fashion-MNIST数据集简介 1.Why we made Fashion-MN ...
最新文章
- 如何从文件系统中读取文件内容
- 第十八节:跨域请求的解决方案和WebApi特有的处理方式
- 局部变量竟然比全局变量快 5 倍?
- 从零开始学前端:列表标签 --- 今天你学习了吗?(CSS:Day06)
- linux 下测速时间分析
- zabbix 2.2节点批量安装
- InfoWorld 公布开源软件( 2019 年)
- 字符集在本地化过程中的影响
- win10下rdlc报表在vs(visual studio)中中文显示小方块的批量处理解决方法
- oracle查询asm的绝对路径,查找ASM 1号文件位置
- 阿里云备案服务号是什么怎么用?
- iOS小知识: 使用bugly上报自定义错误信息进行数据监控
- 微信公众号分享配置无效。。分享出来的只是纯链接了,如何自定义微信公众号的分享
- BIGD牛魔王UI图标设计iocn主题设计全套高清视频教程
- Pacemaker入门手册
- 机器学习9 -- 模型压缩和加速
- mysql5.7内存占用_解决mysql升级到5.7内存占用过大问题
- [JAVA加解密]RSA算法、ElGamal算法
- 在python语言中定义类的关键字是_Python 使用 _________________ 关键字来定义类。_学小易找答案...
- 存储系统设计——NVMe SSD性能影响因素一探究竟
热门文章
- services.xml应该放在项目的哪里_行车中手机支架到底应该放在哪里呢?出风口、方向盘、仪表台?...
- Armv8-A 架构概述
- CF981H K Paths
- [不屈的复习] - 编辑工具IDE选取与Hello World
- day2编写购物商城(1)
- ArcGIS JS API 4.X实现动态地图服务子图层显隐控制
- keepalived主从模式监测nginx
- 我画了35张图,就是为了让你深入理解 AQS
- PO,VO,DAO,BO,POJO 之间的区别你懂吗?
- 厉害了,淘宝千万并发,14 次架构演进…