1、 预测型数据分析:回归、分类和聚类3.1回归:对数值型变量进行预测

例子:预测股票、房价、空气质量

分析两组变量之间的关系

x:自变量(特征)

y:因变量

通过x,预测y : f(x)=y

x:房子大小;y:房子价格

回归经典方法线性回归

监督学习:已有一些训练样本(训练集),同时知道x和y

OLS(Ordinary Least Squares):使得预测的y和真实的y在训练集上误差的平方最小

以鸢尾花数据集为例

#导入数据集

import pandas as pd

url = 'https://www.gairuo.com/file/data/dataset/iris.data'

df = pd.read_csv(url)

df

#观察数据集,变量之间的关系需要借助经验及专业知识

import seaborn as sns

%matplotlib inline

sns.regplot(x="petal_width",y="petal_length",data=df)

#训练模型,得出截距和相关系数

from sklearn import linear_model

lm=linear_model.LinearRegression()

features=["petal_width"]

X=df[features]

y=df["petal_length"]

model=lm.fit(X,y)

print(model.intercept_,model.coef_)

#y=1.090572145877378+2.22588531*x

#求出预测值

import numpy as np

new_x = 3

new_x = np.array(new_x).reshape(1, -1)

pre_y = model.predict(new_x)

print(pre_y)

#多个因变量时

from sklearn import linear_model

lm=linear_model.LinearRegression()

features=["petal_width","sepal_length"]

X=df[features]

y=df["petal_length"]

model=lm.fit(X,y)

print(model.intercept_,model.coef_)

#y=-1.5023745801152821+1.74439298*x1+0.54251492*x2

import numpy as np

new_x = [2,6.5]

new_x = np.array(new_x).reshape(1, -1)

pre_y = model.predict(new_x)

print(pre_y)

#预测性能的评估:训练集/测试集划分

将所有已知X和y的样本划分为训练集和测试集

常用的划分比例为8:2或9:1

##交叉检验(cross-validation)

保证每一个样本都会被测试过一次

scikit-Learn中进行交叉检验

from sklearn.model_selection import cross_val_score

score=-cross_val_score(lm,X,y,cv=5,scoring="neg_mean_absolute_error")

score

#常规的操作是取误差的平均值作为最终的衡量比较,值越小越好

import numpy as np

print(np.mean(score)

#cv=5:交叉检验的次数为5次

回归常用的打分函数:

“neg_mean_absolute_error”

平均绝对误差

MAE=

“neg_mean_squared_error”

均方误差

MSE=

例如:C站(CSDN)能力认证中心

西安python培训价格相关推荐

  1. 西安python培训班多少钱-西安python培训多少钱?

    西安python培训多少钱?近年来,随着国家对人工智能和相关人才培养的重视,python已经被纳入教育体系的各个阶段, python作为一种新兴的编程语言,发展极为迅速.在此背景下很多小伙伴开始准备学 ...

  2. 在python培训价格

    Python培训价格是多少?书声琅琅教育番茄老师微信pykf20介绍,python培训在近年来非常火爆,主要原因利益于python的快速发展,python从业人员紧缺,因此对于许多不有学过python ...

  3. Python培训价格多少

    前言 Python培训价格是多少?书声琅琅教育番茄老师 介绍,python培训在近年来非常火爆,主要原因利益于python的快速发展,python从业人员紧缺,因此对于许多不有学过python的朋友来 ...

  4. python培训价格-python培训价格

    python培训价格根据所报读的班级不同,价格从一万到两万四不等,详情请咨询客服.Python语言能做到的东西还是比较多的,像大家都比较熟悉的爬虫.web应用开发.人工智能.数据分析等等,Python ...

  5. python培训中心-西安python培训中心

    导语概要 西安python培训中心,小编给大家推荐西安北大青鸟教育,西安北大青鸟教育针对想要提升自己的学员,为学员安排了知识点分享,课程全程1对1授课,还为学员量身制定学习方案,保障学员在学习上的高效 ...

  6. python培训价格-苏州python培训价格

    苏州python培训价格 来源:教育联展网 编辑:卷卷 发布时间:2020-03-18 导语概要 苏州高博应诺Python培训面向真实产业AI需求弄潮新时代冲击新未来快速咨询人工智能已广泛应用黄金时代 ...

  7. python培训价格多少钱

    众所周知,Python是人工智能时代的首选语言,近两年人工智能的兴起让Python一度成为最受欢迎的编程语言之一.想要学习Python的人也越来越多,那么成都Python培训学费多少?是很多初学Pyt ...

  8. python培训价格多少呢-python培训得花多少钱呢?

    Python是一种用于web开发.机器学习和复杂数据分析的通用解释性编程语言.对于初学者来说,Python是一种完美的语言,因为它容易学习和理解.而且,随着这种语言的流行,python程序员得到了越来 ...

  9. 北京python培训价格多少

    现在Python语言火爆,更是受到国家的重视,甚至很多小学都开始开设课程进行学习,随之市场占有率也越来越高.由于Python简单直接,比较适合初学者学习,也让很多人想要通过Python培训机构进行学习 ...

最新文章

  1. hduoj4092 Yummy Triangular Pizza(打表)
  2. 完整适配LUCI界面的Openwrt中EC20的QMI拨号
  3. ffmpeg源码学习之time_base
  4. [高中作文赏析]相约
  5. Python学习笔记:序列之字符串
  6. mysql一行转多行
  7. 读《scikiit-learn机器学习》支持向量机
  8. 孙鑫VC学习笔记:第三讲 MFC应用程序框架
  9. [QT]文件夹过滤问题
  10. 2000-2019全国各省分品种能源消费量
  11. 怎么查看计算机办公软件版本的,怎样查看电脑用的什么办公软件
  12. NPN与PNP型传感器的区别
  13. iMazing安装教程 v2.11.7pjb
  14. 极光推送完整流程测试
  15. 计算机底层:进程与线程。
  16. 云服务器1M带宽是上传吗,云主机1m带宽能干嘛?
  17. linux系统中XLib在什么位置,什么是glibc?glibc是什么?什么是freetype?freetype是什么?什么是?Xlib是什么?什么是lo...
  18. 介绍一款LaTeX编辑器——LyX
  19. 闪光网-彭亮《学后感——彭亮总结》
  20. 应付帐款—制单处理,出现“供应商被锁定”的解决方法

热门文章

  1. Linux解决syntax error near unexpected token`问题
  2. Git工具调优--GitFlow
  3. 【密码学】——初识JAVA加密体系(JCA)
  4. JAVA开源资源(非大全)
  5. 台湾云门舞集今年将赴北京、上海等地巡演
  6. 四面快手、终拿Offer,想告诉你的一些事情
  7. JDK1.7 api 中文(不是全中文)
  8. OSChina 周六乱弹 ——这么桃色的故事,让张老汉讲述……
  9. vue实现单选做题根据对错标色,作对跳转下一题,实现思路详解
  10. java下载m3u8视频,解密并合并ts(二)