算法实践1_线性回归
参数解释
sklearn.linear_model.LinearRegression(fit_intercept=True, normalize=False, copy_X=True, n_jobs=None) |
---|
超参 | 解释 | 类型(默认值) |
---|---|---|
fit_intercept | 是否计算模型的截距;如果设置为 False,计算将不使用截距(即:期望数据已经进行了中心化处理) | boolean(True) |
normalize | 是否将数据归一化;fit_intercept 设置为 False 时,这个参数可以忽略。如果设置为 True,回归之前将通过减去均值并除l2范数进行归一化。如果需要进行标准化,请在调用估计器 normalize=False的 fit 函数之前使用sklearn.preprocessing.StandardScaler | boolean(False) |
n_jobs | 确定cpu的核数 (None表示1,-1 表示使用所有) | int or None(None) |
属性 | 解释 | 类型 |
---|---|---|
coef_ | 回归系数(斜率) | array |
intercept_ | 截距 | array |
方法 | 解释 | 类型 |
---|---|---|
fit(X, y[, sample_weight]) | 训练模型 | X : array-like or 稀疏矩阵,y : array_like,sample_weight : numpy array |
predict(X) | 预测 | X : array_like or 稀疏矩阵 |
score(X, y[, sample_weight]) | 评分指标R2=1−(∑i=1m(y(i)−y^(i))2)/m(∑i=1m(y(i)−yˉ)2)/mR^2 = 1 - \frac{(\sum_{i=1}^{m}(y^{(i)} - \hat y^{(i)})^{2})/m}{(\sum_{i=1}^{m}(y^{(i)} - \bar y)^{2})/m} R2=1−(∑i=1m(y(i)−yˉ)2)/m(∑i=1m(y(i)−y^(i))2)/m | float |
调包实践
import matplotlib.pyplot as pltimport numpy as npfrom sklearn import datasets, linear_modelfrom sklearn.metrics import mean_squared_error, r2_scoreexperiences = np.array([0,1,2,3,4,5,6,7,8,9,10])salaries = np.array([103100, 104900, 106800, 108700, 110400, 112300, 114200, 116100, 117800, 119700, 121600])# 将特征数据集分为训练集和测试集,除了最后5个作为测试用例,其他都用于训练X_train = experiences[:7]X_train = X_train.reshape(-1,1)X_test = experiences[7:]X_test = X_test.reshape(-1,1)# 把目标数据(特征对应的真实值)也分为训练集和测试集y_train = salaries[:7]y_test = salaries[7:]# 创建线性回归模型regr = linear_model.LinearRegression()# 用训练集训练模型——看就这么简单,一行搞定训练过程regr.fit(X_train, y_train)# 用训练得出的模型进行预测diabetes_y_pred = regr.predict(X_test)# 将测试结果以图标的方式显示出来plt.scatter(X_test, y_test, color='black')plt.plot(X_test, diabetes_y_pred, color='blue', linewidth=3)plt.xticks(())plt.yticks(())plt.show()
参考链接
- sklearn.linear_model.LinearRegression
- 李烨-机器学习极简入门课
- https://github.com/Heitao5200/Heitao5200_MachineLearning/blob/master/LR/LinearRegression.md
算法实践1_线性回归相关推荐
- 机器学习算法1_线性回归
通俗描述 线性回归模型是利用线性函数对一个或多个自变量和因变量(y)(y)(y)之间关系进行拟合的模型. 公式推导 数据输入 给定数据集D={(x1,y1),(x2,y2),-,(xm,ym)},yi ...
- python一元线性回归算法_6一元线性回归_清华编程高手尹成带你基于算法实践python量化交易_其他视频-51CTO学院...
清华编程高手尹成带你基于算法实践python量化交易 量化交易是指以先进的数学模型替代人为的主观判断,利用计算机技术从庞大的历史数据中海选能带来超额收益的多种"大概率"事件以制定策 ...
- 机器学习经典算法实践_服务机器学习算法的系统设计-不同环境下管道的最佳实践
机器学习经典算法实践 "Eureka"! While working on a persistently difficult-to-solve problem, you disco ...
- 深度学习算法实践(基于Theano和TensorFlow)
深度学习算法实践(基于Theano和TensorFlow) 闫涛 周琦 著 ISBN:9787121337932 包装:平装 开本:16开 用纸:胶版纸 正文语种:中文 出版社:电子工业出版社 出版时 ...
- 人脸验证 DeepID 算法实践
人脸验证 DeepID 算法实践 4,610 次阅读 - 文章 作者:雨石 出处:雨石的博客 目前人脸验证算法可以说是DeepID最强,本文使用theano对DeepID进行实现.关于deepid的 ...
- SDCC 2015算法专场札记:知名互联网公司的算法实践
SDCC 2015算法专场札记:知名互联网公司的算法实践 发表于4小时前|526次阅读| 来源作者投稿|0 条评论| 作者张俊林 SDCC算法架构大数据京东腾讯 摘要:11月21日,为期三天的SDCC ...
- c++多元线性回归_五种优化算法实现多元线性回归
实现多元线性回归的要求及假设条件: '''线性回归的假设条件:1.样本独立,即每个预测样本之间没有依赖关系:2.残差e要服从正态分布,即y_true-y_pred的残差需要服从高斯分布:3.特征之间独 ...
- 实时通信服务中的语音解混响算法实践
导读: 随着音视频通信会议越来越普及,与会各方在不同环境中遇到了越来越明显且差异的混响场景,譬如大会议室场景.玻璃会议室场景和小房间且隔音材料不佳场景等.为了保证更好的听音可懂度和舒适度,通信中的语音 ...
- 阿里妈妈品牌广告中的 NLP 算法实践
导读:本次分享的主题为阿里妈妈品牌广告中的 NLP 算法实践,主要内容包括: 1. 品牌广告业务模式与技术架构的简要介绍 2. NLP 算法在品牌搜索广告中的实践,以两个具体的算法问题展开:品牌意图识 ...
最新文章
- 把JS 脚本嵌入CS运行
- Opencv 基础 MatOfByte创建和byte数组
- POJ_3268_Sliver Cow Party结题报告
- MySQL 事物隔离级别
- Ubuntu中安装nginxError
- 怎么看表_干货 | 剪力墙、柱、板配筋率到底怎么算?
- Linux java 生效不了,linux jdk 不生效怎么办
- 新iPhone销量将持续走低 因为旧iPhone够用好几年
- 2018蚂蚁金服NLP用户意图的精准识别,复赛f1 = 0.7327
- 虚拟linux第一次启动网卡配置过程
- 【CCF】关于NOI Online测试有关事项的问答
- 博图advanced关于vb自动弹出画面
- 论文阅读:Enhanced Pix2pix Dehazing Network
- Linux arm 支持 ntfs 文件系统
- java字符小写字母转换为大写_[Java教程]将一个字符串中的大写字母转换成小写字母,小写字母转换成大写字母(java)...
- 利用python爬取教务系统中成绩
- HashMap和Iterator迭代器的小用法
- tikz 折线 箭头_[LaTeX 绘图] tikz 绘制流程图,概述和两个示例
- 025 Rust死灵书之原子操作
- Transition(过渡动画效果)