py之patsy:patsy的简介、安装、使用方法之详细攻略

目录

patsy的简介

patsy的安装

patsy的使用方法


patsy的简介

Patsy是一个python库,用于描述统计模型(尤其是线性模型,或具有线性组件的模型)和构建设计矩阵。Patsy为python带来了r“formulas”的便利。它受到R和S中使用的公式迷你语言的启发并与之兼容。

   patsy is a Python package for describing statistical models (especially linear models, or models that have a linear component) and building design matrices. It is closely inspired by and compatible with the formula mini-language used in R and S.

利用Patsy创建模型描述 Patsy是一个python库,用于描述统计模型(尤其是线性模型),方法是通过一个叫做公式语法(formula syntax)的字符串来描述。这种公式语法的灵感来源于R和S语言中的公式语法。

Patsy的公式是有特殊格式的字符串,像下面这样: y ~ x0 + x1 这种a + b的语法并不代表将a和b相加,而是代表为模型创建的设计矩阵的术语(terms in the design matrix)。patsy.dmatrices函数,取一个公式字符串和一个数据集(可以使DataFrame或dict),然后为线性模型产生设计矩阵。

patsy文档:patsy - Describing statistical models in Python

patsy的安装

pip install patsy

patsy的使用方法

patsy.dmatrices("y ~ x + a + b + a:b", data)

1、patsy.dmatrices函数,取一个公式字符串和一个数据集(可以使DataFrame或dict),然后为线性模型产生设计矩阵。

data = pd.DataFrame({'x0': [1, 2, 3, 4, 5],'x1': [0.01, -0.01, 0.25, -4.1, 0.], 'y': [-1.5, 0., 3.6, 1.3, -2.]})
print(data)
y, X = patsy.dmatrices('y ~ x0 + x1', data)
print(y)x0    x1    y
0   1  0.01 -1.5
1   2 -0.01  0.0
2   3  0.25  3.6
3   4 -4.10  1.3
4   5  0.00 -2.0
[[-1.5][ 0. ][ 3.6][ 1.3][-2. ]]

py之patsy:patsy的简介、安装、使用方法之详细攻略相关推荐

  1. Py之matplotlib.pyplot:matplotlib.pyplot的plt.legend函数的简介、使用方法之详细攻略

    Py之matplotlib.pyplot:matplotlib.pyplot的plt.legend函数的简介.使用方法之详细攻略 目录 matplotlib.pyplot的plt.legend函数的简 ...

  2. Py之glob: glob库文件名模式匹配+返回所有匹配的文件路径列表库的简介、使用方法之详细攻略

    Py之glob: glob库文件名模式匹配+返回所有匹配的文件路径列表库的简介.使用方法之详细攻略 目录 glob库的简介 glob库的使用方法 1.单个字符通配符:用问号(?)匹配任何单个的字符.

  3. Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略 目录 sklearn中的RobustScaler 函数的简介及使用方法 sklearn中的R ...

  4. sklearn之XGBModel:XGBModel之feature_importances_、plot_importance的简介、使用方法之详细攻略

    sklearn之XGBModel:XGBModel之feature_importances_.plot_importance的简介.使用方法之详细攻略 目录 feature_importances_ ...

  5. Python语言学习:Python常用自带库(imageio、pickle)简介、使用方法之详细攻略

    Python语言学习:Python常用自带库(imageio.pickle)简介.使用方法之详细攻略 目录 imageio简介及其常见使用方法 pickle简介及其常见使用方法 简介 使用方法 简介及 ...

  6. sklearn:sklearn.preprocessing.StandardScaler函数的fit_transform、transform、inverse_transform简介、使用方法之详细攻略

    sklearn:sklearn.preprocessing.StandardScaler函数的fit_transform.transform.inverse_transform简介.使用方法之详细攻略 ...

  7. Computer:互联网开放平台项目知识补充之开发-运维-网络-网关等术语(DMZ、负载均衡、F5、Nginx、容器)的简介、使用方法之详细攻略

    Computer:互联网开放平台项目知识补充之开发-运维-网络-网关等术语(DMZ.负载均衡.F5.Nginx.容器)的简介.使用方法之详细攻略 目录 DMZ(隔离区)的简介及其使用方法 1.DMZ区 ...

  8. Python编程语言学习:包导入和模块搜索路径简介、使用方法之详细攻略

    Python编程语言学习:包导入和模块搜索路径简介.使用方法之详细攻略 目录 包导入和模块搜索路径简介 1.Pyhon搜索模块路径的机制 2.自定义配置搜索路径

  9. Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略 目录 sklearn.preprocessing中的Stand ...

  10. Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略 目录 sklearn中的train_test_split函数的简介 train_tes ...

最新文章

  1. React学习笔记1:React基本概念
  2. linux硬盘写0,linux – kworker消耗90%的IO和零磁盘写入
  3. 实现跨浏览器html5表单验证
  4. 日志按照天自动输出_性能测试和接口自动化测试
  5. 深入理解并发内存模型||JMM与内存屏障||多核并发缓存架构 ||JMM内存模型||volatile 关键字的作用 ||JMM 数据原子操作||JMM缓存不一致的问题
  6. Python 类的特殊成员方法详解
  7. TypeScript中的class声明了什么
  8. 特斯拉再因致命Autopilot车祸被起诉 遭索赔逾1.5万美元
  9. 微软silverlight视频教程
  10. Enumeration与Iterator接口
  11. js的this作用域
  12. Excel 连接 MySQL 导入数据 自定义 SQL (Excel 2016 + 适用)
  13. C语言什么是时间序列,什么是横截面数据、时间序列数据和面板数据
  14. 如何快速分解CAD图纸中多个合并的CAD图形?
  15. IoU优化——在Anchor-Free中提升目标检测精度(附源码)
  16. Innovus——数据准备和验证
  17. 自从上了K8S,项目更新都不带停机的!
  18. java获取文件大小_Java实现获取文件大小的几种方法
  19. 有关计算机病毒的说法中正确的是,以下有关计算机病毒的说法中,正确的是()。A.计算机病毒是一些人为编制的程序B.计算机病毒具有隐蔽...
  20. XSS————2、XSS bypass

热门文章

  1. [uEnv.txt]在uEnv.txt文件中使用if语句实现Image/dtb文件切换
  2. JS 总结之函数、作用域链
  3. 3.10以上charles版本抓取Https数据包
  4. JAVA 常用对话框
  5. 如何选择 Git 分支模式?
  6. Logback 配置文件这么写,TPS 提高 10 倍!
  7. 错误日志这样排查,干活更得劲了!!
  8. 微服务 | 我为啥不看好 ServiceMesh
  9. spring cloud教程之使用spring boot创建一个应用
  10. 系统设计:性能指标、伸缩性、扩展性、可用性、安全性