Pandas cov()函数结果解释

df = pd.DataFrame([(1, 2), (0, 3), (2, 0), (1, 1)],columns=['dogs', 'cats'])
print(df.cov())

结果:

              dogs      catsdogs  0.666667 -1.000000cats -1.000000  1.666667

计算过程:

E[dogs]=(1+0+2+1)/4=1
E[cats]=(2+3+0+1)/4=1.5
cov(dogs,cats)
=E[(dog-E[dogs])(cat-E[cats])]
=[(1-1)(2-1.5)+(0-1)(3-1.5)+(2-1)(0-1.5)+(1-1)(1-1.5)]/(4-1)
=-1

即(dogs,cats)索引处的值

cov()为协方差函数,协方差表示的是两个变量的总体误差

v a r ( X ) = S 2 = ∑ i = 1 n ( X i − X ‾ ) ( X i − X ‾ ) n − 1 var(X)=S^2= \cfrac{\sum_{i=1}^n (X_i-\overline X)(X_i-\overline X)}{n-1} var(X)=S2=n−1∑i=1n​(Xi​−X)(Xi​−X)​

c o v ( X , Y ) = ∑ i = 1 n ( X i − X ‾ ) ( Y i − Y ‾ ) n − 1 cov(X,Y) = \cfrac{\sum_{i=1}^n (X_i-\overline X)(Y_i-\overline Y)}{n-1} cov(X,Y)=n−1∑i=1n​(Xi​−X)(Yi​−Y)​ (即上述结果所用公式)

c o v ( X , Y ) = E [ ( X − E ( X ) ) ( Y − E [ Y ] ) ] cov(X,Y) = E[(X-E(X))(Y-E[Y])] cov(X,Y)=E[(X−E(X))(Y−E[Y])]
= E [ X Y ] − 2 E [ X ] E [ Y ] + E [ x ] E [ Y ] = E[XY]-2E[X]E[Y]+E[x]E[Y] =E[XY]−2E[X]E[Y]+E[x]E[Y]
= E [ X Y ] − E [ X ] E [ Y ] = E[XY]-E[X]E[Y] =E[XY]−E[X]E[Y]

Pandas cov()函数结果解释相关推荐

  1. Python之pandas:pandas.set_option函数的参数详细解释

    Python之pandas:pandas.set_option函数的参数详细解释 目录 pandas.set_option函数的参数解释 函数API:pandas.set_option pandas. ...

  2. 使用pandas correlation函数批量删除相关性冗余特征、实现特征筛选(feature selection)

    使用pandas Correlation函数批量删除相关性冗余特征.实现特征筛选(feature selection) 冗余特征或者相关性非常强的特征,会造成共线性问题. 1.相关性高的特征太多放大了 ...

  3. Python之Pandas:pandas.read_csv()函数的简介、具体案例、使用方法详细攻略

    Python之Pandas:pandas.read_csv()函数的简介.具体案例.使用方法详细攻略 目录 read_csv()函数的简介 read_csv()函数的简介               ...

  4. pandas 常用函数整理

    pandas常用函数整理,作为个人笔记. 仅标记函数大概用途做索引用,具体使用方式请参照pandas官方技术文档. 约定 from pandas import Series, DataFrame im ...

  5. 『Python核心技术与实战』pandas.DataFrame()函数介绍

    pandas.DataFrame()函数介绍! 文章目录 一. 创建DataFrame 1.1. numpy创建 1.2. 直接创建 1.3. 字典创建 1.4. Series和DataFrame 二 ...

  6. 精选22个Pandas实用函数

    公众号:尤而小屋 作者:Peter 编辑:Peter 大家好,我是Peter~ 今天小编又从26个字母中精选出22个Pandas常用的函数,将它们的使用方法简单介绍给大家,详细内容可以查看官网学习. ...

  7. blankcount函数python,Python pandas常用函数详解

    本文研究的主要是pandas常用函数,具体介绍如下. 1 import语句 2 文件读取 df = pd.read_csv(path='file.csv') 参数:header=None 用默认列名, ...

  8. 数据分析工具Pandas(4):Pandas的函数应用

    数据分析工具Pandas(1):Pandas的数据结构 数据分析工具Pandas(2):Pandas的索引操作 数据分析工具Pandas(3):Pandas的对齐运算 数据分析工具Pandas(4): ...

  9. R语言计算dataframe数据列中各分类的计数(类似pandas value_counts函数功能)

    R语言计算dataframe数据列中各分类的计数(类似pandas value_counts函数功能) 目录 R语言计算dataframe数据列中各分类的计数(类似pandas value

最新文章

  1. Python基础知识(五)--数据类型
  2. VC++ 6.0 C8051F340 MFC programming note
  3. 永远年轻,永远热泪盈眶----致所有奋斗的ACMer
  4. Netty 的核心组件
  5. C++socket编程(二):系统socket库介绍
  6. android 控制音乐,Android音乐控制接口RemoteController使用
  7. ASP.NET DROPDOWNLIST无刷新联动(中文URL参数处理)
  8. 开发OA产品的部分网站
  9. Vue-cli proxyTable 解决开发环境的跨域问题
  10. 世界七大数学难题与Hilbert的23个问题
  11. 动漫头像1000张萌妹子图片,可以做高清头像壁纸
  12. 同一个交换机组建局域网
  13. 创建枚举类 java_Java枚举类
  14. maven:mirrors和repository的关系区别
  15. 神经网络第一篇——感受野的学习、计算与思考
  16. 十年架构师留下最完整的Java学习路线
  17. python 中控考勤机实时接收打卡数据(QThread)
  18. MariaDB 的命令
  19. [ 编程语言 ] C : 0x01_程序
  20. unravel罗马音

热门文章

  1. 文顶顶虽老,博客尚在
  2. 机器学习 Fbeta-Measure 指标详解
  3. Linux中软件自启动三种方式
  4. 汽车之家牵手网易云音乐,“用车+音乐”的跨界才更有滋味
  5. 腾讯nginx编译安装
  6. 边缘控制平面Ambassador全解读
  7. 初窥构建之法——记2020BUAA软工个人博客作业
  8. 【转】Java桌面程序开发——如何开发美观漂亮好看的桌面程序
  9. fm2008 数据的计算方法
  10. 【区块链】以太坊交易中的R、S、V字段