Python 第五章 因子分析
#相关系数矩阵
import pandas as pd
Data=pd.read_excel('农村居民人均可支配收入来源2016.xlsx')
X=Data.iloc[:,1:]
R=X.corr()
print(R)
工资性收入 经营净收入 财产净收入 转移净收入
工资性收入 1.000000 -0.388997 0.826683 0.401917
经营净收入 -0.388997 1.000000 -0.205737 -0.314542
财产净收入 0.826683 -0.205737 1.000000 0.297458
转移净收入 0.401917 -0.314542 0.297458 1.000000
# 数据规范化处理
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
scaler.fit(X)
X=scaler.transform(X)
#主成分分析
from sklearn.decomposition import PCA
pca=PCA(n_components=0.95) #方差贡献率累计
pca.fit(X)
Y=pca.transform(X)
tzxl=pca.components_
tz=pca.explained_variance_
gxl=pca.explained_variance_ratio_
Y00=sum(X[0,:]*tzxl[0,:])
Y01=sum(X[1,:]*tzxl[0,:])
Y02=sum(X[2,:]*tzxl[0,:])
Y03=sum(X[3,:]*tzxl[0,:])
#综合排名
F=gxl[0]*Y[:,0]+gxl[1]*Y[:,1]+gxl[2]*Y[:,2] #综合得分=各个主成分*贡献率之和
dq=list(Data['地区'].values) #提取地区
Rs=pd.Series(F,index=dq) #以地区作为index,综合得分为值,构建序列
Rs=Rs.sort_values(ascending=False) #按综合得分降序进行排序
print(Rs)
北京 3.038413
上海 2.582823
天津 1.446676
浙江 1.260543
江苏 0.659315
广东 0.300473
河北 0.013099
山西 -0.112498
福建 -0.162941
青海 -0.166951
宁夏 -0.167162
黑龙江 -0.175883
重庆 -0.177313
山东 -0.178765
陕西 -0.267225
江西 -0.290871
四川 -0.291196
辽宁 -0.311699
湖南 -0.319781
内蒙古 -0.338537
安徽 -0.373579
河南 -0.415474
海南 -0.492279
贵州 -0.493301
甘肃 -0.523621
湖北 -0.560027
广西 -0.599919
新疆 -0.626501
云南 -0.663495
西藏 -0.727826
吉林 -0.864497
dtype: float64本节内容参考Python金融数据分析与挖掘实战,黄恒秋,人民邮电出版社的内容
Python 第五章 因子分析相关推荐
- 【python第五章——函数】
python第五章--函数 第五章--函数 5.1函数概述 5.2 函数进阶 下面部分之后再写 5.3函数习题(一些小例子) 第五章--函数 5.1函数概述 快速入门: #定义函数 def func( ...
- python 第五章 字典
python 第五章 # # !/usr/bin/python # # -*- coding: utf-8 -*- # # @File : 总结.py # # @time : 2019-07-1010 ...
- python第五章课后题答案_python程序设计基础(嵩天)第五章课后习题部分答案
原博文 2019-10-13 13:50 − 第五章p1515.2:实现isodd()函数,参数为整数,如果参数为奇数,返回true,否则返回false.def isodd(s): x=eval(s) ...
- python第五章总结
第5章组合数据类型 5.1认识组合数据类型 (1)常用的序列类型有字符串.列表和元组. (2)序列支持双向索引:正向递增索引和反向递减索引正向递增索引从左向右依次递增,第一个元素的索引为0,第二个元素 ...
- 给普通人的Python——第五章(上)
文章目录 5. 代码重复使用的艺术:函数 5.1 一个例子引入 5.2 定义函数 5.3 使用函数重构代码 请关注公众号:编程之路从0到1 5. 代码重复使用的艺术:函数 编程中的函数和我们数学中的函 ...
- python第五章课后作业_python 入门到实践第五章课后练习
原博文 2020-06-19 11:05 − users = ['admin','alex','eric','crystol','joji']#创建一个列表for i in users:#遍历整个列表 ...
- Python 第五章 数据预处理
#缺失值填充 import pandas as pd import numpy as np data=pd.read_excel('missing.xlsx') #数据框data c=np.array ...
- Python第五章序列,集合,字典
一.切片 介绍 1.函数float函数和eval函数的区别: 2. 利用下标"[]"可以从字符串(列表,元组)中截取一个子串 二.浅拷贝和深拷贝 1.浅拷贝 2.深拷贝 3.哈希 ...
- python第五章课后编程题答案_Python核心编程-第五章课后习题
5-1 整形 讲讲 Python 普通整型和长整型的区别 答:在2.7版本基本淡化了区别.真要区分的话,普通整型是32位或者64位,而长整型只与PC内存有关,很大就是了 5-2 运算符 (a) 写一个 ...
最新文章
- 深入Linux PAM体系结构
- [一维粒子模拟 version3.6]renormalization
- 【字符串反转总结】Java中七种方法实现
- POJ - 3279 Fliptile(状态压缩+位运算+暴力)
- 苦练IoT应用开发,还能加速变现,这个机会别错过
- 详解模板方法设计模式
- Hadoop 服务器配置的副本数量 管不了客户端
- Geoserver使用CSS插件编辑Style样式
- border英文缩写_第一丶第二丶第三丶第四的英文缩写是什么
- 数字电子技术第十一版中文版_秦曾煌电工学·电子技术第7版下册题库和课后习题...
- PHP入门-运算符与操作符
- android 字符串缩进换行换行,Android Textview第二行缩进/悬挂缩进
- 电信宽带连接不上无线可连接服务器,电信宽带wifi连不上网的解决方法
- 树莓派 天猫精灵智能灯泡_智能灯泡即使在关闭时也会用完电吗?
- 大厂软技能最佳实践--金字塔原理篇
- 学习笔记 | 数据库概述 DB、DBMS、DBS
- 三天流量有效期具体怎么算_飞猪不从APP提取出来流量有效期多久?如何提取?(含与客服对话)...
- 我相信,一定有那么一句话可以温暖你的心
- 《途客圈创业记》读书笔记
- MySQL数据库(一)——基本介绍