Python 每日一记31相关性矩阵建立
AI 前线导读:2019 年 4 月,Java 的收费时代来临了!
Java 是由 Sun 微系统公司在 1995 年推出的编程语言,2010 年 Oracle 收购了 Sun 之后,Java 的所有者也就自然变成了 Oracle。2019 年,Oracle 宣布将停止 Java 8 更新的免费支持,未来 Java 的更新只适用于已付费的许可证持有者。—以上摘自公众号AI前线。
之前在Python 每日一记26中有提到自定义相关系数的建立,还记得我们得到的结果是下面的情况:
这样的结果多少有些让人不舒服,因此还是想要得到相关性矩阵的输出形势,在思考之后,有所突破啦,下面直接上代码
代码用了三个循环,一个循环是循环输出维度,课室维度和部类维度,另外两个循环是行列的确定,用于相关性项目的确定,为了达到矩阵的效果,我们必须有行列名的指定,才能根据行列名对应写入两者的相关系数,xg = pd.DataFrame([],index=names,columns=names) # 定义相关性数据框,这一步就至关重要了,之后再xg.loc[name1,name2] = ‘{0:.2%}’.format(b_c),其中loc()是定位出行列交叉点,format给出百分比的值。因为b_c本身就是name1和name2交互的相关性,因此能和xg.loc[name1,name2]对应上,逐步循环后,就能得出相关性矩阵啦,这里值得注意的是,大量的循环会相当耗费时间,比如我部类有54个,时间大概是1分钟半,但是品牌有600多个,循环360000次,那么时间大概就是部类的100倍,结果运行真的接近1个小时40分钟。不知道有没有其他办法解决这个问题,目前我自己无从下手。
2019/5/5
今天有空进行了代码优化,利用集合的交集并集差集特性,更加简单的得出了结果,如下代码
Python 每日一记31相关性矩阵建立相关推荐
- python seaborn heatmap可视化相关性矩阵
python seaborn heatmap可视化相关性矩阵 方法 方法 import pandas as pd import numpy as np import seaborn as sns df ...
- Python每日一记42机器学习中特征重要性feature_importances_
在进行机器学习算法中,我们常用的算法就像下面的代码形式类型 经历导入数据-预处理-建模-得分-预测 但是总觉得少了点什么,虽然我们建模的目的是进行预测,但是我们想要知道的另一个信息是变量的重要性,在线 ...
- Python每日一记60这一仗,华为必须赢,一定能赢!
这篇文章和python无关----- 华为事件已经过去好多天,但是每每看到关于华为的文章,的确让人心潮澎湃. 能被一个超级大国这样对待,华为可谓是真强大,望华为以及国内的科技公司,加油. 这是一个大国 ...
- Python每日一记127文本型数字转化为数值型数字(eval函数)
不知道大家有没有注意到这样一个问题,那就是我们进行format数字格式化后,是文本型数字,这样是不能进行后续计算的,如何将其转化为数值型数字呢?这里我们不用int(),或者float() 这个时候我们 ...
- Python每日一记196pandas.core.indexing.IndexingError: Too many indexers
以下代码出现了pandas.core.indexing.IndexingError: Too many indexers问题 import pandas as pd import numpy as n ...
- Python 每日一记217根据词频生成词云图
一.问题描述 以上数据是会员的每一笔消费,我想看部类的词云图. 词云图有两种做法: 第一种是针对文本的,就是一堆话,先jieba分词,然后在进行词云图的绘制: 第二种就是根据已知的词频进行绘制,这就正 ...
- Python每日一记192计算机组成原理之存储器存取周期、存储器带宽
存取周期:存储器进行连续两次操作(存或者取)的最小间隔时间. 存储器带宽:这个指标和存取周期相关,表示单位时间内存储器存取的信息量,单位可以是字/秒.字节/秒.位/秒.如存取周期是100ns(纳秒,1 ...
- Python每日一记23分类模型的可信度评估
"万事万物都存在不确定性,包括真理" 对于分类模型,我们知道利用模型确实能进行预测分类,为其加上标签,但是,模型预测的内部机制也是依据概率计算的,大概率属于1类,则分到1类. 大部 ...
- Python 每日一记210java模拟电影院买票
package mypackage;/***电影院买票系统* 注意泛型和容器的使用,特别注意容器内一次性添加多个元素的方法Arrays.asList(1,2,3,4,5)* 注意线程同步问题的解决,特 ...
- Python每日一记112matplotlib次坐标轴和翻转坐标轴
因为量纲不同我们需要用到次坐标轴,因为想要表达方式不同我们需要用到翻转坐标轴,因为就学习了一下 1.次坐标轴 这里需特别注意,纵坐标的次坐标用twinx(),横坐标的次坐标用twiny() impor ...
最新文章
- 最新+经典+论文+代码+多版本+神器+https://paperswithcode.com/
- vlan配置实例详解_【精品网络干货】二层MSTP防环技术详解
- Bootstrap常用类
- [html] 你觉得写Html难吗?难在哪?为什么?
- Jmeter Beanshell采样器调用JAVA方法(二)
- 【英语学习】【Level 07】U02 Live Work L5 This is where we work
- Ankhsvn 改名出错
- 测试开发新手:从0到1开展性能测试必备的性能测试要点!
- 小知识 | 谈谈 损失函数, 成本函数, 目标函数 的区别
- Linux系统忘记密码怎么办?
- Java(31)_JDBC连接mysql数据库(一)
- dlib 怎么安装vs2017_VS2017+DLib_19.17详细配置教程
- 供应商TOP10榜单!车载前装激光雷达进入规模化上车关键期
- rmmod命令卸载驱动过程详解
- linux系统Kile+Okular实现逆向搜索
- Deepin升级内核后无法启动的问题
- 现在做硬件工程师还有前途吗?
- 计算机里面不显示光驱位硬盘,悲剧了!win10下新加的光驱位机械硬盘无法识别...
- 统计学 一 集中趋势
- 不再犹豫----【谐音歌词】