php 计算数据偏离度,关于偏离度的测算方法
2015年6月技术总结
——关于偏离度的测算方法
研究院公用事业部 路璐
引言
《原理》中说“偏离度是指每一种偿债来源与财富创造能力的距离,所体现的是偿债来源对债务安全的保障程度,唯有通过揭示偿债来源与财富创造能力偏离度才能真正区别每一种偿债来源的风险程度,科学判断偿债能力”。
偏离度是描述偿债来源与财富创造能力之间的接近程度的指标,命名为“距离”,“距离”越小的偿债来源与财富创造能力越具有相似性。采用什么样的方法计算距离是很讲究,甚至关系到判断偿债能力的正确与否。
根据偏离度的两个分量偿债来源与财富创造能力的特性,我们发现,他们的量纲,也就是单位是不一样的,测算时需要考虑分量的分布(期望,方差等)。
以下三种算法,需要具体数据测试,校正,验证,再校正。
第一种偏离度算法的思路:先将分量偿债来源与财富创造能力都“标准化”到均值、方差相等。假设样本集X的均值为m,标准差为s,那么X的“标准化变量”表示为:而且标准化变量的数学期望为0,方差为1。因此样本集的标准化过程用公式描述就是:
标准化后的值 = (标准化前的值-分量的均值) /分量的标准差
经过简单的推导就可以得到两个n维向量偿债来源a(x11,x12,…,x1n)与财富创造能力b(x21,x22,…,x2n)间的偏离度的公式:
如果将方差的倒数看成是一个权重,这个公式可以看成是一种加权偏离度。
Matlab计算第一种偏离度:
计算(0,0)、(1,0)、(0,2)两两间的偏离度 (假设两个分量的标准差分别为0.5和1)
X= [0 0 ; 1 0 ; 0 2]
D= pdist(X, 'seuclidean',[0.5,1])
结果:D= 2.0000 2.0000 2.8284
第二种偏离度算法思路:几何中夹角余弦可用来衡量两个向量方向的差异,利用这一概念来衡量样本向量之间的差异,即偏离度。
在二维空间中向量A(X1,Y1)与向量B(X2,Y2)的夹角余弦公式:
两个n维样本点a(x11,x12,…,x1n)和b(x21,x22,…,x2n)的夹角余弦,对于两个n维样本点a(x11,x12,…,x1n)和b(x21,x22,…,x2n),可以使用类似于夹角余弦的概念来衡量偿债来源与财富创造能力间的偏离度。
即:
偏离度取值范围为[-1,1]。偏离度夹角余弦越大表示向量偿债来源与财富创造能力的夹角越小,偏离度夹角余弦越小表示向量偿债来源与财富创造能力的夹角越大。当偿债来源与财富创造能力的方向重合时夹角余弦取最大值1,当向量偿债来源与财富创造能力的方向完全相反夹角余弦取最小值-1。
Matlab计算第二种偏离度算法:
计算(1,0)、( 1,1.732)、(-1,0)两两间的偏离度。
X= [1 0 ; 1 1.732 ; -1 0]
D=1-pdist(X,'cosine')%
Matlab中的pdist(X,'cosine')得到的偏离度是1减夹角余弦的值
结果:D=0.5000 -1.0000 -0.5000
第三种偏离度算法:
偏离度是衡量偿债来源X与财富创造能力Y相关程度的一种方法,偏离度的取值范围是[-1,1]。偏离度的绝对值越大,则表明偿债来源X与财富创造能力Y相关度越高。当X与Y线性相关时,偏离度取值为1(正线性相关)或-1(负线性相关)。
偏离距离的定义:
Matlab计算(1, 2 ,3 ,4 )与( 3 ,8 ,7 ,6 )之间的偏离度与偏离距离
X = [1 2 3 4 ; 3 8 7 6]
C = corrcoef(X') %将返回偏离度矩阵
D = pdist(X, 'correlation')
结果:C=
1.0000 0.4781
0.4781 1.0000
D=0.5219, 其中0.4781就是偏离度,0.5219是偏离距离。
三种偏离度测算方法,需要与实际数据结合,经过反复多次测试,校正,验证,再校正的过程,得到最佳偏离度测算方案。有关算法校正和验证方法,日后讨论。
公用事业部
二〇一五年六月十九日
php 计算数据偏离度,关于偏离度的测算方法相关推荐
- 利用三轴加速器的计步测算方法
声明:非原创,侵权即删 随着现代生活质量提高,越来越多人开始注重自己的日常健康锻炼,计步作为一种有效记录监控锻炼的监控手段,已经广泛应用在移动终端的应用中.但目前大部分实现都是通过GPS信号来测算运动 ...
- 永磁无刷电机及其驱动技术_直流无刷电机温升测算方法介绍
现阶段永磁直流无刷电机温升测算方法关键有公式法.热网络法和数值计算方法法等.下列是每个温升检测方法的优点和缺点.1.运用二维热应力对永磁直流无刷电机及开展热分析,这一份方式未考虑到电动机的径向转变.2 ...
- 油藏弹性存储量计算公式_油藏采收率测算方法_采收率
2-4 油藏采收率测算方法 油藏采收率测算方法 采收率是衡量油田开发效果和油田开发水平的最重要的 综合指标,也是油田动态分析中最基本的问题之一. ●原油采收率:是指可采储量与原始地质储量的比值: ●最 ...
- 锂电池电量百分比计算_锂电池的电池包容量测算方法与流程
本发明涉及锂电池技术领域,具体涉及一种锂电池的电池包容量测算方法. 背景技术: 随着锂电池的大规模应用,其电池性能备受关注,特别是新能源汽车的大力推广,更是直接推动了动力锂电池的发展,这也对锂电池的单 ...
- 活跃用户的测算方法与用户黏性指数的提出
研究互联网的同志应该都有听说过DAU(日活跃用户数).WAU(周活跃用户数)MAU(月活跃用户数),但是具体这些数字是怎么测算的?他们彼此之间又是怎样的关系?在本文中,笔者试图谈谈自己的一些思考,请大 ...
- php八字喜用神实现博客,八字喜用神测算方法
我们经常在说的一个人适合什么行业.适合什么颜色.适合什么方位等等,其实都是围绕着喜用神来测算的,你只有掌握了用神,才能掌握八字的精髓,才能有精准的测算,那究竟如何用神呢? 简单的说,用神就是八字的枢纽 ...
- sqlerver 字符串转整型_mssql sqlerver 脚本 计算数据表的结余数的方法分享
摘要: 今天接到一个需求,有一张数据表,记录的是消费明细数据, 现在需要做一个累计结余,记录每次的数据结余合计, 下文将展示一种sql脚本的编写方式 实验环境:sqlserver 2008 R2 如下 ...
- php 计算数据偏离度,偏离度怎么计?
理解货币基金偏离度的两种计价方法: 在我国市场上现有的基金类型中,基金偏离度是货币市场基金特有的概念.要理解偏离度,首先要从货币市场基金的两种资产净值计价方法来说. 目前我国货币市场基金均采取摊余成本 ...
- 矢量切片_数据粒度均衡的二维矢量瓦片构建方法
作 者 信 息 应 申1,2,王子豪1,杜志强3,丁火平4, 李翔翔4 (1. 武汉大学 资源与环境科学学院,湖北 武汉 430079:2. 自然资源部城市国土资源监测与仿真重点实验室,广东 深圳 5 ...
最新文章
- WordPress页面Page和文章Post的相互转换
- 自己录制的Linux视频教程
- DPM(Deformable Part Model)原理详解
- 洛谷 P3381 【模板】最小费用最大流
- 使用 SAP HANA Virtual Table 连接外部数据源
- MATLAB画图命令zz
- 【网络基础】《TCP/IP详解》学习笔记5
- 三星Galaxy Note 10 Pro渲染图曝光:挖孔屏+前摄居中
- python 菜单 阻塞 其它程序_Python subprocess.call阻塞
- mysql 开发基础系列19 触发器
- RabbitMQ基础知识详解
- Web 前端知识体系精简
- java dump可视化在线内存分析工具
- 微机中锁存器和缓冲器的区别
- MySQL中round函数
- 直播 编解码、 协议、网络传输
- 用python绘制熊猫图案_python – 有没有办法在ggplot中绘制一个熊猫系列?
- 程序减肥,strip,eu-strip 及其符号表
- windows Apache 的安装和配置教程
- solidworks中加入参考图纸图片
热门文章
- ffmpeg和SDL学习笔记
- 查看 linux 硬件信息:内存、分区、系统、环境变量、防火墙、路由、端口监听、进程、CPU...
- 《 图解 TCP/IP 》读书笔记
- 结构体的传参理解成员的存储方式
- [c/c++] programming之路(25)、字符串(六)——memset,Unicode及宽字符,strset
- canvas绘制线条1像素的问题
- 《JS权威指南学习总结--6.7属性的特性》
- 2015.11.27---Java
- 1)C++对象大小计算
- 【原创】StreamInsight查询系列(三)——基本查询操作之过滤