1. txt文件

(1) 单位矩阵,即主对角线上的元素均为1,其余元素均为0的正方形矩阵。
在NumPy中可以用eye函数创建一个这样的二维数组,我们只需要给定一个参数,用于指定矩阵中1的元素个数。

例如,创建3×3的数组:

import numpy as np
I2 = np.eye(3)
print(I2)
[[1. 0. 0.][0. 1. 0.][0. 0. 1.]]

(2) 使用savetxt函数将数据存储到文件中,当然我们需要指定文件名以及要保存的数组。

np.savetxt('eye.txt', I2)#创建一个eye.txt文件,用于保存I2的数据

2. CSV文件

  • CSV(Comma-Separated Value,逗号分隔值)格式是一种常见的文件格式;
  • 通常,数据库的转存文件就是CSV格式的,文件中的各个字段对应于数据库表中的列;
  • 电子表格软件(如Microsoft Excel)可以处理CSV文件。

note:,NumPy中的loadtxt函数可以方便地读取CSV文件,自动切分字段,并将数据载入NumPy数组

data.csv的数据内容:

'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:778463939
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
c, v = np.loadtxt('data.csv', delimiter=',', usecols=(6,7), unpack=True)
# usecols的参数为一个元组,以获取第7字段至第8字段的数据
# unpack参数设置为True,意思是分拆存储不同列的数据,即分别将收盘价和成交量的数组赋值给变量c和v
print(c)
[336.1  339.32 345.03 344.32 343.44 346.5  351.88 355.2  358.16 354.54356.85 359.18 359.9  363.13 358.3  350.56 338.61 342.62 342.88 348.16353.21 349.31 352.12 359.56 360.   355.36 355.76 352.47 346.67 351.99]
print(v)
[21144800. 13473000. 15236800.  9242600. 14064100. 11494200. 17322100.13608500. 17240800. 33162400. 13127500. 11086200. 10149000. 17184100.18949000. 29144500. 31162200. 23994700. 17853500. 13572000. 14395400.16290300. 21521000. 17885200. 16188000. 19504300. 12718000. 16192700.18138800. 16824200.]
print(type(c))
print(type(v))
<class 'numpy.ndarray'>
<class 'numpy.ndarray'>

3. 成交量加权平均价格 = average()函数

VWAP概述:

VWAP(Volume-Weighted Average Price,成交量加权平均价格)是一个非常重要的经济学量,

它代表着金融资产的“平均”价格。

某个价格的成交量越高,该价格所占的权重就越大。

VWAP就是以成交量为权重计算出来的加权平均值,常用于算法交易。

vwap = np.average(c,weights=v)
print('成交量加权平均价格vwap =', vwap)
成交量加权平均价格vwap = 350.5895493532009

4. 算数平均值函数 = mean()函数

NumPy中的mean函数可以计算数组元素的算术平均值

print('c数组中元素的算数平均值为: {}'.format(np.mean(c)))
c数组中元素的算数平均值为: 351.0376666666667

5. 时间加权平均价格

TWAP概述:

在经济学中,TWAP(Time-Weighted Average Price,时间加权平均价格)是另一种“平均”价格的指标。既然我们已经计算了VWAP,那也来计算一下TWAP吧。其实TWAP只是一个变种而已,基本的思想就是最近的价格重要性大一些,所以我们应该对近期的价格给以较高的权重。

最简单的方法就是用arange函数创建一个从0开始依次增长的自然数序列,自然数的个数即为收盘价的个数。当然,这并不一定是正确的计算TWAP的方式。

t = np.arange(len(c))
print('时间加权平均价格twap=', np.average(c, weights=t))
时间加权平均价格twap= 352.4283218390804

6. 最大值和最小值

'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:778463939
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
h, l = np.loadtxt('data.csv', delimiter=',', usecols=(4,5), unpack=True)
print('h数据为: \n{}'.format(h))
print('-'*10)
print('l数据为: \n{}'.format(l))
h数据为:
[344.4  340.04 345.65 345.25 344.24 346.7  353.25 355.52 359.   360.357.8  359.48 359.97 364.9  360.27 359.5  345.4  344.64 345.15 348.43355.05 355.72 354.35 359.79 360.29 361.67 357.4  354.76 349.77 352.32]
----------
l数据为:
[333.53 334.3  340.98 343.55 338.55 343.51 347.64 352.15 354.87 348.353.54 356.71 357.55 360.5  356.52 349.52 337.72 338.61 338.37 344.8351.12 347.68 348.4  355.92 357.75 351.31 352.25 350.6  344.9  345.  ]
print('h数据的最大值为: {}'.format(np.max(h)))
print('l数据的最小值为: {}'.format(np.min(l)))
h数据的最大值为: 364.9
l数据的最小值为: 333.53
NumPy中有一个ptp函数可以计算数组的取值范围
该函数返回的是数组元素的最大值和最小值之间的差值
也就是说,返回值等于max(array) - min(array)
print('h数据的最大值-最小值的差值为: \n{}'.format(np.ptp(h)))
print('l数据的最大值-最小值的差值为: \n{}'.format(np.ptp(l)))
h数据的最大值-最小值的差值为:
24.859999999999957
l数据的最大值-最小值的差值为:
26.970000000000027

7. 统计分析

中位数:

我们可以用一些阈值来除去异常值,但其实有更好的方法,那就是中位数。

将各个变量值按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数即为中位数。

例如,我们有1、2、3、4、5这5个数值,那么中位数就是中间的数字3。

'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:778463939
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
m = np.loadtxt('data.csv', delimiter=',', usecols=(6,), unpack=True)
print('m数据中的中位数为: {}'.format(np.median(m)))
m数据中的中位数为: 352.055
# 数组排序后,查找中位数
sorted_m = np.msort(m)
print('m数据排序: \n{}'.format(sorted_m))
N = len(c)
print('m数据中的中位数为: {}'.format((sorted_m[N//2]+sorted_m[(N-1)//2])/2))
m数据排序:
[336.1  338.61 339.32 342.62 342.88 343.44 344.32 345.03 346.5  346.67348.16 349.31 350.56 351.88 351.99 352.12 352.47 353.21 354.54 355.2355.36 355.76 356.85 358.16 358.3  359.18 359.56 359.9  360.   363.13]
m数据中的中位数为: 352.055
方差:
方差是指各个数据与所有数据算术平均数的离差平方和除以数据个数所得到的值。
print('variance =', np.var(m))
variance = 50.126517888888884
var_hand = np.mean((m-m.mean())**2)
print('var =', var_hand)
var = 50.126517888888884

注意:样本方差和总体方差在计算上的区别。总体方差是用数据个数去除离差平方和,而样本方差则是用样本数据个数减1去除离差平方和,其中样本数据个数减1(即n-1)称为自由度。之所以有这样的差别,是为了保证样本方差是一个无偏估计量。

8. 股票收益率

在学术文献中,收盘价的分析常常是基于股票收益率和对数收益率的。

简单收益率是指相邻两个价格之间的变化率,而对数收益率是指所有价格取对数后两两之间的差值。
我们在高中学习过对数的知识,“a”的对数减去“b”的对数就等于“a除以b”的对数。因此,对数收益率也可以用来衡量价格的变化率。

注意,由于收益率是一个比值,例如我们用美元除以美元(也可以是其他货币单位),因此它是无量纲的。

总之,投资者最感兴趣的是收益率的方差或标准差,因为这代表着投资风险的大小。

(1) 首先,我们来计算简单收益率。NumPy中的diff函数可以返回一个由相邻数组元素的差值构成的数组。这有点类似于微积分中的微分。为了计算收益率,我们还需要用差值除以前一天的价格。不过这里要注意,diff返回的数组比收盘价数组少一个元素。returns = np.diff(arr)/arr[:-1]
注意,我们没有用收盘价数组中的最后一个值做除数。接下来,用std函数计算标准差:

print ("Standard deviation =", np.std(returns))

(2) 对数收益率计算起来甚至更简单一些。我们先用log函数得到每一个收盘价的对数,再对结果使用diff函数即可。

logreturns = np.diff( np.log(c) )

一般情况下,我们应检查输入数组以确保其不含有零和负数。否则,将得到一个错误提示。不过在我们的例子中,股价总为正值,所以可以将检查省略掉。

(3) 我们很可能对哪些交易日的收益率为正值非常感兴趣。

在完成了前面的步骤之后,我们只需要用where函数就可以做到这一点。where函数可以根据指定的条件返回所有满足条件的数组元素的索引值。

输入如下代码:

posretindices = np.where(returns > 0)
print "Indices with positive returns", posretindices

即可输出该数组中所有正值元素的索引。

Indices with positive returns (array([ 0, 1, 4, 5, 6, 7, 9, 10, 11, 12, 16, 17, 18, 19, 21, 22, 23, 25, 28]),)

(4) 在投资学中,波动率(volatility)是对价格变动的一种度量。历史波动率可以根据历史价格数据计算得出。计算历史波动率(如年波动率或月波动率)时,需要用到对数收益率。年波动率等于对数收益率的标准差除以其均值,再除以交易日倒数的平方根,通常交易日取252天。

用std和mean函数来计算,代码如下所示:

annual_volatility = np.std(logreturns)/np.mean(logreturns)
annual_volatility = annual_volatility / np.sqrt(1./252.)

(5) sqrt函数中的除法运算。在Python中,整数的除法和浮点数的除法运算机制不同(python3已修改该功能),我们必须使用浮点数才能得到正确的结果。与计算年波动率的方法类似,计算月波动率如下:

'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:778463939
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
annual_volatility * np.sqrt(1./12.)c = np.loadtxt('data.csv', delimiter=',', usecols=(6,), unpack=True)returns = np.diff(c)/c[:-1]
print('returns的标准差: {}'.format(np.std(returns)))
logreturns = np.diff(np.log(c))
posretindices = np.where(returns>0)
print('retruns中元素为正数的位置: \n{}'.format(posretindices))
annual_volatility = np.std(logreturns)/np.mean(logreturns)
annual_volatility = annual_volatility/np.sqrt(1/252)
print('每年波动率: {}'.format(annual_volatility))
print('每月波动率:{}'.format(annual_volatility*np.sqrt(1/12)))
returns的标准差: 0.012922134436826306
retruns中元素为正数的位置:
(array([ 0,  1,  4,  5,  6,  7,  9, 10, 11, 12, 16, 17, 18, 19, 21, 22, 23,25, 28], dtype=int64),)
每年波动率: 129.27478991115132
每月波动率:37.318417377317765

Python3NumPy的常用函数相关推荐

  1. python3常用函数大全_Python3NumPy——常用函数

    Python3NumPy的常用函数 1. txt文件 (1) 单位矩阵,即主对角线上的元素均为1,其余元素均为0的正方形矩阵. 在NumPy中可以用eye函数创建一个这样的二维数组,我们只需要给定一个 ...

  2. php内置常用函数是哪些,PHP常用函数有哪些

    PHP常用函数有哪些 导语:PHP主要通过函数实现一些功能,那PHP常用函数有哪些呢?下面就由小编为大家介绍一下,欢迎大家阅读! 数学函数 1.abs(): 求绝对值 $abs = abs(-4.2) ...

  3. Lua基本语法-书写规范以及自带常用函数

    Lua基本语法-书写规范和常用函数 本文提供全流程,中文翻译. Chinar坚持将简单的生活方式,带给世人! (拥有更好的阅读体验 -- 高分辨率用户请根据需求调整网页缩放比例) 1 String O ...

  4. SQLserver 常用函数适用方法(转载)

    SQL Server 常用函数使用方法(持续更新) 之前就想要把一些 SQL 的常用函数记录下来,不过一直没有实行...嘿嘿... 直到今天用到substring()这个函数,C# 里面这个方法起始值 ...

  5. python Pool常用函数用法总结

    在本篇内容里小编给大家整理的是一篇关于python Pool常用函数用法总结内容,有需要的朋友们可以学习下. 1.说明 apply_async(func[,args[,kwds]):使用非堵塞调用fu ...

  6. ACM——常用函数总结

    常用函数总结: 一.全排列:next_permutation 二.读写优化 三.返回容器内最大最小值 四.复制函数 五.容器删除函数 六.容器填充函数 七.查找函数 八.字符串转换整数 九.欧拉筛 十 ...

  7. e class connect.php,剖析帝国CMS核心文件e/class/connect.php中的常用函数

    帝国CMS下的e/class/connect.php文件中包含了帝国CMS常用的一些核心功能函数,加深对connect.php文件中常用函数的了解对于帝国CMS的二次开发来说非常重要. 现将帝国CMS ...

  8. PHP访问mysql的常用函数,PHP操作MySQL数据库常用函数

    PHP操作MySQL数据库常用函数 php操作mysql数据库,俗称天龙八步: 第一步:连接数据库 第二步:判断连接错误 第三步:选择数据库 第四步:设置字符集 第五步:准备SQL语句 第六步:执行并 ...

  9. python math库常用函数_Python math库常用函数

    math库常用函数及举例: 注意:使用math库前,用import导入该库 >>> import math 取大于等于x的最小的整数值,如果x是一个整数,则返回x >>& ...

最新文章

  1. 批量更新日期字段中的年
  2. linux c 客户端与 golang 服务端通信(网络字节序)
  3. laravel swoole mysql_Laravel集成Swoole教程
  4. ubuntu16.04(其他版本也可)批量修改图片名---shell编程
  5. 修改linux终端的提示字符
  6. Dart网络编程-备忘录2.0
  7. @开发者,这个 GitHub 项目可以褥羊毛!
  8. 简明介绍java“包”的用法
  9. [导入]2007年美国电影上映时间表
  10. LibreELEC(kodi)安装
  11. 利用快速傅里叶计算多项式相乘
  12. Minimum supported Gradle version is 5.4.1. Current version is 4.10.1. If using the gradle wrapper
  13. 教你如何简单快速有效的添加微信好友
  14. flutter 使用MD5加密
  15. 亚马逊Amazon多账号操作攻略
  16. python 均方误差_方差、标准差、均方差、均方误差
  17. VC6 各link错误解决
  18. PCBA方案定制,开发腕式血压计方案
  19. 设置word表格行高
  20. POJ3179 Corral the Cows 离散化 二分 前缀和

热门文章

  1. java学习笔记--java中的基本数组[5]
  2. 对Java泛型的简单理解
  3. 多比(SVG/VML)图形控件多比(SVG/VML)图形拓扑图控件免费下载地址
  4. Tengine ngx_http_sysguard_module 过载保护模块使用
  5. 项目中用到的设计模式(持续更新)
  6. sql数据库常见命令总结
  7. linux查看终端进程,Linux查看进程
  8. 【学习笔记】ABAP OOD设计模式 - 观察者模式
  9. SAP PP 中关于计划订单和生产订单的日期计算
  10. ALV报表中处理双击行项目事件