Python之数据分析（案例：净额成交量、矢量化、数据曲线平滑）

文章目录

一、净额成交量
二、标量函数矢量化
三、数据曲线平滑

一、净额成交量

1、案例分析

符号数组a: [10 -20 30 40 -50]
用法：numpy.sign(a)
结果是[1 -1 1 1 -1]
净额成交量：简称OBV，赚了是正，赔了是负
利用条件筛选来得到盈亏指标：一参是差分数组，二参是条件数组，三参是各个条件对应的值数组

2、第二种筛选方法

sign_closing_price = np.piecewise(
diff_closing_price,
[diff_closing_price < 0,
diff_closing_price == 0,
diff_closing_price > 0],
[-1, 0 , 1]
)

3、案例源码

import datetime as dt
import numpy as np
import matplotlib.pylab as mp
import matplotlib.dates as mddef dmy2ymd(dmy):dmy = str(dmy, encoding='utf-8')  # 转码dmy日期date = dt.datetime.strptime(dmy, '%d-%m-%Y').date()  # 获取时间对象ymd = date.strftime('%Y-%m-%d')return ymddates, closing_prices, volumes = np.loadtxt('0=数据源/beer_price2.csv', delimiter=',',usecols=(0, 4, 5), unpack=True,dtype=np.dtype('M8[D], f8, f8'),converters={0: dmy2ymd}
)# 交易日的差分（后一天减去前一天）组成的差分数组，正的是赚了，负的是赔了
diff_closing_price = np.diff(closing_prices)
sign_closing_price = np.sign(diff_closing_price)
# print(diff_closing_price)
# print(sign_closing_price)# 利用条件筛选来得到盈亏指标：一参是差分数组，二参是条件数组，三参是各个条件对应的值数组
sign_closing_price = np.piecewise(diff_closing_price,[diff_closing_price < 0,diff_closing_price == 0,diff_closing_price > 0],[-1, 0, 1]
)# 得到盈亏量，带正负的
obvs = volumes[1:] * sign_closing_price  # 成交量乘盈亏指标，得到的是盈亏量# 曲线图基础设置
mp.figure('On-Balance Volume', facecolor='lightgray')
mp.title('On-Balance Volume', fontsize=20)
mp.xlabel('Date', fontsize=14)
mp.ylabel('OBV', fontsize=14)# 主刻度设置为以周一为起始的星期格式
ax = mp.gca()  # 获取刻度线（坐标轴）
ax.xaxis.set_major_locator(md.WeekdayLocator(byweekday=md.MO)
)
# 次刻度设置为以天为单位
ax.xaxis.set_minor_locator(md.DayLocator()
)
# 主刻度的格式化
ax.xaxis.set_major_formatter(md.DateFormatter('%d %b %Y')
)mp.tick_params(labelsize=10)  # 字体
mp.grid(axis='y', linestyle=':')  # 网格线，不需要纵向# 绘制曲线
dates = dates[1:].astype(md.datetime.datetime)  # 将日期标准化成numpy的日期
# 记录所有上涨和下跌的部分
rise = obvs > 0
fall = obvs < 0
# 设置前景色与背景色
fc = np.zeros(dates.size, dtype='3f4')
ec = np.zeros(dates.size, dtype='3f4')
fc[rise], fc[fall] = (1, 0, 0), (0, 0.5, 0)
ec[rise], ec[fall] = (1, 1, 1), (1, 1, 1)# 绘制柱形图
mp.bar(dates, obvs, 1.0, 0, color=fc, edgecolor=ec, label='OBV')mp.legend()  # 显示图例
mp.gcf().autofmt_xdate()  # 设置格式展示的自动化调整
mp.show()  # 显示图像

二、标量函数矢量化

1、矢量化概念

def 标量函数(标量参数1, 标量参数2, ...)...return 标量返回值1, 标量返回值2, ...

矢量化：np.vectorize(标量函数)——>转换成矢量函数

def 矢量函数(矢量参数1, 矢量参数2, ...)...
矢量返回值1, 矢量返回值2, ...

2、练习代码

import numpy as npdef fun1(a, b):return a+b, a-b, a*b
A = np.array([10, 20, 30])
B = np.array([100, 200, 300])# 不需要循环迭代，就可以对传入的数组对应着进行处理
# 此处表示将A与B两个数组中的值一一对应传入fun1中进行处理，处理结果返回给C数组
C = np.vectorize(fun1)(A, B)
print(C)

三、数据曲线平滑

1、数据平滑
卷积降噪（消除随机噪声干扰）——>曲线拟合（获得数学模型）——>求特征值（反映业务特征）

2、平滑过程
y=f(x)
y=g(x)
y1=f(x1)
y1=g(x1)
f(x1)=g(x1)
f(x1)-g(x1)=0
f(x)-g(x)=0的根就是x1
np.polysub(p1, p2)得到p3，即为方程f(x)-g(x)=0的各个项系数
np.roots(p3) 得到p3的根，即x1