基于tushare量化交易模型基础构建（偿债能力排名）

今天主要是实现了公司偿债能力指标的量化，构建股票池。
思路:
1.
偿债能力量化指标(短期)
相关指标:
流动比率=流动资产/流动负债
速动比率=（流动资产-存货）/流动负债
现金比率=现金类资产/流动负债

2.
确定偿债能力理论值
流动比率，速动比率，现金比率给定理论值
2.1:
求各个行业股票的均值作为各个指标的理论值

import pandas as pd
import numpy as np
import pickle
import tushare as ts
from sklearn.preprocessing import Imputer
def save_data():
data=ts.get_debtpaying_data(year=2017,quarter=1)
with open('step1/data_debt.pkl','wb') as f:
pickle.dump(data,f)
def get_data():
with open('step1/data_debt.pkl','rb') as f:
data=pickle.load(f)
return data

def data_deal():
data=get_data()
# print(data.columns)
data_array=data.values

# 删除具有缺少值的股票,以及删除*st与st的股票
x_data=[]
for stock in data_array:
if '--' not in stock and stock[1][:3]!='*ST' and stock[1][:2]!='ST':
x_data.append(stock)
new_data=np.array(x_data)

# 将流动比率，速动比率，现金比率拿出来,numpy.adarry格式的
new_data=new_data[:,:5]
#行业分类表格，上次出错就在这里
data_industry=ts.get_industry_classified()
# 删除重复出现的代码，一个股票只能是一个行业
data_industry=data_industry.drop_duplicates('code')
data_industry=pd.DataFrame(data_industry.values[:,-1],index=data_industry['code'],columns=['c_name'])
#按照负债表得到的code,再依据行业分类表格，对负债表中的股票进行行业分类
w=[]
for code in new_data:
try:
w.append(data_industry['c_name'][code[0]])
except:
#对行业分类缺失的股票认定为：其他行业
w.append('其他行业')
final_data=np.hstack((new_data,np.array(w).reshape(-1,1)))
# 负债表中的股票分好类，转换为DataFrame形式的
final_data=pd.DataFrame(final_data,columns=['code','name','currentratio','quickratio','cashratio','c_name'])
# print(final_data)
final_data=pd.DataFrame(np.hstack((final_data.values[:,:2],final_data.values[:,2:5].astype('f4'),final_data.values[:,-1].reshape(-1,1))),columns=['code','name','currentratio','quickratio','cashratio','c_name'])
# 求均值，每个行业的三个指标的均值，放在字典里面{'电器行业':[1,23,2],....}
data_dic={}
for i in final_data.groupby(final_data['c_name']):
cur_mean,quic_mean,cash_mean=i[1]['currentratio'].values.mean(),i[1]['quickratio'].values.mean(),i[1]['cashratio'].values.mean()
data_dic[i[0]] = [cur_mean,quic_mean,cash_mean]
# 按照每只股票所属行业，根据行业指标字典，将三个指标的行业均值放入进去.
M=[]
for c_name in final_data['c_name']:
M.append(data_dic[c_name])
final_data=np.hstack((final_data.values,np.array(M)))
with open('step2/final_data.pkl','wb') as g:
pickle.dump(final_data,g)
for stock in final_data:
name=str(stock[0])+'\t'+str(stock[1])+'\t'+str(stock[2])+'\t'+str(stock[3])+'\t'+str(stock[4])+'\t'+str(stock[5])+'\t'+str(stock[6])+'\t'+str(stock[7])+'\t'+str(stock[8])+'\n'
with open('step1/data_deal.txt','a') as f:
if stock[0]==final_data[0][0]:
f.write('code'+'\t'+'name'+'\t'+'currentratio'+'\t'+'quickratio'+'\t'+'cashratio'+'\t'+'c_name''\t'+'currentratio_mean'+'\t'+'quickratio_mean'+'\t'+'cashratio_mean'+'\n')
f.write(name)
return final_data

# print(final_data_pandas[final_data_pandas['debt_values']>500])

if __name__=='__main__':
final_data=data_deal()
print(final_data)

# for ii in i:
# print(ii)
# break

# for code_new in new_data:
# for code_industry in data_industry.values:
# if code_industry[0]==code_new[0]:
# add_name=list(code_new)+list(code_industry[-1])
# final_data.append(add_name)
# final_data=np.array(final_data)
# print(final_data)
# print(ts.get_hs300s())
# print(ts.get_report_data(year=2017,quarter=2))

3.
确定单项量化指标
tar1=(流动比率-理论值)/理论值
tar2=(速动比率-理论值)/理论值
tar3=(现金比率-理论值)/理论值

4.
确定偿债能力量化指标(加权)
final_tar=1/3*tar1+1/3*tar2+1/3*tar3

import pandas as pd
import numpy as np
# from step1 import data_deal,get_data
import pickle
import tushare as ts
# 建立股票池
def get_target(final_data):
# 3.确定单项量化指标
# tar1=(流动比率-理论值)/理论值
# tar2=(速动比率-理论值)/理论值
# tar3=(现金比率-理论值)/理论值
final_data[:,2]=(final_data[:,2]-final_data[:,6])/final_data[:,6]
final_data[:,3]=(final_data[:,3]-final_data[:,7])/final_data[:,7]
final_data[:,4]=(final_data[:,4]-final_data[:,8])/final_data[:,8]
# 确定偿债能力量化指标(加权)
# final_tar=1/3*tar1+1/3*tar2+1/3*tar3
final_data[:,8]=(final_data[:,2]+final_data[:,3]+final_data[:,4])*1/3
for i in final_data:
print(i)
# 提取股票的代码以及名称
final_data=np.hstack((final_data[:,:2],final_data[:,-1].reshape(-1,1)))
final_data_pandas=pd.DataFrame(final_data,columns=['code','name','debt_values'])
with open('step3/final_data_pandas.pkl','wb') as g:
pickle.dump(final_data_pandas,g)
for yangben in final_data_pandas.values:
name=str(yangben[0])+'\t'+str(yangben[1])+'\t'+str('%.3f'%yangben[2])+'\n'
with open('step2/the_result.txt','a') as f:
if yangben[0]==final_data_pandas.values[0][0]:
f.write('code'+'\t'+'name'+'\t'+'debt_values'+'\n')
f.write(name)
return final_data_pandas

if __name__=='__main__':
with open('step2/final_data.pkl','rb') as f:
data=pickle.load(f)
get_target(data)

5.
根据final_tar进行从大到小进行排序，可选取评分前500/100只股票。

import pandas as pd
import numpy as np
import pickle
def save_stocks(final_data_pandas):
# 按照综合指标从小到大进行排序
final_data_sort=final_data_pandas.sort_values(by='debt_values')
with open('step4/final_data_sort.pkl','wb') as f:
pickle.dump(final_data_sort,f)
num=0
for yangben in final_data_sort.values:
num+=1
name=str(yangben[0])+'\t'+str(yangben[1])+'\t'+str('%.3f'%yangben[2])+'\n'
with open('step3/the_result.txt','a') as f:
if yangben[0]==final_data_sort.values[0][0]:
f.write('code' + '\t' + 'name' + '\t' + 'debt_values' + '\n')
f.write(name)
if num==500:
break
if __name__=='__main__':
with open('step3/final_data_pandas.pkl','rb') as f:
data=pickle.load(f)
save_stocks(data)

6.通过均值方差模型进行进行组合优化。
均值方差模型：

# coding:utf-8
import tushare as ts
import numpy as np
import pandas as pd
import scipy.optimize as sco
import matplotlib.pyplot as plt
import pickle
def get_data():with open('step3/final_data_pandas.pkl', 'rb') as f:data_stockcode = pickle.load(f)# data_stockcode = pd.read_excel('results.xlsx')data = pd.DataFrame()for code in data_stockcode['code']:try:origin_data = ts.get_hist_data(code=str(code), start='2017-01-01', end='2017-7-31', ktype='D')data[str(code)] = origin_data['close']except:print(str(code))# print(data.isnull().sum())new_data = data.fillna(method='pad')with open('step4/new_data.pkl','wb') as f:pickle.dump(new_data,f)return new_datadef get_comb(new_data):# print(new_data.describe())# print(new_data.isnull().sum())noa=int(new_data.shape[1])returns = np.log(new_data / new_data.shift(1))variables=returns.cov()*noa# print(returns.head())# 夏普指数的负值最大化,def min_shar(weights):x_mean=(returns.mean().dot(weights.T))*noax_variable=np.sqrt(np.dot(weights.T,np.dot(variables,weights)))return -1*(x_mean/x_variable)weights_begin=np.random.random_sample(noa)# 增加限制条件，权重总和是1cons = ({'type': 'eq', 'fun': lambda x: np.sum(x) - 1})# 权重限制在0,1之间bnds = tuple((0, 1) for x in range(noa))ops=sco.minimize(min_shar,x0=weights_begin,method='SLSQP',constraints=cons,bounds=bnds)# print(ops['x'].round(3))print('---------')min_shar(ops['x'].round(3))#方差最小def min_variable(weights):x_variable=np.sqrt(np.dot(weights.reshape(1,-1),np.dot(variables,weights.reshape(-1,1))))return x_variableops2=sco.minimize(min_variable,x0=weights_begin,method='SLSQP',bounds=bnds,constraints=cons)print(ops2['x'])min_shar(ops2['x'])
#     组合的有效前沿,给定收益率，使得是最小的,约束条件有2个，一个是收益率是确定的，其次是投资组合之和是1target_profit=np.linspace(0.01,0.55,2000)all_variables=[]for tar in target_profit:cons=({'type':'eq','fun':lambda x:(returns.mean().dot(x.T))*noa-tar},{'type':'eq','fun':lambda x:np.sum(x)-1})bons=tuple((0,1) for i in range(noa))ops3=sco.minimize(min_variable,np.array(15*[1/15,]),method='SLSQP',bounds=bons,constraints=cons)print('目标收益%s'%tar)print(ops3['x'].round(3))# weights=ops3['fun']all_variables.append(ops3['fun'])# print(all_variables)# plt.title('profit-variables')# plt.xlabel('profit')# plt.ylabel('variables')# plt.grid(True)# plt.scatter(target_profit,all_variables,c='r',label='profit-variables')# plt.show()if __name__=='__main__':print(get_data())# with open('step3/final_data_pandas.pkl','rb') as f:#     data=pickle.load(f)# print(data)

基于tushare量化交易模型基础构建（偿债能力排名）相关推荐

如何构建一个可以盈利的量化交易模型
构建一个可盈利的量化交易模型需要以下步骤: 数据收集: 首先需要收集大量的历史金融数据, 包括价格, 成交量, 指标等. 数据预处理: 对收集的数据进行预处理, 清洗, 去重, 格式化等工作, 使其能 ...
python量化交易：基础知识_主流的比较流行的Python量化开源框架
原文链接:https://www.jianshu.com/p/1658f319bfdc talib talib的简称是Technical Analysis Library,主要功能是计算行情数据的技术 ...
转：量化交易零基础入门教程之——量化交易策略基本框架
感谢原作者:JoinQuant-TWist 转自:JoinQuant 原文链接:https://www.joinquant.com/view/community/detail/13151 重要提示:聚 ...
转：量化交易零基础入门教程之——python基本语法与变量
感谢原作者:JoinQuant-TWist 转自:JoinQuant 重要提示:聚宽提供了非常好的数据库接口,愁没研究数据的小伙伴可以加微信(jqdata01)详细了解原文链接:https://ww ...
R语言神经网络量化交易模型
上篇是逻辑回归模型,这次我们用神经网络模型.再算一遍,试试看 # 载入示例股票library(quantmod) getSymbols("^DJI", src = "ya ...
量化交易米筐构建一个完整策略
实现第一个股票策略 1.选股简单介绍选择某些表现比较好的股票作为股票池,从中进行交易的判断或者直接购买. 2.需求选股:获取市盈率大于50且小于65,营业总收入前10的股票调仓:每日调仓,将所有 ...
转：量化交易零基础入门教程之——获取典型常用数据
感谢原作者:JoinQuant-TWist 转自:JoinQuant 重要提示:聚宽提供了非常好的数据库接口,愁没研究数据的小伙伴可以加微信(jqdata01)详细了解原文链接:https://ww ...
基于Informer的股价预测（量化交易综述）
摘要股票市场是金融市场中不可或缺的组成部分.准确预测股票趋势对于投资者和市场参与者具有重要意义,因为它们可以指导投资决策.优化投资组合以及降低金融风险.而且可以提升国家国际地位以及金融风险控制能力, ...
转发保留不错一篇数学模型神经网络在程序化交易模型构建中的运用探讨
数学模型神经网络在程序化交易模型构建中的运用探讨作者:唐中目前,程序化交易已经成为国外投行和金融机构交易的主流手法,因为程序化交易是追求稳定持续的盈利模式,能够实现交易的稳定化,从而杜绝人工交易中 ...

基于tushare量化交易模型基础构建（偿债能力排名）

基于tushare量化交易模型基础构建（偿债能力排名）相关推荐

最新文章

热门文章