量化投资系列文章:
Backtrader 教程 — Python 量化投资原来这么简单(1)
Python 量化投资原来这么简单(2) —MACD策略(+26.9%)
Python 量化投资原来这么简单(3) —A股回测MACD策略
Github仓库:https://github.com/Ckend/pythondict-quant
许多技术投资方面的教材,经常会用几幅上涨的图来表明某些指标的用处,实际上那些上涨的图很可能只是假象。作者为了证明他所强调的指标的作用,选定了符合该指标策略的股票上升趋势图,但实际上这些策略并不一定适合全部股票,许多人被傻傻地骗了进去,血本无归。
因此,判断一个策略的好坏一定要有回测证据。我们将在A股中随机抽取1000只股票,在2010年1月1日至2020年5月10日期间采用上回的 Python 量化投资原来这么简单(4) —KDJ 策略 进行交易,并计算得到其最终收益率。最后看正收益与负收益股票的对比,基于此来判断该策略是否具有通用性。
1.准备
开始之前,你要确保Python和pip已经成功安装在电脑上噢,如果没有,请访问这篇文章:超详细Python安装指南 进行安装。如果你用Python的目的是数据分析,可以直接安装Anaconda:Python数据分析与挖掘好帮手—Anaconda
Windows环境下打开Cmd(开始—运行—CMD),苹果系统环境下请打开Terminal(command+空格输入Terminal),准备开始输入命令安装依赖。
当然,我更推荐大家用VSCode编辑器,把本文代码Copy下来,在编辑器下方的终端运行命令安装依赖模块,多舒服的一件事啊:Python 编程的最好搭档—VSCode 详细指南。
在终端输入以下命令安装我们所需要的依赖模块:
pip install backtrader
看到 Successfully installed xxx 则说明安装成功。
Backtrader基本使用请看我们前一篇文章:
backtrader教程—量化投资原来这么简单(1)
本文全部代码,请在Python实用宝典后台回复:量化投资5 进行下载。
2.编写策略
这一部分与 Python 量化投资原来这么简单(3) —A股回测MACD策略 非常相似,不过有许多读者反映看不懂,事实上真的非常简单,可能是由于要显示许多交易日志,大家被代码弄晕了。因此这一篇文章我将详细解析每一个步骤,为了方便阅读,我把所有的日志显示代码都去除了,以清除地展示代码逻辑。
不过值得一提的是,我们在这采用的投资回报率的计算都是静态的,即本金多少,最后相比之下盈余多少作为我们的回报率,而且每次交易只买入100股,这是非常不智能的,在下一篇文章中,我们将实现动态买入股数计算投资回报率。
2.1 计算指标
第一步,构建我们的KDJ指标,在上篇Python KDJ量化投资中我们提到了KDJ的几个计算方法。此外,我们根据MACD指标优化了买入策略,你可以在 Python MACD量化投资 中阅读详细的教程。
根据这两篇文章,我们知道KDJ指标计算方法如下:
- RSV = (收盘价-N周期最低价)/(N周期最高价-N周期最低价)*100
- K值 = RSV的N周期加权移动平均值(EMA)
- D值 = K值的N周期加权移动平均值(EMA)
- J值 = 3K-2D
MACD指标计算方法如下(EMA后的括号表示周期):
- MACD=价格EMA(12) – 价格EMA(26).
- 信号线=MACD的EMA(9)
这样,我们就可以开始计算这些指标了,在Backtrader中计算这些指标非常方便,最高价、最低价、EMA都有内置函数计算,比如bt.indicators.EMA用于计算EMA的值,period参数表示周期。计算方法如下:
import datetime import os.path import sys import pickle import backtrader as bt from backtrader.indicators import EMA class TestStrategy(bt.Strategy): def __init__(self): self.dataclose = self.datas[0].close self.volume = self.datas[0].volume self.order = None self.buyprice = None self.buycomm = None # 9个交易日内最高价 self.high_nine = bt.indicators.Highest(self.data.high, period=9) # 9个交易日内最低价 self.low_nine = bt.indicators.Lowest(self.data.low, period=9) # 计算rsv值 self.rsv = 100 * bt.DivByZero( self.data_close - self.low_nine, self.high_nine - self.low_nine, zero=None ) # 计算rsv的3周期加权平均值,即K值 self.K = bt.indicators.EMA(self.rsv, period=3, plot=False) # D值=K值的3周期加权平均值 self.D = bt.indicators.EMA(self.K, period=3, plot=False) # J=3*K-2*D self.J = 3 * self.K - 2 * self.D # MACD策略参数 me1 = EMA(self.data, period=12) me2 = EMA(self.data, period=26) self.macd = me1 - me2 self.signal = EMA(self.macd, period=9) bt.indicators.MACDHisto(self.data)
2.2 策略买入卖出与运行
我们根据上一篇文章提到的,基于MACD金叉进行买入,基于KDJ死叉进行卖出 构建我们的买入卖出量化策略:
# 接上部分代码 # Python 实用宝典 def next(self): if not self.position: # 买入:基于MACD策略 condition1 = self.macd[-1] - self.signal[-1] condition2 = self.macd[0] - self.signal[0] if condition1 < 0 and condition2 > 0: self.order = self.buy() else: # 卖出:基于KDJ策略 condition1 = self.J[-1] - self.D[-1] condition2 = self.J[0] - self.D[0] if condition1 > 0 or condition2 < 0: self.order = self.sell()
这样,我们的策略就构建完毕了,这个TestStrategy类至此结束。接下来让策略运行起来,为方便回测A股,我们把运行策略部分封装成了一个函数,以方便回测大量数据:
def run_cerebro(stock_file, result): """ 运行策略 :param stock_file: 股票数据文件位置 :param result: 回测结果存储变量 """ cerebro = bt.Cerebro() cerebro.addstrategy(TestStrategy) # 加载数据到模型中 data = bt.feeds.GenericCSVData( dataname=stock_file, fromdate=datetime.datetime(2010, 1, 1), todate=datetime.datetime(2020, 5, 10), dtformat="%Y%m%d", datetime=2, open=3, high=4, low=5, close=6, volume=10, reverse=True, ) cerebro.adddata(data) # 本金10000,每次交易100股 cerebro.broker.setcash(10000) cerebro.addsizer(bt.sizers.FixedSize, stake=100) # 万五佣金 cerebro.broker.setcommission(commission=0.0005) # 运行策略 cerebro.run() # 剩余本金 cerebro.broker.get_value() money_left = cerebro.broker.getvalue() # 获取股票名字 stock_name = stock_file.split("\\")[-1].split(".csv")[0] # 将最终回报率以百分比的形式返回 result[stock_name] = float(money_left - 10000) / 10000
将股票数据文件和一个变量传入该函数,你就能得到该股票使用此策略的整体回报率。这里回报率的计算其实并不准确,因为我们每次仅交易100股,有些股票其实走势不错,但是买的太少会出现投资回报率很低的情况,甚至有些股票100股的价格会超过本金导致交易无法进行。
这些问题我们将在下一篇文章中解决,本篇文章只考虑该策略在A股中的整体盈余和亏损情况。
3.A股回测
我们将遍历抽取出来的1000只股票数据,计算出该策略在这些股票上的投资回报率,我们重点观察的是盈余股票的数量和亏损股票的数量。
files_path = "./thoudsand_stocks/" result = {} # 遍历所有股票数据 for stock in os.listdir(files_path): modpath = os.path.dirname(os.path.abspath(sys.argv[0])) datapath = os.path.join(modpath, files_path + stock) print(datapath) try: run_cerebro(datapath, result) except Exception as e: print(e)
这样,针对每一只股票都会运行一遍策略,然后将最终的盈余值放入result变量中。
然后我们再针对result变量进行相应的最最最简单分析:
# 计算 pos = [] neg = [] for data in result: res = result[data] if res > 0: pos.append(res) else: neg.append(res) print(f'正收益数量: {len(pos)}, 负收益数量:{len(neg)}')
得到的结果如下,有些股票数据不足被遗弃:
正收益数量: 430, 负收益数量:568
从结果上看,显然,如果我们不考虑基本面,单纯地买入符合该策略的股票,最终很大可能是亏损的。许多技术投资方面的教材,用了几幅上涨的图来表明这些指标的用处,实际上那些上涨的图只是假象,但是许多人被傻傻地骗了进去,血本无归。
量化投资就是为了避免这种情况的发生,某些技术策略你觉得靠谱,那你就需要回测出一个证据来,靠几个上涨的图示来强调一个指标的好坏其实没有说服力,而根据没有证据的技术策略进行投资,和赌博无太大区别。
我们的文章到此就结束啦,如果你喜欢今天的 Python 教程,请持续关注Python实用宝典。
有任何问题,可以在公众号后台回复:加群,回答相应验证信息,进入互助群询问。
原创不易,希望你能在下面点个赞和在看支持我继续创作,谢谢!
Python实用宝典 ( pythondict.com )
不只是一个宝典
欢迎关注公众号:Python实用宝典