量化投资系列文章:

Backtrader 教程 — Python 量化投资原来这么简单(1)

Python 量化投资原来这么简单(2) —MACD策略(+26.9%)

Python 量化投资原来这么简单(3) —A股回测MACD策略

Python 量化投资原来这么简单(4) —KDJ 策略

Github仓库:https://github.com/Ckend/pythondict-quant


许多技术投资方面的教材,经常会用几幅上涨的图来表明某些指标的用处,实际上那些上涨的图很可能只是假象。作者为了证明他所强调的指标的作用,选定了符合该指标策略的股票上升趋势图,但实际上这些策略并不一定适合全部股票,许多人被傻傻地骗了进去,血本无归。

因此,判断一个策略的好坏一定要有回测证据。我们将在A股中随机抽取1000只股票,在2010年1月1日至2020年5月10日期间采用上回的 Python 量化投资原来这么简单(4) —KDJ 策略 进行交易,并计算得到其最终收益率。最后看正收益与负收益股票的对比,基于此来判断该策略是否具有通用性。

1.准备

开始之前,你要确保Python和pip已经成功安装在电脑上噢,如果没有,请访问这篇文章:超详细Python安装指南 进行安装。如果你用Python的目的是数据分析,可以直接安装Anaconda:Python数据分析与挖掘好帮手—Anaconda

Windows环境下打开Cmd(开始—运行—CMD),苹果系统环境下请打开Terminal(command+空格输入Terminal),准备开始输入命令安装依赖。

当然,我更推荐大家用VSCode编辑器,把本文代码Copy下来,在编辑器下方的终端运行命令安装依赖模块,多舒服的一件事啊:Python 编程的最好搭档—VSCode 详细指南。

在终端输入以下命令安装我们所需要的依赖模块:

pip install backtrader

看到 Successfully installed xxx 则说明安装成功。

Backtrader基本使用请看我们前一篇文章:
backtrader教程—量化投资原来这么简单(1)

本文全部代码,请在Python实用宝典后台回复:量化投资5 进行下载。

2.编写策略

这一部分与 Python 量化投资原来这么简单(3) —A股回测MACD策略 非常相似,不过有许多读者反映看不懂,事实上真的非常简单,可能是由于要显示许多交易日志,大家被代码弄晕了。因此这一篇文章我将详细解析每一个步骤,为了方便阅读,我把所有的日志显示代码都去除了,以清除地展示代码逻辑。

不过值得一提的是,我们在这采用的投资回报率的计算都是静态的,即本金多少,最后相比之下盈余多少作为我们的回报率,而且每次交易只买入100股,这是非常不智能的,在下一篇文章中,我们将实现动态买入股数计算投资回报率。

2.1 计算指标

第一步,构建我们的KDJ指标,在上篇Python KDJ量化投资中我们提到了KDJ的几个计算方法。此外,我们根据MACD指标优化了买入策略,你可以在 Python MACD量化投资 中阅读详细的教程。

根据这两篇文章,我们知道KDJ指标计算方法如下:

  • RSV = (收盘价-N周期最低价)/(N周期最高价-N周期最低价)*100
  • K值 = RSV的N周期加权移动平均值(EMA)
  • D值 = K值的N周期加权移动平均值(EMA)
  • J值 = 3K-2D

MACD指标计算方法如下(EMA后的括号表示周期):

  • MACD=价格EMA(12) – 价格EMA(26).
  • 信号线=MACD的EMA(9)

这样,我们就可以开始计算这些指标了,在Backtrader中计算这些指标非常方便,最高价、最低价、EMA都有内置函数计算,比如bt.indicators.EMA用于计算EMA的值,period参数表示周期。计算方法如下:

import datetime
import os.path
import sys
import pickle
import backtrader as bt
from backtrader.indicators import EMA

class TestStrategy(bt.Strategy):

    def __init__(self):
        self.dataclose = self.datas[0].close
        self.volume = self.datas[0].volume

        self.order = None
        self.buyprice = None
        self.buycomm = None

        # 9个交易日内最高价
        self.high_nine = bt.indicators.Highest(self.data.high, period=9)
        # 9个交易日内最低价
        self.low_nine = bt.indicators.Lowest(self.data.low, period=9)
        # 计算rsv值
        self.rsv = 100 * bt.DivByZero(
            self.data_close - self.low_nine, self.high_nine - self.low_nine, zero=None
        )
        # 计算rsv的3周期加权平均值,即K值
        self.K = bt.indicators.EMA(self.rsv, period=3, plot=False)
        # D值=K值的3周期加权平均值
        self.D = bt.indicators.EMA(self.K, period=3, plot=False)
        # J=3*K-2*D
        self.J = 3 * self.K - 2 * self.D

        # MACD策略参数
        me1 = EMA(self.data, period=12)
        me2 = EMA(self.data, period=26)
        self.macd = me1 - me2
        self.signal = EMA(self.macd, period=9)
        bt.indicators.MACDHisto(self.data)

2.2 策略买入卖出与运行

我们根据上一篇文章提到的,基于MACD金叉进行买入,基于KDJ死叉进行卖出 构建我们的买入卖出量化策略:

    # 接上部分代码
    # Python 实用宝典
    def next(self):

        if not self.position:
            # 买入:基于MACD策略
            condition1 = self.macd[-1] - self.signal[-1]
            condition2 = self.macd[0] - self.signal[0]
            if condition1 < 0 and condition2 > 0:
                self.order = self.buy()

        else:
            # 卖出:基于KDJ策略
            condition1 = self.J[-1] - self.D[-1]
            condition2 = self.J[0] - self.D[0]
            if condition1 > 0 or condition2 < 0:
                self.order = self.sell()

这样,我们的策略就构建完毕了,这个TestStrategy类至此结束。接下来让策略运行起来,为方便回测A股,我们把运行策略部分封装成了一个函数,以方便回测大量数据:

def run_cerebro(stock_file, result):
    """
    运行策略
    :param stock_file: 股票数据文件位置
    :param result: 回测结果存储变量
    """

    cerebro = bt.Cerebro()

    cerebro.addstrategy(TestStrategy)

    # 加载数据到模型中
    data = bt.feeds.GenericCSVData(
        dataname=stock_file,
        fromdate=datetime.datetime(2010, 1, 1),
        todate=datetime.datetime(2020, 5, 10),
        dtformat="%Y%m%d",
        datetime=2,
        open=3,
        high=4,
        low=5,
        close=6,
        volume=10,
        reverse=True,
    )
    cerebro.adddata(data)

    # 本金10000,每次交易100股
    cerebro.broker.setcash(10000)
    cerebro.addsizer(bt.sizers.FixedSize, stake=100)

    # 万五佣金
    cerebro.broker.setcommission(commission=0.0005)

    # 运行策略
    cerebro.run()

    # 剩余本金
    cerebro.broker.get_value()
    money_left = cerebro.broker.getvalue()

    # 获取股票名字
    stock_name = stock_file.split("\\")[-1].split(".csv")[0]

    # 将最终回报率以百分比的形式返回
    result[stock_name] = float(money_left - 10000) / 10000

将股票数据文件和一个变量传入该函数,你就能得到该股票使用此策略的整体回报率。这里回报率的计算其实并不准确,因为我们每次仅交易100股,有些股票其实走势不错,但是买的太少会出现投资回报率很低的情况,甚至有些股票100股的价格会超过本金导致交易无法进行。

这些问题我们将在下一篇文章中解决,本篇文章只考虑该策略在A股中的整体盈余和亏损情况。

3.A股回测

我们将遍历抽取出来的1000只股票数据,计算出该策略在这些股票上的投资回报率,我们重点观察的是盈余股票的数量和亏损股票的数量。

files_path = "./thoudsand_stocks/"
result = {}

# 遍历所有股票数据
for stock in os.listdir(files_path):
    modpath = os.path.dirname(os.path.abspath(sys.argv[0]))
    datapath = os.path.join(modpath, files_path + stock)
    print(datapath)
    try:
        run_cerebro(datapath, result)
    except Exception as e:
        print(e)

这样,针对每一只股票都会运行一遍策略,然后将最终的盈余值放入result变量中。

然后我们再针对result变量进行相应的最最最简单分析:

# 计算
pos = []
neg = []
for data in result:
    res = result[data]
    if res > 0:
        pos.append(res)
    else:
        neg.append(res)
print(f'正收益数量: {len(pos)}, 负收益数量:{len(neg)}')

得到的结果如下,有些股票数据不足被遗弃:

正收益数量: 430, 负收益数量:568

从结果上看,显然,如果我们不考虑基本面,单纯地买入符合该策略的股票,最终很大可能是亏损的。许多技术投资方面的教材,用了几幅上涨的图来表明这些指标的用处,实际上那些上涨的图只是假象,但是许多人被傻傻地骗了进去,血本无归。

量化投资就是为了避免这种情况的发生,某些技术策略你觉得靠谱,那你就需要回测出一个证据来,靠几个上涨的图示来强调一个指标的好坏其实没有说服力,而根据没有证据的技术策略进行投资,和赌博无太大区别。

我们的文章到此就结束啦,如果你喜欢今天的 Python 教程,请持续关注Python实用宝典。

有任何问题,可以在公众号后台回复:加群,回答相应验证信息,进入互助群询问。

原创不易,希望你能在下面点个赞和在看支持我继续创作,谢谢!


​Python实用宝典 ( pythondict.com )
不只是一个宝典
欢迎关注公众号:Python实用宝典

Pandas 性能优化

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。