当前位置: 首页 > news >正文

【PA交易】BackTrader(一): 如何使用实时tick数据和蜡烛图

背景和需求

整合Tick数据是PA交易的回测与实盘基本需求。多数交易回测框架往往缺乏对大规模Tick数据直接而全面的支持。Tick数据因其体量庞大(例如,某棕榈油主力合约四年间的数据达8GB)为结合价格趋势与PA分析带来挑战,凸显了实时动态数据源的重要性。实时数据不仅能应对数据规模问题,还能减少因数据时序差异引发的回测或实盘错误,确保分析准确性。

这里提及的8GB棕榈油合约Tick数据已转存MySQL数据库格式,并在文末以笔者整理后的SQL导出文件形式提供下载,数据仅供研究与测试,勿用作商业用途。

概述

在探索Backtrader时,我注意到将其与Tick数据集成至回测流程颇为简便,故撰写系列笔记以记录并分享这一过程。本笔记基于当前版本Backtrader编写。未来或许有更优框架或Backtrader自身改进Tick数据处理方式,目前而言,本系列文章提供的Tick数据与K线结合的免费解决方案,是非常易于上手的免费选择之一。

本系列《BackTrader如何使用实时tick数据和蜡烛图》预计将分成上中下三篇:

  • 上篇:本文,较水,对背景和DataFeed做出介绍,同时介绍tick数据如何读取到回测策略流程中。完整读完后可以做到将tick数据加入到BackTrader策略中。
  • 中篇:待完成,主要介绍如何将tick结合KBar同时读取到回测策略流程中。
  • 下篇:待完成,主要介绍跨周期回测,可看做Multiple Timeframes结合tick的实操记录。

《BackTrader如何使用实时tick数据和蜡烛图》系列小文,属于PA交易和量化交易文集。PA交易和量化交易文集将会主要专注于低频Python实现。对于一些高频部分目前暂不涉及。鉴于高频本身对于网络和硬件要求较高,多数朋友(包括笔者)可能都没有交易所托管或者购买高性能计算的计划,并且目前笔者也没有转向高频C++的计划和需求。

PS:题外话:笔者十多年艹C艹经验都懒得用C艹。

笔者交易市场主要为国内商品期货市场,个人平时主要做农产品基本面分析,后续计划考虑进行对包括油厂、美农、拉尼娜等各类数据进行一些因子挖掘工作。个人精力有限,有相关爱好的朋友有缘可以寻找合作机会。

BackTrader

之所以选择BackTrade主要原因有以下几点:

  • 相比于pyAlgoTrade:目前Gabriel Becedillas大神已经全面转到 basana 开发,不再更新pyAlgoTrade。巴萨那主要专注于加密币,担心代码中一些跟币圈相关的词汇会迷惑。
  • 相比于vnpy:VeighNa封装过多,缺乏灵活性。使用其集成平台那就会失去灵活性,图省事的话不如使用其他一些集成平台了。另外,记得林园大佬说过一句话,一家公司发生减持,管他什么原因呢,不买就是了。同理,vnpy.cn还是vnpy.com分不清就都不用了吧。

本文适合已经至少完成了BackTrade的Quickstart Guide - Backtrader有需求的朋友阅读,如果还对BackTrader一窍不通,可以花上15分钟简单阅读以下官方的文档,并实操一下,简单单步调试一下源码。

DataFeed

BackTrader的数据源主要由Data Feeds - Backtrader模块进行处理, 其中大量使用了元编程技巧。底层实现中元类(metaclasses)。DataFeed底层主要核心数据通过LineBuffer进行封装。LineBuffer数据由LineRoot持有,自LineRoot以下的继承关系如下图所示:

其中代码逻辑比较简单的是PandasData,我们可以把它看做一个自定义DataFeed的示例,根据这个类的实现自己定制数据源。

Lines

DataFeed中数据是通过LineBuffer和策略模块进行共享,在上层OHLC中定义了7个标准的数据LineBuffer:

class OHLC(DataSeries):lines = ('close', 'low', 'high', 'open', 'volume', 'openinterest',)class OHLCDateTime(OHLC):lines = (('datetime'),)

因为类hierarchy的限制,我们拓展DataFeed需要从AbstractDataBase或者DataBase层面进行集成,否则将会面临大量底层逻辑代码的重复实现。如上类图所见,包括PandasData在内的绝大多数BackTrader内置数据源类型都是继承于DataBase。

下面我们首先基于class PandasData(feed.DataBase)实现一个基础的tick数据加入到策略运行过程的示例,之后使用动态tick数据。这个实现实现非常简单,并不需要太多高深的编程技能。

测试CSV

 为简化测试开发流程, 便于说明理解,使用我上传的CSV文件DCE.m2501.tick.202402,大小2M,比较适合框架开发过程的测试:https://download.csdn.net/download/u012677852/89460596?spm=1001.2014.3001.5503icon-default.png?t=N7T8https://download.csdn.net/download/u012677852/89460596?spm=1001.2014.3001.5503

这个文件是笔者采集的实盘豆粕合约数据,因为不是主力合约,数据量较小适合测试开发使用。

对于如何验证网络实盘tick数据,可以参考我的文章:【PA交易】前端根据内盘商品期货Tick数据合并日线Bar-CSDN博客

下文及后文如有需要,一律直接使用该文件名,不再特殊说明。

静态读入tick数据

如前所述,为了能够支持策略运行过程中使用tick数据源,首先定义一个数据类继承自bt.feed.DataBase。因为我们此步骤仅仅使用静态数据进行调通,所以类定义如下:

class MyDataFeedStatic(bt.feed.DataBase):

因为我们是tick数据,其中的数据字段是类继承结构上层OHLC中没有定义的Line,所以我们需要使用一个tuple声明他们:


lines = (('price', 'vol', 'amount', 'ccl', 'bid', 'bidVol', 'ask', 'askVol'))

之后为了简便起见,直接将测试CSV读取的DF保存在类中,并且指定一个_idx表示当前读取到的DF的行索引, 如下所示:


class MyDataFeedStatic(bt.feed.DataBase):lines = (('price', 'vol', 'amount', 'ccl', 'bid', 'bidVol', 'ask', 'askVol'))def __init__(self, df):super(MyDataFeedStatic, self).__init__()self.df = dfself._idx = 0

之后需要重载_load方法, 该方法由AbstractDataBase的load方法调用, 具体相关调用逻辑可以参考BackTrader源码。我们这里简单的逐行使用读取DF数据的方式实现这个方法:

def _load(self):if self._idx >= len(self.df):# exhausted all rowsreturn Falsefor datafield in self.getlinealiases():if datafield == 'tickdt':continueif datafield in TICK_DATA_COLUMNS:line = getattr(self.lines, datafield)line[0] = self.df[datafield].iloc[self._idx]# print(f'load {datafield} success')# -------------------------------------------# 添加日期时间tstamp = self.df['tickdt'].iloc[self._idx]self.lines.datetime[0] = date2num(tstamp)self._idx += 1return True


注意测试文件中的datatime使用的是tickdt作为列名,在BackTrader底层中会依赖datatime字段,这里因为数据中本来没有dataname字段,所以必须填充这个Line。

此时,一个简单的基于tick的数据源已经实现了,我们来使用它。首先装载过程,只需要预先读取一个DF,并传入即可:

df = pd.read_csv('./datas/DCE.m2501.tick.202402.csv')
df['tickdt'] = pd.to_datetime(df['tickdt'])
data_feed = sfeed.MyDataFeedStatic(df)
cerebro.adddata(data_feed)

之后在策略构造函数中,为了后续使用方便,可以给每条管线起一个别名:

class TestStrategy(bt.Strategy):def __init__(self):# Ticks 字段self.tickdt = self.datas[0].datetimeself.price = self.datas[0].priceself.vol = self.datas[0].closeself.amount = self.datas[0].amountself.ccl = self.datas[0].cclself.bid = self.datas[0].bidself.bidVol = self.datas[0].bidVolself.ask = self.datas[0].askself.askVol = self.datas[0].askVolself.local_tz = get_localzone()

之后在next方法中就可以访问到具体每个Tick的数据了:


def log(self, txt, dt=None):''' 本地化时间输出 '''utc_datetime = self.datetime if dt is None else dtdate = utc_datetime.date(0, tz=self.local_tz)time = utc_datetime.time(0, tz=self.local_tz)print('%s %s: %s' % (date, time, txt))def next(self):self.log('Tick price, %.2f' % self.price[0], self

输出:

2024-02-01 17:00:00.059001: Tick price, 3127.00
2024-02-01 17:00:00.558999: Tick price, 3126.00
2024-02-01 17:00:01.058996: Tick price, 3126.00
2024-02-01 17:00:01.557997: Tick price, 3126.00
.....

实时运行

当我们运行策略时,会发现策略的next方法并不是紧跟着数据源的_load方法运行。这是因为当前的策略运行不是实时模式。还需要在数据源类MyDataFeedStatic中Override一个方法:

class MyDataFeedStatic(...):def islive(self):return True

这样策略将以实时模式运行,_load()函数中打印日志可以看到每次load运行之后才会运行策略的next函数。

题外话

这里的DF读写仅仅是一个模拟数据逐条实时传入的方式。考虑到数据源的复杂性,作为分享,这是我所使用的基础架构:

架构中抽象出一个数据模块,这个模块负责全部的数据处理,无论数据来自于CSV、数据库还是CTP。而MyDataFeed实际充当了一个数据模块和策略运行之间的Bridge角色(adapter)。MyDataFeed会在_load函数中向数据模块索要数据,如果数据没有就绪,则会阻塞操作(可以在当前示例代码中添加sleep(0.5)模拟CTP)。这样无论回测还是实盘,在数据管理都实现了一致性,即:一个策略的书写可以兼容不同场景,当我们回测夏普优秀,SimNow模拟回报丰厚的时候,我们可以通过切换数据模块参数的方式将策略快速无缝切换到实盘。

继续阅读

下篇文章将会首先将本文中的简单读取DF改为一个模拟上述架构中的简单的数据读取器。之后实现Tick和K Bar同时传递到策略中。

更多测试数据:

如果需要更多测试数据,可以下载这里的tic数据文件,已经整理成MySQL表,这里是导出的SQL,后续会更新更多其他测试数据:

内盘期货棕榈, 主力1、5、9月合约2020年到2024年TICK数据

链接:https://pan.baidu.com/s/1UTt9Ei0dSaQ971Iq-YPIGA?pwd=j7hq 
提取码:j7hq 

(仅限测试开发学习使用, 请勿商用)

相关文章:

【PA交易】BackTrader(一): 如何使用实时tick数据和蜡烛图

背景和需求 整合Tick数据是PA交易的回测与实盘基本需求。多数交易回测框架往往缺乏对大规模Tick数据直接而全面的支持。Tick数据因其体量庞大(例如,某棕榈油主力合约四年间的数据达8GB)为结合价格趋势与PA分析带来挑战,凸显了实时…...

HTML(16)——边距问题

清楚默认样式 很多标签都有默认的样式,往往我们不需要这些样式,就需要清楚默认样式 写法: 用通配符选择器,选择所有标签,清除所有内外边距选中所有的选择器清楚 *{ margin:0; padding:0; } 盒子模型——元素溢出 作…...

【Godot4自学手册】第四十二节实现拖拽进行物品交换和数量叠加

这一节我们主要学习背包系统中的物品拖拽后,物品放到新的位置,或交换物品位置,如果两个物品属于同一物品则数量相加。具体效果如下: 一、修改item.tscn场景 给item.tscn场景的根节点Item添加Label子节点,命名为Numv…...

存储系统概述

目录 层次结构 存储器的分类 存储器的编址和端模式 存储器端模式 存储器的技术指标 1. 存储容量 示例: 2. 访问速度 访问速度的表现形式: 示例: 3. 功耗 示例: 4. 可靠性 可靠性指标: 示例:…...

Trilium windows上修改笔记目录,创建多个笔记空间方法

一开始使用trilium会非常的不舒服,不像是obsidian可以创建多个笔记空间,指定多个笔记目录。这里摸索到了解决方案 修改目录的方法一 ——修改系统环境变量 打开控制面板-系统-高级系统设置 新增如上条目 修改目录的方法二——直接写bat脚本运行 新建位…...

<Rust><iced>在iced中显示gif动态图片的一种方法

前言 本文是在rust的GUI库iced中在窗口显示动态图片GIF格式图片的一种方法。 环境配置 系统:window 平台:visual studio code 语言:rust 库:iced、image 概述 在iced中,提供了image部件,从理论上说&…...

【Unity设计模式】状态编程模式

前言 最近在学习Unity游戏设计模式,看到两本比较适合入门的书,一本是unity官方的 《Level up your programming with game programming patterns》 ,另一本是 《游戏编程模式》 这两本书介绍了大部分会使用到的设计模式,因此很值得学习 本…...

圆的面积并三角形面积并

三角形面积并 #include<iostream> #include<cstring> #include<algorithm> #include<cmath> #include<vector> using namespace std; const int maxn 110; #define x first #define y second typedef pair<double, double> PDD; const d…...

Spring Data JPA介绍与CRUD实战演练

文章目录 一、Spring Data JPA 简介二、Spring Data JPA 与 MyBatis Plus 比较设计哲学和抽象层次SQL 控制学习曲线和技术要求性能与优化综合考虑 三、SpringDataJpa实战演练1. 创建user表2. 搭建Spring Boot开发环境3. pom.xml文件内容4. application.yml文件内容5. Applicati…...

Python网络爬虫实战6—下一页,模拟用户点击,切换窗口

【前期提要】感兴趣的可以看看往期文章哈~ Python网络爬虫5-实战网页爬取 Python网络爬虫4-实战爬取pdf Pyhon网络爬虫3-模拟用户点击 Python网络爬虫实战2-下载url下的pdf Python网络爬虫基础1 1.需求背景 针对长虹美菱电器说明书网页形式&#xff0c;编写爬虫代码&#xff…...

Notepad++插件 Hex-Edit

Nptepad有个Hex文件查看器&#xff0c;苦于每次打开文件需要手动开插件显示Hex&#xff0c;配置一下插件便可实现打开即调用 关联多个二进制文件&#xff0c;一打开就使用插件的方法&#xff0c;原来是使用空格分割&#xff01;&#xff01;&#xff01;...

Matlab要这样批量读取txt数据!科研效率UpUp第10期

假如我们有多组txt格式的数据&#xff1a; 其数据格式是这样的&#xff1a; 想要批量读取这些数据&#xff0c;并把他们画在一张图上&#xff0c;该怎么操作呢&#xff1f; ​之前有分享load函数的版本&#xff0c;本期进一步分享适用性更强的readtable函数的实现方法​。 首…...

buuctf----firmware

- -一定不能再ubutu22进行,我是在18(血泪教训) binwalk安装 buuctf firmware(binwalk和firmware-mod-kit的使用)_buu firmware-CSDN博客 参考博客 指令 sudo apt-get update sudo apt-get install python3-dev python3-setuptools python3-pip zlib1g-dev libmagic-dev pi…...

ssl证书90天过期?保姆级教程——使用acme.sh实现证书的自动续期

腾讯云相关文档相关参考-有的点不准确 前言 最近https到期了&#xff0c;想着手动更新一下https证书&#xff0c;结果发现证书现在的有效期只有90天&#xff0c;于是想找到一个自动更新证书的工具&#xff0c;发现了acme.sh&#xff0c;但是网上的文章质量参差不齐&#xff0…...

由于bug造成truncate table卡住问题

客户反应truncate table卡主&#xff0c;检查awr发现多个truncate在awr报告期内一直没执行完&#xff0c;如下&#xff1a; 检查ash&#xff0c;truncate table表的等待事件都是“enq: RO - fast object reuse”和“local write wait” 查找“enq: RO - fast object reuse”&am…...

Charles抓包工具系列文章(二)-- Repeat 回放http请求

一、什么是http请求回放 当我们对客户端进行抓包&#xff0c;经常会想要重试http请求&#xff0c;或者改写原有部分进行重新请求&#xff0c;都需要用到回放http请求。 还有一种场景是压力测试&#xff0c;对一个请求进行重复请求多少次&#xff0c;并加上适当的并发度。 这里…...

jemeter基本使用

后端关验签&#xff0c;设置请求头编码和token 配置编码和token...

【Golang】Steam 创意工坊 Mod 文件夹批量重命名

本文将介绍一个使用Go语言编写的脚本&#xff0c;其主要功能是解析XML文件并基于解析结果重命名文件夹。这个脚本适用于需要对文件夹进行批量重命名&#xff0c;并且重命名规则依赖于XML文件内容的情况。 脚本功能概述 Steam创意工坊下载的Mod文件夹批量重命名为id名称 运行前…...

求职刷题力扣DAY33--贪心算法part04

DAY 33 贪心算法part04 1. 452. 用最少数量的箭引爆气球 有一些球形气球贴在一堵用 XY 平面表示的墙面上。墙面上的气球记录在整数数组 points &#xff0c;其中points[i] [xstart, xend] 表示水平直径在 xstart 和 xend之间的气球。你不知道气球的确切 y 坐标。 一支弓箭可…...

aws的eks(k8s)ingress+elb部署实践

eks&#xff08;k8s&#xff09;版本1.29 ingress 版本1.10.0 负载均衡elb 1. 创建Ingress-Nginx服务 部署项目地址【点我跳转】推荐自定义部署 可绑定acm证书什么的自己属性 这里就是aws上面Certificate Manager产品上面创建证书 导入 创建都行 对应集群版本推荐阵列GitH…...

地震勘探——干扰波识别、井中地震时距曲线特点

目录 干扰波识别反射波地震勘探的干扰波 井中地震时距曲线特点 干扰波识别 有效波&#xff1a;可以用来解决所提出的地质任务的波&#xff1b;干扰波&#xff1a;所有妨碍辨认、追踪有效波的其他波。 地震勘探中&#xff0c;有效波和干扰波是相对的。例如&#xff0c;在反射波…...

51c自动驾驶~合集58

我自己的原文哦~ https://blog.51cto.com/whaosoft/13967107 #CCA-Attention 全局池化局部保留&#xff0c;CCA-Attention为LLM长文本建模带来突破性进展 琶洲实验室、华南理工大学联合推出关键上下文感知注意力机制&#xff08;CCA-Attention&#xff09;&#xff0c;…...

Appium+python自动化(十六)- ADB命令

简介 Android 调试桥(adb)是多种用途的工具&#xff0c;该工具可以帮助你你管理设备或模拟器 的状态。 adb ( Android Debug Bridge)是一个通用命令行工具&#xff0c;其允许您与模拟器实例或连接的 Android 设备进行通信。它可为各种设备操作提供便利&#xff0c;如安装和调试…...

Spring Boot 实现流式响应(兼容 2.7.x)

在实际开发中&#xff0c;我们可能会遇到一些流式数据处理的场景&#xff0c;比如接收来自上游接口的 Server-Sent Events&#xff08;SSE&#xff09; 或 流式 JSON 内容&#xff0c;并将其原样中转给前端页面或客户端。这种情况下&#xff0c;传统的 RestTemplate 缓存机制会…...

UE5 学习系列(三)创建和移动物体

这篇博客是该系列的第三篇&#xff0c;是在之前两篇博客的基础上展开&#xff0c;主要介绍如何在操作界面中创建和拖动物体&#xff0c;这篇博客跟随的视频链接如下&#xff1a; B 站视频&#xff1a;s03-创建和移动物体 如果你不打算开之前的博客并且对UE5 比较熟的话按照以…...

大语言模型如何处理长文本?常用文本分割技术详解

为什么需要文本分割? 引言:为什么需要文本分割?一、基础文本分割方法1. 按段落分割(Paragraph Splitting)2. 按句子分割(Sentence Splitting)二、高级文本分割策略3. 重叠分割(Sliding Window)4. 递归分割(Recursive Splitting)三、生产级工具推荐5. 使用LangChain的…...

学校招生小程序源码介绍

基于ThinkPHPFastAdminUniApp开发的学校招生小程序源码&#xff0c;专为学校招生场景量身打造&#xff0c;功能实用且操作便捷。 从技术架构来看&#xff0c;ThinkPHP提供稳定可靠的后台服务&#xff0c;FastAdmin加速开发流程&#xff0c;UniApp则保障小程序在多端有良好的兼…...

linux 下常用变更-8

1、删除普通用户 查询用户初始UID和GIDls -l /home/ ###家目录中查看UID cat /etc/group ###此文件查看GID删除用户1.编辑文件 /etc/passwd 找到对应的行&#xff0c;YW343:x:0:0::/home/YW343:/bin/bash 2.将标红的位置修改为用户对应初始UID和GID&#xff1a; YW3…...

MySQL用户和授权

开放MySQL白名单 可以通过iptables-save命令确认对应客户端ip是否可以访问MySQL服务&#xff1a; test: # iptables-save | grep 3306 -A mp_srv_whitelist -s 172.16.14.102/32 -p tcp -m tcp --dport 3306 -j ACCEPT -A mp_srv_whitelist -s 172.16.4.16/32 -p tcp -m tcp -…...

ip子接口配置及删除

配置永久生效的子接口&#xff0c;2个IP 都可以登录你这一台服务器。重启不失效。 永久的 [应用] vi /etc/sysconfig/network-scripts/ifcfg-eth0修改文件内内容 TYPE"Ethernet" BOOTPROTO"none" NAME"eth0" DEVICE"eth0" ONBOOT&q…...