当前位置：首页 > news >正文

【量化课程】08_1.机器学习量化策略基础实战

news 2025/7/6 21:04:46

文章目录

- 1. 常用机器学习模型
- - 1.1 回归模型
  - 1.2 分类模型
  - - 1.2.1 SVC介绍
    - 1.2.2 SVC在量化策略中的应用
- 2. 机器学习量化策略实现的基本步骤
- 3. 策略实现

1. 常用机器学习模型

1.1 回归模型

线性回归
多层感知器回归
自适应提升树回归
随机森林回归

1.2 分类模型

线性分类
支持向量机
XGBoost分类
K近邻分类

1.2.1 SVC介绍

SVC（Support Vector Classifier）是一种在机器学习中常用的分类算法，它基于支持向量机（Support Vector Machine）算法。SVC通过寻找最佳的超平面来实现分类任务，在数据平面上进行线性或非线性的划分。

1.2.2 SVC在量化策略中的应用

在量化策略中，SVC（Support Vector Classifier）可以用于股票预测和交易决策。以下是SVC在量化策略中的应用步骤：

数据准备：首先，需要准备训练数据和测试数据。训练数据包括历史股票价格和相关特征，以及对应的标签（例如涨跌幅度）。测试数据包括最新的股票价格和特征，用于进行预测。
特征工程：根据历史股票数据，使用技术指标或其他特征工程方法构建特征。这些特征可能包括移动平均线、波动性指标、成交量等。
数据预处理：将训练数据和测试数据进行标准化，使其均值为0，方差为1。这可以提高分类算法的性能。
训练模型：使用训练数据训练SVC模型。在训练过程中，SVC将学习股票的价格模式和特征之间的关系。
模型预测：使用训练好的SVC模型对测试数据进行预测。根据预测结果，判断股票是涨还是跌。
交易决策：根据预测结果进行交易决策。例如，如果SVC预测股票会涨，可以选择买入；如果SVC预测股票会跌，可以选择卖出或不做操作。
交易执行：根据交易决策执行相应的交易操作。这可能涉及到下单、调整仓位等操作。
盈亏评估：根据交易结果评估策略的盈亏情况。可以计算交易收益、回撤等指标，进行策略的优化和调整。

需要注意的是，SVC作为机器学习算法，对数据的准备和特征工程至关重要。合理选择特征和调整参数可以显著影响SVC的预测性能。此外，量化策略中还需要考虑交易成本、风险管理和市场流动性等因素，以构建更加完整和可靠的策略。

2. 机器学习量化策略实现的基本步骤

加载数据
标注数据
特征工程，分割训练集和测试集
选择机器学习模型并配置适当的参数
训练模型
利用模型数据样本之外的数据进行回测
对回测结果进行可视化

3. 策略实现

本部分将介绍如何在BigQuant实现一个基于支持向量机模型的选股策略

from biglearning.api import M
from biglearning.api import tools as T
from bigdatasource.api import DataSource
from biglearning.module2.common.data import Outputs
from zipline.finance.commission import PerOrder# 对训练数据和测试数据进行标准化处理
def m6_run_bigquant_run(input_1, input_2, input_3):train_df = input_1.read()features = input_2.read()feature_min = train_df[features].quantile(0.005)feature_max = train_df[features].quantile(0.995)train_df[features] = train_df[features].clip(feature_min,feature_max,axis=1) data_1 = DataSource.write_df(train_df)test_df = input_3.read()test_df[features] = test_df[features].clip(feature_min,feature_max,axis=1)data_2 = DataSource.write_df(test_df)return Outputs(data_1=data_1, data_2=data_2, data_3=None)# 后处理函数
def m6_post_run_bigquant_run(outputs):return outputs# 处理每个交易日的数据
def m4_handle_data_bigquant_run(context, data):context.extension['index'] += 1if  context.extension['index'] % context.rebalance_days != 0:return date = data.current_dt.strftime('%Y-%m-%d')cur_data = context.indicator_data[context.indicator_data['date'] == date]cur_data = cur_data[cur_data['pred_label'] == 1.0]stock_to_buy =  list(cur_data.sort_values('instrument',ascending=False).instrument)[:context.stock_num]if date == '2017-02-06':print(date, len(stock_to_buy), stock_to_buy)# 获取当前持仓股票stock_hold_now = [equity.symbol for equity in context.portfolio.positions]# 需要保留的股票no_need_to_sell = [i for i in stock_hold_now if i in stock_to_buy]# 需要卖出的股票stock_to_sell = [i for i in stock_hold_now if i not in no_need_to_sell]for stock in stock_to_sell:if data.can_trade(context.symbol(stock)):context.order_target_percent(context.symbol(stock), 0)if len(stock_to_buy) == 0:returnweight =  1 / len(stock_to_buy)for stock in stock_to_buy:if data.can_trade(context.symbol(stock)):context.order_target_percent(context.symbol(stock), weight)# 准备工作
def m4_prepare_bigquant_run(context):pass# 初始化策略
def m4_initialize_bigquant_run(context):context.indicator_data = context.options['data'].read_df()context.set_commission(PerOrder(buy_cost=0.0003, sell_cost=0.0013, min_cost=5))context.rebalance_days = 5context.stock_num = 50if 'index' not in context.extension:context.extension['index'] = 0# 开盘前处理函数
def m4_before_trading_start_bigquant_run(context, data):pass# 获取2020年至2021年股票数据
m1 = M.instruments.v2(start_date='2020-01-01',end_date='2021-01-01',market='CN_STOCK_A',instrument_list='',max_count=0
)# 使用高级自动标注器获取标签
m2 = M.advanced_auto_labeler.v2(instruments=m1.data,label_expr="""shift(close, -5) / shift(open, -1)-1
rank(label)
where(label>=0.95,1,0)""",start_date='',end_date='',benchmark='000300.SHA',drop_na_label=False,cast_label_int=False
)# 输入特征
m3 = M.input_features.v1(features="""(close_0-mean(close_0,12))/mean(close_0,12)*100
rank(std(amount_0,15))
rank_avg_amount_0/rank_avg_amount_8
ts_argmin(low_0,20)
rank_return_30
(low_1-close_0)/close_0
ta_bbands_lowerband_14_0
mean(mf_net_pct_s_0,4)
amount_0/avg_amount_3
return_0/return_5
return_1/return_5
rank_avg_amount_7/rank_avg_amount_10
ta_sma_10_0/close_0
sqrt(high_0*low_0)-amount_0/volume_0*adjust_factor_0
avg_turn_15/(turn_0+1e-5)
return_10
mf_net_pct_s_0
(close_0-open_0)/close_1"""
)# 抽取基础特征
m15 = M.general_feature_extractor.v7(instruments=m1.data,features=m3.data,start_date='',end_date='',before_start_days=0
)# 提取派生特征
m16 = M.derived_feature_extractor.v3(input_data=m15.data,features=m3.data,date_col='date',instrument_col='instrument',drop_na=False,remove_extra_columns=False
)# 合并标签和特征
m7 = M.join.v3(data1=m2.data,data2=m16.data,on='date,instrument',how='inner',sort=False
)# 删除缺失值
m13 = M.dropnan.v1(input_data=m7.data
)# 获取2021年至2022年股票数据
m9 = M.instruments.v2(start_date=T.live_run_param('trading_date', '2021-01-01'),end_date=T.live_run_param('trading_date', '2022-01-01'),market='CN_STOCK_A',instrument_list='',max_count=0
)# 抽取基础特征
m17 = M.general_feature_extractor.v7(instruments=m9.data,features=m3.data,start_date='',end_date='',before_start_days=0
)# 提取派生特征
m18 = M.derived_feature_extractor.v3(input_data=m17.data,features=m3.data,date_col='date',instrument_col='instrument',drop_na=False,remove_extra_columns=False
)# 删除缺失值
m14 = M.dropnan.v1(input_data=m18.data
)# 标准化训练数据和测试数据
m6 = M.cached.v3(input_1=m13.data,input_2=m3.data,input_3=m14.data,run=m6_run_bigquant_run,post_run=m6_post_run_bigquant_run,input_ports='',params='{}',output_ports=''
)# 对数据进行RobustScaler标准化处理
m8 = M.RobustScaler.v13(train_ds=m6.data_1,features=m3.data,test_ds=m6.data_2,scale_type='standard',quantile_range_min=0.01,quantile_range_max=0.99,global_scale=True
)# 使用SVC进行训练和预测
m10 = M.svc.v1(training_ds=m8.train_data,features=m3.data,predict_ds=m8.test_data,C=1,kernel='rbf',degree=3,gamma=-1,coef0=0,tol=0.1,max_iter=100,key_cols='date,instrument',other_train_parameters={}
)# 创建交易策略实例
m4 = M.trade.v4(instruments=m9.data,options_data=m10.predictions,start_date='',end_date='',handle_data=m4_handle_data_bigquant_run,prepare=m4_prepare_bigquant_run,initialize=m4_initialize_bigquant_run,before_trading_start=m4_before_trading_start_bigquant_run,volume_limit=0,order_price_field_buy='open',order_price_field_sell='open',capital_base=10000000,auto_cancel_non_tradable_orders=True,data_frequency='daily',price_type='后复权',product_type='股票',plot_charts=True,backtest_only=False,benchmark=''
)

【量化课程】08_1.机器学习量化策略基础实战

文章目录

1. 常用机器学习模型

1.1 回归模型

1.2 分类模型

1.2.1 SVC介绍

1.2.2 SVC在量化策略中的应用

2. 机器学习量化策略实现的基本步骤

3. 策略实现

相关文章：

【量化课程】08_1.机器学习量化策略基础实战

Mongodb 更新集合的方法到底有几种 (中) ？

预演攻击：谁需要网络靶场，何时需要

【Linux】IO多路转接——poll接口

系统架构设计师---OSI七层协议

Next.js - Route Groups（路由组）

musl libc ldso 动态加载研究笔记：01

2023 年 4 款适用于安卓手机的最佳 PDF 转 Word 转换器

前端:运用html+css+jquery.js实现截图游戏

Maven之JDK编译问题

开发测试框架一 - 创建springboot工程及基础操作

【IMX6ULL驱动开发学习】08.马达驱动实战：驱动编写、手动注册平台设备和设备树添加节点信息

直方图均衡化和自适应直方图均衡化

京东门详一码多端探索与实践 | 京东云技术团队

数据挖掘 | 零代码采集房源数据，支持自动翻页、数据排重等

迪米特法则

云积天赫｜AIGC+营销的排头兵

Oracle 数据库备份

【C++】模板template

智能工厂：适应不断变化的制造世界

简易版抽奖活动的设计技术方案

什么是库存周转？如何用进销存系统提高库存周转率？

2025 后端自学UNIAPP【项目实战：旅游项目】6、我的收藏页面

Ascend NPU上适配Step-Audio模型

C++ Visual Studio 2017厂商给的源码没有.sln文件易兆微芯片下载工具加开机动画下载。

今日学习：Spring线程池|并发修改异常|链路丢失|登录续期|VIP过期策略|数值类缓存

Java编程之桥接模式

uniapp 字符包含的相关方法

VisualXML全新升级 | 新增数据库编辑功能

React从基础入门到高级实战：React 实战项目 - 项目五：微前端与模块化架构