当前位置：首页 > news >正文

Paddlets时间序列集成模型回测实战：MLPRegressor、NHiTSModel与RNNBlockRegressor

news 2026/5/16 21:23:53

好的，我们继续深入理解代码的每个部分。以下是每个主要模块的详细解释：

1. 导入模块和库

import json
import os
import glob
import pandas as pd
from tqdm import tqdm
from paddlets.datasets import TSDataset
from paddlets.transform import StandardScaler
from paddlets.models.forecasting import MLPRegressor, NHiTSModel, RNNBlockRegressor
from paddlets.ensemble import WeightingEnsembleForecaster
import ray

json: 用于处理JSON文件。
os: 用于处理文件和目录操作。
glob: 用于获取匹配特定模式的文件路径。
pandas: 用于数据处理和分析，尤其是表格数据。
tqdm: 用于显示进度条，帮助跟踪循环的进度。
paddlets: 时间序列预测相关的库。
ray: 用于并行计算的库。

2. 定义和创建目录

dirs = ["forecasting_all_result_center","pic_forecasting_center","model_forecasting_center_2048_a_b_5_100","best_forecasting_param_center"
]for dir_name in dirs:os.makedirs(dir_name, exist_ok=True)

dirs: 定义了多个用于存储不同类型结果的目录。
os.makedirs: 创建目录，如果目录已存在，则不报错。

3. 加载股票映射

with open("./stock_mapping.json", "r") as f:stock_mapping = json.load(f)

从stock_mapping.json文件中加载股票的映射关系，以便后续使用。

4. 加载CSV数据

csv_paths = glob.glob(os.path.join("./tu_share_data_day", "*.csv"))
sum_dam_data = []for csv_path in tqdm(csv_paths):new_data = pd.read_csv(csv_path)if len(new_data) < 2048 or new_data.iloc[0, 2] < 5 or new_data.iloc[0, 2] > 100:continuenew_data = new_data[::-1].iloc[:2048]new_data['index_new'] = range(1, len(new_data) + 1)sum_dam_data.append(new_data)

使用glob获取所有CSV文件路径，并遍历每个文件。
读取数据并进行过滤，确保符合条件（如数据长度、价格区间）。
将数据反转并取最后2048条，添加索引列。

5. 构建时间序列数据集

dam_data = pd.concat(sum_dam_data)dataset = TSDataset.load_from_dataframe(dam_data,group_id='ts_code',time_col="index_new",target_cols=['high', 'low']
)

将所有符合条件的数据合并成一个DataFrame。
使用TSDataset将数据转换为时间序列格式，指定分组、时间列和目标列。

6. 初始化标准化器

scaler = StandardScaler().fit(dataset)
dataset = scaler.transform(dataset)

使用StandardScaler对数据进行标准化处理，使模型训练更加稳定。

7. 初始化Ray进行并行计算

ray.init()

初始化Ray，使得后续的计算能够并行执行。

8. 定义并行处理函数

@ray.remote
def process_csv_file(csv_path, scaler):...

使用@ray.remote装饰器定义一个可以被Ray并行化的函数，处理每个CSV文件的逻辑。

9. 设置模型参数和加载模型

nhits_params = {'sampling_stride': 24, 'eval_metrics': ["mse", "mae"], 'batch_size': 32, 'max_epochs': 100, 'patience': 10}
rnn_params = nhits_params.copy()
mlp_params = nhits_params.copy()
mlp_params['use_bn'] =

Paddlets时间序列集成模型回测实战：MLPRegressor、NHiTSModel与RNNBlockRegressor

好的，我们继续深入理解代码的每个部分。以下是每个主要模块的详细解释： 1. 导入模块和库 import json import os import glob import pandas as pd from tqdm import tqdm from paddlets.datasets import TSDataset from paddlets.transform import StandardScaler from pa…...

编程日记 2024/9/28 12:45:08

【anki】显示 “连接超时，请更换网络后重试” 怎么办

文章目录前言一、问题描述二、解决方案前言在 anki同步时遇到的问题一、问题描述二、解决方案从电信换为了移动热点，电脑手机都同步成功了...

编程日记 2024/9/28 12:44:07

第一批学习大模型的程序员，已经碾压同事了，薪资差距都甩出一条街了...

前言随着人工智能技术的突飞猛进，AI大模型已成为引领未来的核心技术。从ChatGPT的横空出世到GPT-4o的震撼发布，AI技术正以前所未有的速度改变着我们的生活和工作方式。在这场AI革命中，企业对AIGC人才的需求正以指数级增长。据《AIGC就业趋…...

编程日记 2024/9/28 12:43:06

Unity NetCode 客户端连接不上服务器，局域网模式 Failed to connect to server.

报错代码: Failed to connect to server. 报错截图： 解决办法: 服务端:绑定127.0.0.1和端口客户端:写好对应服务端ip和端口如何查看服务端所在局域网IP，192.xxx.xxx.xx,就不用教了吧。注意这个钩，得点下，默认不勾选。意…...

编程日记 2024/9/28 12:41:04

C++远端开发环境安装(centos7)

使用VMWare安装centos7 启用网卡设备修改文件/etc/sysconfig/network-scripts/ifcfg-ens33中的ONBOOTyes 重启网络服务 systemctl restart network 配置yum仓库直接将如下内容覆盖原有的/etc/yum.repos.d/CentOS-Base.repo文件清理yum缓存 yum clean all 刷新yum yu…...

编程日记 2024/9/28 12:36:00

LaTeX 编辑器-TeXstudio

TeXstudio 是一款开源跨平台 LaTeX 编辑软件，界面与 Texmaker 类似。TeXstudio 为用户提供互动式拼写检查、代码折叠、语法高亮、代码提示和自动完成等特性，功能丰富，界面美观，但软件本身不提供底层功能，需要使用者自行…...

编程日记 2024/9/28 12:29:54

[深度学习]循环神经网络

1 自然语言处理概述语料：一个样本，句子/文章语料库：由语料组成词表：分词之后的词语去重保存成为词表 2 词嵌入层 import jieba import torch.nn as nn import torch # 文本数据 text北京东奥的进度条已经过半，不少外…...

编程日记 2024/9/28 12:27:52

景联文科技精准数据标注：优化智能标注平台，打造智能未来

景联文科技是一家致力于为人工智能提供全面数据标注解决方案的专业公司。拥有一支由经验丰富的数据标注师和垂直领域专家组成的团队，确保数据标注的质量和专业性。自建平台功能一站式服务平台，提供从数据上传、标注、审核到导出的一站式服务&#xff0…...

编程日记 2024/9/28 12:25:51

商场促销——策略模式

文章目录商场促销——策略模式商场收银软件增加打折简单工厂实现策略模式策略模式实现策略与简单工厂结合策略模式解析商场促销——策略模式商场收银软件时间：2月27日22点　　地点：大鸟房间　　人物：小菜、大鸟 “小菜，给你…...

编程日记 2024/9/28 12:24:50

万字长文，AIGC算法工程师的面试秘籍，推荐收藏！

目录先行 AI绘画基础： 什么是DreamBooth技术？正则化技术在AI绘画模型中的作用？ 深度学习基础： 深度学习中有哪些常用的注意力机制？如何寻找到最优超参数？ 机器学习基础： 判别式模型和生成…...

编程日记 2024/9/28 12:23:49

一些超好用的 GitHub 插件和技巧

聊聊我平时使用 GitHub 时学到的一些插件、技巧。 ‍ ‍ 浏览器插件在我的另一篇博客浏览器插件推荐里提到过跟 GitHub 相关的一些插件，这里重复下： Sourcegraph：在线打开项目，方便阅读，将 GitHub 变得和 IDE …...

编程日记 2024/9/28 12:22:48

记Flink SQL 将数据写入 MySQL时的一个优化策略

Flink SQL 将数据写入 MySQL 时，如果主分片数较少，可以通过调整 MySQL 的主分片数来提高读写性能 1. 检查当前的分片设置在 MySQL 中，使用以下 SQL 查询来查看当前的分片情况： SHOW VARIABLES LIKE innodb_buffer_pool_size; …...

编程日记 2024/9/28 12:21:47

QT-自定义信号和槽对象树图形化开发计算器

1. 自定义信号和槽核心逻辑： 需要有两个类，一个提供信号，另一个提供槽。然后在窗口中将信号和槽链接起来。示例目标： 创建一个 Teacher 类，提供信号。创建一个 Student 类，提供槽。实现步骤&…...

编程日记 2024/9/28 12:19:45

C# 字符串（String）的应用说明一

一.字符串（String）的应用说明： 在 C# 中，更常见的做法是使用 string 关键字来声明一个字符串变量，也可以使用字符数组来表示字符串。string 关键字是 System.String 类的别名。二.创建 String 对象的方法说明&#x…...

编程日记 2024/9/28 12:15:41

Redis缓存淘汰算法详解

文章目录 Redis缓存淘汰算法1. Redis缓存淘汰策略分类2. 会进行淘汰的7种策略2.1 基于过期时间的淘汰策略2.2 基于所有数据范围的淘汰策略 3. LRU与LFU算法详解4. 配置与调整5. 实际应用场景 LRU算法以及实现样例LFU算法实现1. 数据结构选择2. 访问频率更新3. 缓存淘汰4. 缓存插…...

编程日记 2024/9/28 12:12:39

Sklearn 与 TensorFlow 机器学习实用指南

Sklearn 与 TensorFlow 机器学习实用指南 Scikit-learn（Sklearn） 1. 简介 2. 特点 3. 基本用法 TensorFlow 1. 简介 2. 特点 3. 基本用法选择指南总结 🎈边走、边悟🎈迟早会好关于使用 Scikit-learn（Sk…...

编程日记 2024/9/28 12:11:38

RabbitMQ 界面管理说明

1.RabbitMQ界面访问端口和后端代码连接端口不一样界面端口是15672 http://localhost:15672/ 后端端口是 5672 默认账户密码登录 guest 2.总览图 3.RabbitMq数据存储位置 4.队列 4.客户端消费者连接状态 5.队列运行状态 6.整体运行状态...

编程日记 2024/9/28 12:06:33

设备管理与点巡检系统

在现代企业管理中，设备的高效运作至关重要。为此，我们推出了设备管理与点巡检系统，通过自动化管理提升设备使用效率，保障生产安全。系统特点设备全生命周期管理系统涵盖设备的各个阶段，从设备管理、点检、巡检、保…...

编程日记 2024/9/28 12:05:32

计算机网络的整体认识---网络协议，网络传输过程

计算机网络背景网络发展独立模式: 计算机之间相互独立; 网络互联: 多台计算机连接在一起, 完成数据共享; 局域网LAN: 计算机数量更多了, 通过交换机和路由器连接在一起; 广域网WAN: 将远隔千里的计算机都连在一起;所谓 "局域网" 和 "广域网" 只是一个相…...

编程日记 2024/9/28 12:04:31

Battery management system (BMS)

电池管理系统（BMS）是一种专门用于监督电池组的技术，电池组由电池单元组成，在电气上按照行x列矩阵配置进行排列，以便在预期的负载场景下，在一段时间内提供目标范围的电压和电流。文章目录电池管理系统是如…...

编程日记 2024/9/28 12:03:30

微信小程序wx.navigateTo传参实战：从基础到动态数据绑定

1. 微信小程序页面跳转基础入门第一次接触微信小程序开发时，页面跳转是最基础也最常用的功能之一。wx.navigateTo这个API就像是一座连接不同页面的桥梁，让用户能在小程序的不同功能模块间自由穿梭。想象一下，你正在开发一个电商小程序&…...

编程新知 2026/5/16 20:42:55

当ChIP-seq遇见单细胞：技术原理、应用场景与未来展望，一次给你讲清楚

当单细胞分辨率重塑表观遗传学：scChIP-seq的技术突破与应用全景表观遗传学研究正经历一场分辨率革命。过去十年间，科学家们不得不依赖数百万细胞才能绘制组蛋白修饰或转录因子结合的全局图谱，这种"群体平均"的视角掩盖了细胞间异…...

编程新知 2026/5/16 19:50:03

S32K3开发避坑：用EB tresos给GPT定时器（PIT）配时钟，实测24MHz APIS_SLOW_CLK怎么设

S32K3开发实战：EB tresos中GPT定时器时钟配置深度解析引言在嵌入式系统开发中，精确的定时器配置往往是项目成功的关键因素之一。对于使用NXP S32K3系列MCU的开发者而言，EB tresos工具链提供了强大的MCAL配置能力，但同时也带来了…...

编程新知 2026/5/16 19:33:33

基于CircuitPython与MCP23017的环境音效混合器：嵌入式音频与GPIO扩展实战

1. 项目概述与环境音效混合器的核心价值如果你和我一样，对嵌入式音频项目充满热情，同时又常常被微控制器有限的GPIO引脚数量所困扰，那么这个基于CircuitPython与MCP23017的环境音效混合器项目，绝对值得你花上一个周末的时间来亲手…...

编程新知 2026/5/16 18:57:46

通用运放设计挑战：扫地机器人传感器信号调理实战解析

1. 项目概述：当扫地机器人遇上通用放大器最近在帮一个做智能硬件的朋友优化他们新一代扫地机器人的主控板，聊到传感器信号调理这块，他跟我大倒苦水。他说，现在的扫地机为了更“聪明”，身上集成的传感器越来越多&#x…...

编程新知 2026/5/16 16:37:47

终极NDS游戏资源提取器：Tinke如何让你免费解锁任天堂DS游戏文件

终极NDS游戏资源提取器：Tinke如何让你免费解锁任天堂DS游戏文件【免费下载链接】tinke Viewer and editor for files of NDS games 项目地址: https://gitcode.com/gh_mirrors/ti/tinke 你是否曾经好奇过任天堂DS游戏中的精美图像、动听音乐和独特字体是如何…...

编程新知 2026/5/16 14:58:09

从“芯”出发：RK3588与树莓派5的硬件博弈与开发者抉择

1. 芯片架构的硬核对决当RK3588遇上树莓派5，这场硬件较量就像两位武林高手过招。RK3588用的是台积电8nm工艺，四核Cortex-A76加四核Cortex-A55的big.LITTLE设计，主频最高2.4GHz。实测跑分时，A76大核单核性能比树莓派5的Cortex-A76…...

编程新知 2026/5/16 11:45:52

3分钟搞定Windows和Office永久激活：KMS智能激活工具完整指南

3分钟搞定Windows和Office永久激活：KMS智能激活工具完整指南【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows系统频繁弹出激活提示而烦恼吗？Office文档突然…...

编程新知 2026/5/16 11:39:09

AD21编译报错“contains floating input pins”？别慌，可能是你的元件库电气类型没设对

AD21编译报错“contains floating input pins”深度解析与实战解决方案当你满怀信心地在AD21中完成PCB设计，点击编译按钮时，突然跳出的"contains floating input pins"报错就像一盆冷水浇下来。这个看似简单的错误提示背后，隐藏着…...

编程新知 2026/5/16 11:30:12

GitHub平台功能全解析：AI代码创作、安全保障及多场景解决方案助力开发

导航菜单可进行切换导航操作。[ ](/)[ 登录 ](/login?return_tohttps%3A%2F%2Fgithub.com%2Fanthropics%2Fclaude-for-legal)可进行外观设置。平台AI代码创作- [GitHub Copilot：借助AI编写更优质代码](https://github.com/features/copilot)- [GitHub Spark&#x…...

编程新知 2026/5/16 11:23:58