当前位置：首页 > news >正文

GRU-PFG：利用图神经网络从股票因子中提取股票间相关性

news 2026/4/18 8:57:45

“GRU-PFG: Extract Inter-Stock Correlation from Stock Factors with Graph Neural Network”

论文地址：https://arxiv.org/pdf/2411.18997

摘要

股票预测模型可以分为两个主要类别：第一类，例如GRU和ALSTM，这些模型仅基于股票本身的数据进行预测，其准确性有一定的局限性；第二类，像HIST和TRA这样的模型，则融合了行业趋势、财务报表以及公众情绪等多方面的信息，虽然能够更全面地反映股票之间的关联，但在数据的标准化处理和模型泛化能力方面遇到了挑战。本文介绍了一种新的模型——GRU-PFG，它依然只利用股票本身的因素，但借助图神经网络来挖掘不同股票间的联系，从而实现了比单纯依赖股票数据的模型更优的预测性能，并且其效果可与结合多种信息源的第二类模型相媲美。

在CSI300指数成分股的数据集测试中，GRU-PFG模型的秩相关系数（IC）达到了0.134，这一成绩不仅超过了HIST模型的0.131，也明显优于传统的GRU和Transformer模型，证明了该模型具有更强的泛化能力。尽管股票投资是实现资产增值的有效途径之一，但它同样伴随着市场波动和企业业绩不佳所带来的风险，投资者可能会因此面临资本损失。

简介

随着机器学习技术的发展，特别是神经网络（例如CNN和Transformer）的应用，越来越多的投资者开始重视其在股票预测中的潜力。股票预测模型通常可以分为两大类：一类模型仅依赖于股票的历史价格和其他直接相关的市场数据；而另一类则整合了额外的信息，比如行业动态、市场资本化等非传统因素。尽管后者的模型，如MDGNN和HIST，能够提供更高的预测精度，但它们也面临着信息选取的主观性、数据更新的滞后性以及适应快速变化的行业环境的挑战。

本研究引入了一种新的模型——GRU-PFG，它以股票自身因素为基础，并通过图神经网络捕捉股票之间的关系，以此来增强预测性能。GRU-PFG利用Alpha360股票因子作为输入，深入挖掘这些数据中的隐含信息，相较于传统的ALSTM和GRU模型表现出了显著的优势，为从股票因子中提取有用信息提供了创新的方法。实验结果显示，该模型的表现与那些基于多种信息源的复杂预测模型（如HIST和TRA）相当，同时展现了更强的泛化能力，成功地解析了股票因子间的相互联系。

01相关工作

股票因素

长期以来，股票预测的定量分析工作由于难以获取内幕信息而带有一定的保密性。研究者们一直致力于利用公开可用的数据，如市场价格和成交量，来构建既稳定又可靠的预测模型。在这一领域，有的量化分析师专注于根据股票的历史趋势来设定模式，而其他的分析师则通过量化和标准化数据来开发用于预测的股票因子。

2015年，Zurab Kakushadze与Igor Tulchinsky首次界定了4000个可能影响未来股票价格变动的数值特征。随后，Kakushadze进一步简化了这些特征，提炼出101个更为关键的数值。Xiao Yang等人随后将这些股票因子的概念引入到qlib这个开源量化投资平台上，创建了Alpha360和Alpha158两个因子集。这些因子集成为了GRU、图注意力网络（GATs）、Transformer等深度学习算法进行日常股票趋势预测的标准输入，广泛应用于学术研究和实际投资策略中。

基于Alpha360的预测模型

Alpha360股票因子集因其高维度特性，非常适合应用于如GRU、LSTM和Transformer等深度学习模型。这些模型主要依赖标准化的股票因子进行预测，虽然在处理多源信息方面有所欠缺，但其数据标准化程度很高。相比之下，多层感知器（MLP）作为基础模型，能够执行多维数据的降维和非线性转换，不过在学习股票因子之间的复杂关系上能力有限。而GRU、LSTM、ALSTM以及Transformer这类模型则将股票因子视为时间序列数据来处理，从而能够更有效地提取特征信息，但在捕捉不同股票之间的相互关系时表现并不理想。

基于多信息源的预测模型

学者们正探索将额外的信息，例如公众情绪、公司的市值以及行业概念，融入到股票预测模型中，以期提高预测的准确性。虽然多源信息的整合有可能增强模型的性能，但这种方法也遇到了一些挑战：

主观性选择
确定哪些额外信息应该被包含在模型中往往依赖于研究人员的判断，这引入了一定程度的主观性。不同的研究者可能会基于不同的理论或经验选择不同的信息来源，从而影响模型的一致性和可重复性。
标准化困难
不同类型的额外信息通常来自各种不同的源，格式和质量各不相同。要将这些非结构化或半结构化的数据整合进一个统一的预测框架，并确保其标准化处理，是一项复杂且耗时的任务。
信息滞后
许多额外信息，特别是那些从新闻报道、社交媒体或其他公开渠道获取的数据，可能存在更新延迟的情况。这种滞后可能导致模型使用的是过时的信息，从而降低预测的准确性和时效性。
新公司和新兴行业的信息匮乏
对于较新的公司或快速发展的新兴行业，可能缺乏足够的历史数据和其他相关信息来进行有效的分析和预测。这使得构建适用于所有市场参与者的通用模型变得更加困难。

这些问题都对多源信息模型的实际应用构成了挑战，需要通过技术创新和方法改进来逐步解决。

02基础

股票趋势相关概念

股票价格是由公司财务状况、市场情绪以及宏观经济环境等多种因素共同作用的结果，其变动通常是渐进的而非突然的。我们可以通过比较价格的变化速率来研究股票的趋势，这一分析方法的计算公式为：

日收益率计算公式为：

Alpha360因子模型旨在通过整合基本面分析、技术分析、市场情绪以及宏观经济数据等多个方面的信息，来评估接下来60天内股票价格的可能走向，其目标是增强预测的精确度。请注意，任何预测方法都无法保证完全准确，投资股市有风险，决策需谨慎，并建议咨询专业的财经顾问。

GRU在股票预测中的局限性

GRU网络采用360个因子来预测每日的股票回报，其性能超越了Transformer和LSTM模型。这些因子每6个组成一个时间步，总共构建了60个时间步。在最后一个时间步中，数据经过降维处理，然后通过线性函数输出一个维度的回报预测。GRU在网络中高效地提取时间序列特征并进行降维，然而它在捕捉不同股票之间的关系方面的能力较弱，这限制了其对市场动态变化的全面理解。

03方法

本文介绍了一种新型模型——GRU-PFG，该模型基于Alpha360因子集，旨在提升股票预测的性能。模型结构由三个主要部分组成：初步信息提取、主要关系建模和次要关系建模。

在初步信息提取阶段，采用GRU网络对360个因子进行处理，生成64维的特征表示，从而有效地捕捉了股票因子的基础信息。接下来，在主要关系建模阶段，通过使用softmax函数和Pearson相关系数来计算因子之间以及股票之间的关联度，进而构建出一个反映这些关系的相关性矩阵R1。最后，在次要关系建模阶段，模型考虑到了未直接显现的关系，并结合之前的主要关系，构建了一个综合性的聚合矩阵R2。

最终，模型将两个阶段提取到的特征整合为一个综合特征F_last，用于预测股票的价格变动趋势。为了优化模型参数，训练过程中采用了均方误差（MSE）作为损失函数。这一设计使得GRU-PFG不仅能够有效提取时间序列信息，还能更好地理解股票之间的复杂关系，从而提高预测的准确性。

04实验

实验设置

使用CSI100和CSI300数据集，本研究将2007年1月1日至2014年12月31日的数据作为训练集，2015年1月至2016年12月的数据作为验证集，而2017年1月至2020年12月的数据则用于测试。通过qlib平台计算的Alpha360因子被用作模型输入，模型的输出是预测的日收益率，实际的日收益率则作为标签进行监督学习。

评估模型性能的指标包括信息系数（IC）、排名IC以及Precision@N。在训练过程中，IC被用作损失函数的一部分，而在测试阶段，较高的IC值表明模型具有更好的预测能力。GRU-PFG模型与多种其他模型进行了对比，这些模型包括基于Alpha360因子的MLP、ALSTM和GRU，还有依赖多源输入的TRA和HIST等。尽管HIST模型被认为是预测效果最好的，但其面临数据标准化和泛化能力的挑战；相比之下，GRU和ALSTM在仅使用Alpha360因子的模型中表现最为出色。

结果

GRU-PFG模型在CSI100和CSI300数据集上的表现显著优于仅依赖Alpha360因子的其他模型，尤其在信息系数（IC）、排名IC（Rank IC）和Precision@N等评估指标上。特别是在CSI300数据集上，GRU-PFG不仅超越了HIST模型，而且仅使用股票因子作为输入，便实现了更高的预测精度。这表明GRU-PFG在捕捉股票间相关性方面具有更强的能力，可能是其在CSI300数据集上表现出色的原因之一。

与基于Alpha360因子的其他模型（如ALSTM、GRU、GATs）相比，GRU-PFG在大多数测试期间的月均IC表现更为突出。尽管在Precision@N指标上，GRU-PFG的优势不如在IC指标上那么明显，但它在多数月份中仍然保持领先地位。这一结果进一步证明了GRU-PFG模型在股票预测方面的优越性能。

模型参数和结构的影响

为了评估模型各部分对预测性能的贡献，我们进行了结构上的宏观和微观调整，并通过消融实验来系统地分析每个组件的影响。以下是具体的做法和结果：

1.模型结构调整与消融实验：

通过宏观和微观调整模型结构，进行消融实验。
目的是评估各个组件对预测性能的具体贡献。

2.主要组件：

初步信息提取：使用GRU网络处理初始数据，提取基础特征。
主要关系提取：捕捉因子之间及股票之间的主要关联。
次级关系提取：考虑潜在的、未直接显现的关系，进一步增强模型表现。

3.性能提升：

随着更多组件的逐步加入，模型的预测性能逐步提高。
特别是次级关系提取部分的引入，显著提升了CSI300数据集上的预测效果。

4.关系捕捉：

使用Pearson相关系数来衡量股票之间的关联性。
与余弦相似度相比，在信息系数（IC）和Precision@30等关键指标上表现出更优的性能。

这些调整和优化不仅揭示了各个组件对整体模型的重要性，还证明了通过精细设计模型结构可以有效提高股票预测的准确性。

05总结

本文介绍了一种新的股票预测模型GRU-PFG，该模型基于Alpha360因子，并引入了图表示法来描绘股票间的关联性，旨在解决传统模型存在的问题。实验结果显示，在相同的测试数据上，此方法能够有效提高诸如信息系数（IC）等评估标准。展望未来，我们的目标是优化这一模型，使其能够在多种数据环境下展现出更出色的预测能力，同时希望其应用能为投资者提供有价值的参考。然而，需要注意的是，任何投资都伴随着风险，投资者应根据个人的财务状况和风险承受能力做出谨慎的投资决策，并考虑寻求专业理财顾问的意见。

GRU-PFG：利用图神经网络从股票因子中提取股票间相关性

相关文章：

GRU-PFG：利用图神经网络从股票因子中提取股票间相关性

数字化供应链创新解决方案在零售行业的应用研究——以开源AI智能名片S2B2C商城小程序为例

安卓Activity执行finish后onNewIntent也执行了

数据结构.期末复习.学习笔记（c语言）

Kafaka安装与启动教程

根据docker file 编译镜像

联邦学习的 AI 大模型微调中，加性、选择性、重参数化和混合微调

android 外挂modem模块实现Telephony相关功能(上网，发短信，打电话)

【计算机视觉技术 - 人脸生成】2.GAN网络的构建和训练

数据中台与数据治理服务方案[50页PPT]

【Qt】将控件均匀分布到圆环上

第四、五章补充：线代本质合集（B站：小崔说数）

2025年贵州省职业院校技能大赛信息安全管理与评估赛项规程

松鼠状态机流转-@Transit

微信小程序调用 WebAssembly 烹饪指南

# LeetCode Problem 2038: 如果相邻两个颜色均相同则删除当前颜色 (Winner of the Game)

Redis面试相关

4.CSS文本属性

Mongo高可用架构解决方案

Rabbitmq 业务异常与未手动确认场景及解决方案

LLM工程化实践——RAG基础入门（一）

McCabe度量法实战指南：从环路复杂度计算到测试用例精准设计

虚拟机基础：JVM、V8 运行机制极简科普

Kimi-VL-A3B-Thinking一文详解：开源VLM如何实现OCR/数学/多图理解三合一

拒绝采样微调实战：如何用LLaMA-7B提升数学推理准确率（附代码）

Payment扩展开发：如何自定义支付网关和添加新支付渠道

Python百度搜索API开源项目：无限制免费搜索引擎集成的终极解决方案

AGI Python入门保姆级教程

测试数据治理趋势：合规与效率平衡

别再让机械臂‘抖’了！用Matlab手把手教你实现输入整形（附完整代码）