当前位置: 首页 > article >正文

北京交通大学 | 基于TD3算法的层叠超表面辅助多用户MISO系统联合优化研究

引言随着无线通信技术的不断发展可重构智能表面RIS技术因其低功耗和信号操控能力而受到广泛关注。然而RIS的单层结构和离散相移能力限制了其性能表现。层叠智能超表面SIM作为一项创新技术凭借其直接操控电磁波信号的能力以及类似人工神经网络的工作原理为无线通信系统性能提升带来了新的可能。本研究由北京交通大学和中国移动紫金创新研究院的研究团队共同完成聚焦于SIM辅助的多用户多输入单输出MU-MISO系统下行链路场景提出了一种基于双延迟深度确定性策略梯度TD3算法的联合优化方法。系统模型SIM模型图1 SIM辅助的多用户下行MISO通信系统研究考虑的SIM由L层超表面组成每层包含M个超原子。通过配置每层每个超原子的相移SIM能够在电磁波域实现复杂的信号处理任务如波束成形。相比传统方案基站天线只需传输低分辨率数模转换器转换的模拟数据流无需额外的信号处理电路。SIM的波域波束成形矩阵可表示为G Φ_L W_L Φ_(L-1) W_(L-1) ··· Φ_2 W_2 Φ_1其中Φ_l表示第l层的相移矩阵W_l表示层间传播矩阵。电磁波在相邻超表面间的传播遵循瑞利-索末菲衍射理论。通信系统模型系统包含K个单天线用户和一个配备S根天线及一个SIM设备的基站。研究假设SK即每根天线可直接传输和接收独立用户的数据流。从最后一层超表面到用户的信道采用空间相关瑞利衰落模型信道矩阵h_k服从复高斯分布。第k个用户接收到的信号包含期望信号、多用户干扰和加性高斯白噪声。第k个用户的接收信干噪比SINR为γ_k |h_k^H G w_k^1|^2 p_k / (Σ_(j≠k) |h_k^H G w_j^1|^2 p_j σ_k^2)问题建模研究的优化目标是联合设计SIM相移矩阵Φ和天线功率分配向量p以最大化系统和速率。在假设基站已知完美信道状态信息的前提下优化问题表述为最大化 R Σ_(k1)^K log_2(1 γ_k)约束条件包括总功率约束、各用户功率非负约束、相移范围约束。该问题由于非凸目标函数和约束条件而具有高度复杂性传统数学方法难以在大规模网络中求得最优解。TD3算法优化方案算法框架图2 用于配置SIM的TD3框架TD3算法是DDPG算法的扩展通过引入双评论家网络和延迟更新策略有效缓解了过估计偏差和高方差估计问题。TD3框架包含六个网络训练演员网络提供近似策略并生成动作两个训练评论家网络基于训练演员网络的动作估计动作值函数目标演员网络生成目标动作用于训练目标评论家网络两个目标评论家网络生成目标Q值用于训练过程TD3还采用噪声和平滑策略来增强智能体的探索能力。考虑到SIM辅助系统的相移参数众多、无线信道状态复杂以及SIM堆叠结构等特点TD3在收敛速度、稳定性和泛化能力方面表现出色。深度强化学习要素设计动作Action包括SIM相移矩阵Φ和功率分配矩阵P。由于神经网络只能处理实数输入相移矩阵被分解为实部和虚部动作总维度为2MLK。状态State由相移矩阵Φ、功率分配矩阵P和信道矩阵H组成状态维度为2MLK2MK。奖励Reward定义为系统和速率R。策略Policy表示智能体在给定状态下采取动作的准则。数值仿真结果仿真设置仿真假设载波频率为28 GHz的SIM辅助MU-MISO下行系统。基站配备S根天线SIM由L层组成。每层超表面有M个超原子均匀排列在N×N方阵中MN²。超原子长宽均为λ/2。用户沿y轴排列用户间距为10米。最大传输功率为10 dBm信道噪声功率为-104 dBm。图3SIM辅助MU-MISO通信系统仿真设置和速率与超表面层数关系仿真结果表明随着层数增加基于深度强化学习的算法性能优于传统交替优化方法。当L较小时TD3与DDPG性能接近但随着L增大动作空间维度变大TD3算法显示出优越性。然而当层数L较大时无论采用何种方法系统优化效果都趋于饱和。图4和速率R_sum随SIM层数L的变化S4, K4, M9, P_t10 dBm和速率与超原子数量关系随着每层超原子数量增加系统和速率也随之提升。更多的超原子带来更高分辨率的相移通过增加超表面的自由度来提高下行波束成形的精度。当M≥25时TD3算法的效率高于DDPG。然而增加超原子数量也带来了算法复杂度的增加且交替优化算法在优化大量参数时效果不如深度强化学习算法。图5和速率R_sum随每层超原子数量M的变化L2, S4, K4, P_t10 dBm和速率与用户数量关系随着用户数量增加和速率呈下降趋势尽管SIM优化缓解了这一问题。这是因为用户数量增加导致用户间干扰加剧。结果表明在SIM辅助MU-MISO系统中仅在发射端部署SIM无法完全解决多用户干扰问题未来可考虑在接收端部署SIM以消除干扰。图6和速率R_sum随用户数量K的变化M9, SK, L4, P_t10 dBm收敛性分析仿真对比了不同延迟更新时间对算法收敛的影响。延迟更新策略有助于降低更新频率、防止过拟合和振荡提高算法泛化能力。当延迟更新时间过长时算法收敛速度放缓当延迟更新时间过短时算法振荡变得严重。相比DDPGTD3展现出更好的稳定性。图7不同延迟更新时间下的和速率收敛曲线L5, S4, K4, M9, P_t10 dBm结论本研究针对SIM辅助MU-MISO通信系统提出了基于TD3算法的联合SIM相移配置和功率分配优化方法。通过与DDPG和交替优化方法的对比实验验证了所提TD3算法的优越性能。研究发现增加每层超原子数量总是有益的但持续增加SIM层数并不会带来持续的性能提升。未来研究将聚焦于在大规模MIMO系统和无蜂窝网络等更复杂系统中探索更高效的SIM配置方法。参考文献X. Yang, J. Zhang, E. Shiet al., Joint SIM Configuration and Power Allocation for Stacked Intelligent Metasurface-assisted MU-MISO Systems with TD3,GLOBECOM 2024 - 2024 IEEE Global Communications Conference, Cape Town, South Africa, 2024, pp. 3255-3260

相关文章:

北京交通大学 | 基于TD3算法的层叠超表面辅助多用户MISO系统联合优化研究

引言随着无线通信技术的不断发展,可重构智能表面(RIS)技术因其低功耗和信号操控能力而受到广泛关注。然而,RIS的单层结构和离散相移能力限制了其性能表现。层叠智能超表面(SIM)作为一项创新技术&#xff0c…...

生成历史场景数据(实际应用替换为真实数据)

电热冷氢综合能源系统分布式鲁棒优化运行,基于Wasserstein 距离,包含结果绘图和随机优化和鲁棒优化对比场景,代码备注详细最近在搞综合能源系统的兄弟肯定对"不确定性"这词深恶痛绝——电力负荷说变就变,氢能价格跟过山…...

Python迭代器与生成器:从入门到精通的完全指南

本文将用最通俗易懂的方式讲解Python迭代器和生成器的核心概念,通过大量实例帮你彻底掌握这两个重要的Python特性。 1. 引言:为什么要学迭代器和生成器? 想象一下,你需要处理一个包含1000万条数据的文件,如果一次性把所有数据加载到内存,你的电脑可能就卡死了。这时,迭…...

Python错误和异常处理完全指南:从小白到高手的详细教程

本文全面讲解Python中的错误和异常处理机制,从基础概念到高级用法,帮你构建健壮的Python程序。 1. 为什么需要异常处理? 在编程中,错误是不可避免的。想象一下:你写了一个读取文件的程序,但文件不存在;或者计算用户输入的数据,但用户输入了字母而不是数字。没有异常处…...

2026届学术党必备的降重复率平台推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 正在逐渐发生改变的是学术写作模式,借助的是人工智能论文工具,它的核…...

霸王餐外卖接口对接中的签名校验、加密传输 Java 后端实现细节

霸王餐外卖接口对接中的签名校验、加密传输 Java 后端实现细节 在霸王餐(免费试吃)及外卖CPS分销系统的开发中,数据的安全性是核心命脉。由于涉及用户的隐私信息(如手机号、OpenId)以及核心的佣金计算逻辑,…...

▲基于DQPSK调制解调+LDPC编译码+扩频解扩通信链路matlab误码率仿真

目录 1.本系统整体构架 2.各个模块基本原理 2.1 DQPSK原理简介 2.2 DQPSK解调原理 2.3 LDPC编译码 2.4 扩频技术原理 3.仿真结果 4.完整程序下载 1.本系统整体构架 整个程序,我们采用如下的流程图实现: 2.各个模块基本原理 2.1 DQPSK原理简介 …...

文字识别OCR 在线工具 vs OCR API 接口平台:普通用户和开发者该怎么选?

随着 AI 发展,OCR 已经成了办公、学习、开发必备工具。 但现在市面上的 OCR 工具大致分两类: 在线 OCR 网站(网页直接用) OCR API 接口平台(系统对接用) 很多人不知道该怎么选,我从【普通用…...

AnimateDiff与Three.js结合:Web端3D文生视频实践

AnimateDiff与Three.js结合:Web端3D文生视频实践 最近在折腾AI视频生成,发现一个挺有意思的事儿:AnimateDiff这类文生视频模型效果越来越好,但生成的东西大多还是“平面”的,想把它放到网页里,特别是做成有…...

OpenClaw多模型对比:Qwen3-14B与Llama3在本地自动化中的表现

OpenClaw多模型对比:Qwen3-14B与Llama3在本地自动化中的表现 1. 测试背景与实验设计 去年夏天,当我第一次用OpenClaw完成自动整理桌面文件的任务时,就被这种"用自然语言指挥AI操作电脑"的方式震撼了。但随着使用场景越来越复杂&a…...

javaweb高校两校区通勤校车预约系统的设计与实现 论文

目录同行可拿货,招校园代理 ,本人源头供货商功能需求分析用户管理校车班次管理预约功能核销与签到数据统计通知系统技术实现要点前端设计后端逻辑数据库设计安全机制项目技术支持源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作同行可拿货,招…...

使用vue3+ts构建企业级文件传输管理系统:状态管理、性能优化与用户体验的深度实践

使用vue3+ts构建企业级文件传输管理系统:状态管理、性能优化与用户体验的深度实践 在现代企业应用中,文件传输是核心功能之一。一个高效的传输管理系统不仅需要处理大量文件,还需提供直观的状态反馈、灵活的操作选项和流畅的用户体验。今天,我将分享一个基于Vue 3和TypeSc…...

游戏盾导致 Unity/UE 引擎崩溃的主要原因排查?

做游戏上线的都知道,游戏盾是必装的——毕竟要防外挂、防攻击,不然刚上线就被搞崩,损失太大。但最近帮几个同行排查问题,发现好多项目接入游戏盾后,Unity和UE引擎动不动就崩,要么内存飙到爆,安卓…...

游戏盾导致 Unity/UE 引擎崩溃?内存占用、SO 库冲突深度排查

接入游戏盾后碰到 Unity、UE 编辑器或打包后崩溃、内存暴涨、SO 库冲突的问题,应该都不陌生。我最近在几个项目里反复踩过这些坑,从日志分析、内存追踪到 SO 符号冲突,一步步定位下来,把完整排查流程和解决方案整理出来&#xff0…...

Python数据分析项目实战(046)——数据清洗与预处理概述

版权声明 本文原创作者:谷哥的小弟 作者博客地址:http://blog.csdn.net/lfdfhl 数据清洗与预处理是数据分析的基础环节。本阶段工作旨在修复数据质量问题、规范数据格式、优化数据结构,为后续分析建模提供可靠数据。 缺失值处理 缺失值指数据集中存在的空值或未记录的信息…...

目标检测,图像分类。faster,yolo

目标检测,图像分类。faster,yolo...

DAB-DETR目标检测环境配置、DAB-DETR目标检测代跑训练、DAB-DETR目标检测改进创新DAB-DETR目标检测配置:Windows、Ubuntu、Centos、Macos等系统环境

DAB-DETR目标检测环境配置、 DAB-DETR目标检测代跑训练、 DAB-DETR目标检测改进创新 DAB-DETR目标检测配置:Windows、Ubuntu、Centos、Macos等系统环境,如果电脑拥有显卡,可配置GPU版本环境。 DAB-DETR目标检测代跑训练、:可支持训…...

Comsol光子晶体光纤模式分析之FSM Mode计算

Comsol光子晶体光纤模式分析,fsm mode计算在光学领域,光子晶体光纤以其独特的光学特性吸引着众多研究者的目光。而在对光子晶体光纤进行深入研究时,模式分析是至关重要的一环,其中FSM(Full Vectorial Finite Element M…...

8086 汇编报错全总结与归纳

一、可能遇到的所有错误汇总错误代码错误含义触发行(你的代码)核心根源A2048Must be index or base registermov [ax],1H、add [dx],[ax]8086 硬件不支持用非BX通用寄存器做内存间接寻址A2035Operand must have sizemov [bx],1H汇编器无法判断操作数是 8…...

Speechless:为你的微博记忆穿上PDF保护衣

Speechless:为你的微博记忆穿上PDF保护衣 【免费下载链接】Speechless 把新浪微博的内容,导出成 PDF 文件进行备份的 Chrome Extension。 项目地址: https://gitcode.com/gh_mirrors/sp/Speechless 在数字记忆碎片化的时代,你是否曾担…...

ChilloutMix NiPrunedFp32Fix 模型完整教程:从零开始掌握AI图像生成

ChilloutMix NiPrunedFp32Fix 模型完整教程:从零开始掌握AI图像生成 【免费下载链接】chilloutmix_NiPrunedFp32Fix 项目地址: https://ai.gitcode.com/hf_mirrors/emilianJR/chilloutmix_NiPrunedFp32Fix ChilloutMix NiPrunedFp32Fix 是一款基于稳定扩散技…...

2026届学术党必备的六大AI学术神器推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 基于自然语言处理以及深度学习算法的AI论文查重技术,经过对文本的语义结构、句式…...

2025届毕业生推荐的五大AI辅助写作平台横评

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 把人工智能生成内容的检测概率给降低,得从文本特征方面着手去进行系统性的优化。…...

破茧成蝶:Java后端从0到资深工程师的进阶之路(五)

破茧成蝶:Java后端从0到资深工程师的进阶之路(五)并发篇——多线程与高并发实战现代后端系统,高并发是绕不开的挑战。多线程编程就像一把双刃剑:用得好了,系统吞吐量飙升;用得不好,死…...

带你读顶会论文丨基于溯源图的APT攻击检测

带你读顶会论文丨基于溯源图的APT攻击检测 **摘要:**本次分享主要是作者对APT攻击部分顶会论文阅读的阶段性总结,将从四个方面开展。 本文分享自华为云社区《[论文阅读] (10)基于溯源图的APT攻击检测安全顶会总结》,作者:eastmoun…...

Xray-强大的漏洞扫描工具

Xray-强大的漏洞扫描工具 Xray是什么? xray (https://github.com/chaitin/xray) 是从长亭洞鉴核心引擎中提取出的社区版漏洞扫描神器,支持主动、被动多种扫描方式,自备盲打平台、可以灵活定义 POC,功能丰富,调用简单&a…...

2026年,探秘义乌一次性包装盒定做厂家的独特工艺与优质服务!

在商品包装需求日益多样化的今天,一次性包装盒的定制市场愈发繁荣。义乌,作为全球知名的小商品之都,拥有众多一次性包装盒定做厂家,它们以独特的工艺和优质的服务在市场中占据一席之地。今天,我们将走进一家具有代表性…...

CMMI 能力成熟度模型集成介绍

CMMI(Capability Maturity Model Integration)即能力成熟度模型集成,是由美国卡内基梅隆大学软件工程研究所(SEI)研发、现由ISACA旗下CMMI 研究院维护的国际权威过程改进与评估框架,核心是通过标准化最佳实…...

水厂供水泵房自控案例(工程实际在用) PLC程序+触摸屏程序+组态软件程序+图纸

水厂供水泵房自控案例(工程实际在用) PLC程序触摸屏程序组态软件程序图纸;凌晨三点,水厂中控室的警报突然炸响。我盯着屏幕上跳动的压力曲线,右手已经摸到了对讲机——这种情况在供水泵房太常见了。今天要聊的自控系统,可是我们项…...

2026年深圳冷冻食品包装盒代理,其中商机你知道多少?

在深圳这个充满活力与机遇的城市,冷冻食品市场一直呈现出稳步增长的态势。随着消费者对冷冻食品需求的不断增加,冷冻食品包装盒的市场需求也随之水涨船高。2026 年,深圳冷冻食品包装盒代理蕴含着巨大的商机。下面就为你详细剖析其中的商机以及…...