当前位置: 首页 > article >正文

F5 NGINX Gateway Fabric 2.4.0 新功能发布

原文作者Sean Moloney - F5 Product Manager原文链接 F5 NGINX Gateway Fabric 2.4.0 新功能发布转载来源NGINX 中文社区NGINX 唯一中文官方社区 尽在nginx.org.cn我们很高兴地宣布 F5 NGINX Gateway Fabric 2.4.0 已经发布。此次发布标志着 Gateway API 发展历程中的一个重要里程碑新增了关键的生产级特性如 TCP/UDP 路由支持、限流、会话保持等功能。这些新功能将帮助运维人员更高效、安全地交付 AI 和现代应用。本次发布的变更摘要2.4.0 版本包含许多新功能和改进概括来说包括•支持限流•支持 NGINX OSS 和 NGINX Plus 的会话保持Sticky Cookie包括更改负载均衡方法的能力•通过新的 ProxySettingsPolicy 支持代理缓冲未来将增加更多 NGINX 指令•TCP 路由和 UDP 路由•强化的 TLS Listener配置密码套件•支持 Multiple Inference Pool backends作为 Gateway API Inference Extension 的一部分附加功能•命名空间过滤只监视特定命名空间而不是整个集群减少大型集群中的资源消耗•自定义日志转义格式在自定义数据平面访问日志时指定转义格式•上游 Keep-Alive 默认启用配置为 16 个连接以减少连接开销可通过 UpstreamSettingsPolicy CRD 进行配置•CRD 发现改善了与运行较旧 Gateway API 版本的集群的兼容性Bug修复•数据平面稳定性修复了当控制平面重启时导致数据平面不必要重启的问题•内存优化代理收集器日志现在写入 stdout 而不是磁盘从而解决了内存消耗问题接下来将深入探讨这些重要功能并解释它们为何对我们的用户至关重要。限流限流对于 API 网关场景至关重要通常是开发者在构建和部署 API 时实施的首个保护措施。通过新的 RateLimitPolicy API您可以将限流以 Kubernetes 策略的形式声明并直接应用到您的路由上。这将 NGINX 强大的限流能力引入 Gateway API 工作流中避免了手动配置 NGINX 或使用自定义 annotation 的麻烦。通过简单的版本控制策略保护您的服务免受流量激增的影响防止滥用并确保资源的公平分配。为什么重要限流对于部署 API 网关的团队至关重要。它确保了在流量激增时服务的稳定性有助于缓解 DDoS 攻击并保护后端系统免于过载。通过控制请求量组织能够保持可预测的性能并为用户提供可靠的体验。此外GPU 配额昂贵且常常稀缺。与可以弹性扩展的 CPU 工作负载不同推理能力受限于硬件的可用性和成本。限流通过防止任何单个客户端独占高性能计算资源并确保最重要的工作负载获得足够的 GPU算力从而保护该投资。适用对象· 需要强制执行使用配额的多租户环境管理的平台团队· 保护服务免受恶意或异常客户端访问的 API 开发人员· 为体量攻击添加防御的安全工程师· 设计需要保证资源交付的高性能推理应用的 MLOps/AI 工程师· 管理 GPU 成本的基础设施团队需要防止来自单个客户端或服务的无限制消耗会话保持 — 通过 UpstreamSettingsPolicy CRD 支持 OSS 与 Plus尽管 NGINX Gateway Fabric 已经支持基本的会话保持功能但您现在可以配置更精细的基于 Cookie 的会话保持。这是此次发布中新增的另一个重要功能。我们再次利用 NGINX 在 Kubernetes 部署中的强大功能以确保不会出现会话丢失问题。此次发布为 NGINX OSS 和 NGINX Plus 用户引入了灵活的会话保持选项•IP HashOSS Plus通过 UpstreamSettingsPolicy 配置 ip_hash将客户端根据其 IP 地址被路由到相同的后端•基于 Cookie 的会话保持仅限 Plus在 HTTPRoute 和 GRPCRoute 规则中启用 sessionPersistence以获得更精确的基于 Cookie 的会话亲和性实验性功能为什么重要会话保持通常称为“粘性会话”确保来自同一客户端的请求始终被路由到相同的后端服务器。这对于那些将会话状态存储在本地的应用程序至关重要例如购物车、身份验证流程或多步骤表单。如果没有会话保持当请求落在不同后端时用户可能会遇到数据丢失或工作流中断。对于 AI 工作负载会话亲和性还可以减少浪费的 GPU 计算周期。当请求分散到不同的后端时每个实例可能需要重建上下文或重新加载模型状态。保持会话的粘性可以避免这种冗余计算更有效地利用昂贵的 GPU 时间。这对于减少“上下文膨胀”或因频繁重新加载工具描述或其他元数据而导致的令牌过度消耗也起着至关重要的作用这些操作通常在新会话开始时发生。适用对象· 确保购物车内容在用户会话期间保持不变的电商团队· 构建依赖本地会话存储的有状态服务的应用开发人员· 将传统有状态应用迁移到 Kubernetes 的平台工程师· 运行对话式 AI 或其他需要在多轮交互中维持上下文的长上下文窗口应用的团队身份验证过滤器Basic Auth版本 2.4.0 标志着 NGINX Gateway Fabric 身份验证功能的开始。新的 AuthenticationFilter 引入了对 HTTP Basic Auth 的支持使您能够使用用户名和密码凭证保护路由无需外部身份提供者。尽管 Basic Auth 是最简单的身份验证方法之一但它在内部工具、开发环境以及需要轻量级保护的场景中仍然具有价值。这仅仅是一个开始未来的版本将扩展 AuthenticationFilter加入 NGINX 提供的其他身份验证方法。为什么重要Basic Auth 提供了一种快速、低摩擦的方式来保护路由当简洁性比高级安全功能更重要时尤其有用。将此功能内置于 Gateway API 意味着少了一个需要部署和管理的工具。适用对象· 保护内部仪表盘和管理端点的 DevOps 团队· 在不使用复杂身份验证设置的情况下保护预发布环境和测试环境的开发人员· 在实施企业单点登录之前需要轻量级方案的平台工程师TCP 路由和 UDP 路由NGINX Gateway Fabric 现在支持 TCPRoute 和 UDPRoute resource将 Gateway API 的能力从 HTTP/HTTPS 扩展到第 4 层流量。这使您可以通过同一个网关代理非 HTTP 工作负载例如数据库PostgreSQL、MySQL、Redis、DNS 服务器、消息队列以及 IoT 协议。为什么重要现代平台通常同时运行 HTTP API 和非 HTTP 服务。如果没有第 4 层支持团队就必须为 TCP/UDP 工作负载部署独立的负载均衡器或 Ingress 解决方案。有了 TCPRoute 和 UDPRoute您可以将流量管理整合到统一的 Gateway API 工作流中从而简化运维并减少基础设施分散。适用对象· 通过网关暴露 PostgreSQL、MySQL 或 Redis 的团队· 路由流量到 IoT 设备的平台团队· 路由流量到向量数据库、模型注册表或自定义推理协议的团队Gateway API Inference Extension本次发布新增对多个 Inference Pool 后端的支持作为 Gateway API Inference Extension 的一部分。借助此功能单个 HTTPRoute 现在可以在其 backendRefs 中引用多个 InferencePool从而实现模型变体的流量拆分、新模型版本的分阶段发布以及跨 Pool 的路由以进行容量管理。为什么重要实际推理部署很少只涉及单一同质化 Pool。团队通常需要在不同模型版本之间路由、在微调的 LoRA adapter 之间拆分流量或在不同容量等级之间分配负载。在单条路由支持多个 Pool 不仅消除了繁琐的变通做法也使 NGF 更贴合生产环境的推理模式。由于 GPU 成本在 AI 基础设施预算中占比极高跨推理池的智能路由对于提升利用率和控制开销变得至关重要。适用对象· 在生产环境中管理多个模型版本或 LoRA adapter 的 ML 团队· 为推理服务实施金丝雀或蓝绿发布的平台工程师· 在不同容量等级间优化 GPU 利用率的基础设施团队总结与展望本次发布增强了 F5 NGINX Gateway Fabric 作为生产级 Gateway API 实现的能力增加了对关键用例的支持包括限流、会话保持、代理缓冲器配置、TCP/UDP 路由和 TLS Listener 配置。这些增强功能使运行高吞吐量的生产级应用更加容易同时在负载下保持可靠性。展望下一次发布我们将继续扩展身份验证功能包括额外的安全特性同时保持与 Kubernetes Gateway API 的规范一致。由于 GPU 分配价格昂贵且供应有限而 GPU 分配对突发且可能需要更长上下文能力的 AI 推理工作负载仍然是挑战因此保护、管理和高效路由推理流量的能力已经成为必需能力。我们要对以下贡献表示衷心感谢•通过 SnippetsPolicy 在网关级别支持 Snippets#4461。感谢 fabian4 的实现。•支持 TCPRoute 和 UDPRoute#4518。感谢 Skcey 推动此能力使 NGINX Gateway Fabric 在第 4 层用例上更适合企业级使用。•数据平面访问日志可配置的转义格式#4530。感谢 michasHL 的增强贡献。

相关文章:

F5 NGINX Gateway Fabric 2.4.0 新功能发布

原文作者:Sean Moloney - F5 Product Manager原文链接:F5 NGINX Gateway Fabric 2.4.0 新功能发布转载来源:NGINX 中文社区NGINX 唯一中文官方社区 ,尽在 nginx.org.cn 我们很高兴地宣布 F5 NGINX Gateway Fabric 2.4.0 已经发布。…...

WinBtrfs:Windows平台原生读写Btrfs文件系统的完整指南

WinBtrfs:Windows平台原生读写Btrfs文件系统的完整指南 【免费下载链接】btrfs WinBtrfs - an open-source btrfs driver for Windows 项目地址: https://gitcode.com/gh_mirrors/bt/btrfs 你是否曾经遇到过这样的烦恼?在Windows系统上无法直接访…...

AEUX:如何用跨平台设计转换引擎重构动效工作流?

AEUX:如何用跨平台设计转换引擎重构动效工作流? 【免费下载链接】AEUX Editable After Effects layers from Sketch artboards 项目地址: https://gitcode.com/gh_mirrors/ae/AEUX 在数字创意产业中,设计工具与动效制作之间的鸿沟长期…...

告别编译报错:手把手教你配置IAR for CC2530的工程选项与链接器文件

攻克IAR编译难题:CC2530工程配置与链接器文件深度解析 当你满怀期待地在IAR Embedded Workbench中点击"Build"按钮,却看到满屏红色错误提示时,那种挫败感每个嵌入式开发者都深有体会。特别是使用CC2530这类资源受限的芯片时&#x…...

实战指南:HTTrack网站镜像解决方案的完整部署与优化策略

实战指南:HTTrack网站镜像解决方案的完整部署与优化策略 【免费下载链接】httrack HTTrack Website Copier, copy websites to your computer (Official repository) 项目地址: https://gitcode.com/gh_mirrors/ht/httrack HTTrack作为业界领先的开源网站镜像…...

Go 内存逃逸调试技巧

Go语言以高效的内存管理著称,但内存逃逸问题却可能成为性能瓶颈的隐形杀手。当变量本应在栈上分配却意外逃逸到堆上时,不仅会增加GC压力,还会降低程序运行效率。本文将深入剖析Go内存逃逸的调试技巧,帮助开发者快速定位问题并优化…...

跨部门协作黄金法则:让他人主动配合的核心逻辑与实操方法

跨部门协作黄金法则:让他人主动配合的核心逻辑与实操方法 跨部门协作是企业运转的“毛细血管”,却也是多数职场人绕不开的“痛点场”——需求对接不清晰、责任划分模糊、沟通效率低下,导致项目推进卡顿、内耗加剧。很多人误以为“配合”靠的是…...

从森林到城市夜间灯光与卫星遥感协同:双碳目标下基于遥感技术的碳库、碳平衡、温室气体、碳循环等多领域监测与模拟

在“双碳”战略目标的宏观背景下,遥感技术作为实现碳库、碳平衡、温室气体及碳循环等多领域精准监测与模拟的关键手段,正迎来前所未有的发展机遇。本研究聚焦于遥感技术在生态系统碳储量估算、碳收支模拟、土地利用碳排放效应监测、能源消耗碳排放空间模…...

告别马赛克!用Real-ESRGAN一键修复老照片和动漫截图(附Windows/Mac保姆级教程)

告别马赛克!用Real-ESRGAN一键修复老照片和动漫截图(附Windows/Mac保姆级教程) 老照片泛黄褪色、动漫截图模糊不清——这些画质问题如今有了开箱即用的解决方案。Real-ESRGAN作为当前最易用的超分辨率工具之一,只需三步操作就能让…...

机房上网被锁?从极域网络限制原理到实战绕过(附键盘解锁思路)

机房网络限制的底层原理与实用绕过方案 当你在学校机房打开浏览器,却发现所有社交、游戏网站都被屏蔽;当你想用快捷键调出任务管理器,却发现键盘被锁死——这种无力感想必许多人都经历过。机房管理软件通过一系列技术手段实现这些限制&#x…...

Python Counter实战:5个数据分析场景让你秒懂这个统计神器

Python Counter实战:5个数据分析场景让你秒懂这个统计神器 在数据分析的日常工作中,统计元素出现频率是最基础却最频繁的需求之一。想象一下这样的场景:你需要分析电商平台上哪些商品被用户频繁浏览,或者统计社交媒体上热门话题的…...

当HttpOnly锁住Cookie后,我们还能做什么?5种绕过思路与实战演示

当HttpOnly锁住Cookie后,渗透测试的5种高阶攻击路径 在渗透测试中遇到HttpOnly属性的Cookie时,传统的XSS盗取会话ID的方法往往失效。但安全攻防从来都是道高一尺魔高一丈的博弈。本文将分享五种实际演练中验证有效的技术方案,这些方法在近两年…...

PCIe事务排序避坑指南:为什么你的DMA传输会死锁?RO和IDO位到底该怎么设

PCIe事务排序避坑指南:为什么你的DMA传输会死锁?RO和IDO位到底该怎么设 在嵌入式系统和FPGA设计中,PCIe总线的DMA传输性能往往直接影响整个系统的吞吐量。但许多工程师在调试自定义PCIe设备时,都遇到过这样的困境:明明…...

从PPO到DPO:深度解析强化学习优化策略的演进与实战

1. 强化学习优化策略的演进脉络 强化学习作为机器学习的重要分支,其核心挑战在于如何在复杂环境中找到最优决策策略。过去十年间,优化算法经历了从基础策略梯度到复杂约束优化的演进过程。早期研究者们发现,传统的策略梯度方法虽然直观&#…...

保姆级教程:用SNAP 8.0和Sentinel-1数据复现门源地震形变图(含snaphu解缠避坑指南)

从零开始:SNAP 8.0与Sentinel-1数据实战门源地震形变监测全流程解析 当2021年12月青海门源发生6.9级地震时,合成孔径雷达干涉测量(DInSAR)技术再次证明了其在地表形变监测中的独特价值。对于刚接触雷达遥感的GIS专业学生或工程师而言,掌握这套…...

Python如何实现AutoCAD自动化?3个高效技巧快速掌握pyautocad

Python如何实现AutoCAD自动化?3个高效技巧快速掌握pyautocad 【免费下载链接】pyautocad AutoCAD Automation for Python ⛺ 项目地址: https://gitcode.com/gh_mirrors/py/pyautocad 想要用Python自动化AutoCAD操作吗?pyautocad库为您提供了完整…...

从《春泥棒》的MV美学,聊聊如何用DaVinci Resolve调出日系清新动画感色调

从《春泥棒》的MV美学,聊聊如何用DaVinci Resolve调出日系清新动画感色调 第一次看到《春泥棒》的MV时,那种扑面而来的春日气息让人瞬间沉醉。画面中飘落的樱花仿佛带着温度,高光处微微泛青的色调与暖调的阴影形成微妙平衡,整体呈…...

如何在Windows上实现原生Btrfs支持:专业级跨平台文件系统解决方案终极指南

如何在Windows上实现原生Btrfs支持:专业级跨平台文件系统解决方案终极指南 【免费下载链接】btrfs WinBtrfs - an open-source btrfs driver for Windows 项目地址: https://gitcode.com/gh_mirrors/bt/btrfs WinBtrfs是一款革命性的Windows平台原生Btrfs文件…...

Revelation光影包:打造电影级Minecraft画面的终极指南

Revelation光影包:打造电影级Minecraft画面的终极指南 【免费下载链接】Revelation An explorative shaderpack for Minecraft: Java Edition 项目地址: https://gitcode.com/gh_mirrors/re/Revelation 想要让你的Minecraft世界从简单的像素方块变成令人惊叹…...

AI+交通智能调度:深度分析与完整解决方案

摘要随着城市化进程加速和交通需求爆发式增长,传统交通调度系统面临数据孤岛、响应滞后、效率低下等严峻挑战。人工智能技术的突破性发展为交通智能调度带来了革命性变革。本报告基于最新技术发展,系统性地分析了AI交通智能调度的技术架构、核心算法、应…...

算法训练营第十天|26. 删除有序数组中的重复项

今日学习的文章链接和视频链接今日任务:26. 删除有序数组中的重复项 巩固双指针算法,提交第二周学习小结 题意: 给你一个 非严格递增排列 的数组 nums ,请你 原地 删除重复出现的元素,使每个元素 只出现一次 &#x…...

用PyTorch Lightning快速搭建3D CNN:从视频分类到动作识别的保姆级实战

用PyTorch Lightning快速搭建3D CNN:从视频分类到动作识别的保姆级实战 视频数据蕴含着丰富的时空信息,如何高效提取这些特征一直是计算机视觉领域的核心挑战。传统2D卷积神经网络在处理视频时往往力不从心,而纯手工搭建3D卷积网络又面临代码…...

STM32Cubemx定时器PWM驱动加湿器实现动态氛围效果

1. 雾化片驱动原理与电路设计 加湿器的核心部件是雾化片,它通过高频振动将水分子打散成微小颗粒形成雾气。常见的雾化片工作频率在108kHz左右,这个频率下雾化效率最高。驱动电路通常由MOS管和LC谐振电路组成,STM32产生的PWM信号经过MOS管放大…...

从实验室到产线:DCDC电源模块全流程测试实战(含高低温箱与N6705电源记录仪使用心得)

从实验室到产线:DCDC电源模块全流程测试实战指南 在硬件产品从研发走向量产的过程中,电源模块的可靠性往往决定着整机产品的成败。一款优秀的DCDC电源模块,不仅需要在实验室环境下表现出色,更要经受住产线批量生产和各种极端使用环…...

别光看教程了!手把手带你用STM32F103C8T6最小系统板点亮第一个LED(附完整电路图)

从零点亮STM32F103C8T6的LED:硬件连接与代码实战指南 当你第一次拿到这块蓝色的小板子时,最迫切的愿望一定是让它"活过来"。本文将用最直接的方式,带你完成嵌入式开发的第一个仪式——点亮LED。我们跳过复杂的理论,直接…...

别再乱选了!电动两轮车BMS高边/低边、同口/分口方案实战对比(附TI BQ76952配置)

电动两轮车BMS架构深度解析:高边/低边与同口/分口方案实战指南 当你在深夜调试一块突然锁死的BMS板时,最令人崩溃的往往不是某个元件的故障,而是发现当初的架构选型埋下了致命隐患——这种痛,只有经历过量产返修的工程师才懂。在电…...

Blender PSK/PSA格式导入导出插件架构实现与技术解析

Blender PSK/PSA格式导入导出插件架构实现与技术解析 【免费下载链接】io_scene_psk_psa A Blender extension for importing and exporting Unreal PSK and PSA files 项目地址: https://gitcode.com/gh_mirrors/io/io_scene_psk_psa Unreal PSK/PSA Importer/Exporter…...

tmux normal

AI时代工程师的超级能力进化论 技术认知能力升级 从掌握单一技术栈到建立多维技术图谱 理解AI技术原理与应用场景的深度关联 技术选型中平衡创新性与工程可行性 系统思维维度拓展 传统系统工程思维与AI不确定性的融合 构建可解释、可验证的AI系统架构 技术债预防与AI模型生命周…...

从ADR445到MC1403:四种电压基准芯片的温漂实测与选型指南

1. 电压基准芯片的江湖地位与选型痛点 在精密测量设备的设计中,电压基准芯片就像武侠世界里的定海神针——它输出的电压值直接决定了整个系统的测量精度。我十年前设计第一台工业温控仪时,就曾因为选错基准源导致整批产品返工,那次教训让我深…...

从课堂到仿真:用Matlab玩转拉普拉斯变换,可视化你的信号与系统

从课堂到仿真:用Matlab玩转拉普拉斯变换,可视化你的信号与系统 拉普拉斯变换是《信号与系统》课程中让人又爱又恨的核心工具——它能将微分方程转化为代数方程,却也因抽象性让许多学生陷入"会算不会用"的困境。当你在作业本上推导出…...