当前位置: 首页 > article >正文

Higress 加入 CNCF:保障 Nginx Ingress 迁移,提供企业级 AI 网关

我们很高兴地宣布Higress 已正式通过 TOC 投票表决加入云原生计算基金会CNCFSandbox 项目成为 CNCF 生态的一员。Higress 是什么Higress 是一款基于 Envoy 和 Istio 构建的 AI 原生、高性能 API 网关。它将流量网关、微服务网关与 AI 网关统一于单一控制面降低云原生与 AI 工作负载的运维复杂度。Higress 诞生于阿里巴巴内部大规模生产实践为 CNCF 生态带来企业级稳定性与 WebAssemblyWasm扩展能力。目前其核心能力聚焦两大方向Ingress Controller 与 Gateway 能力 Higress 是成熟的 Kubernetes Ingress Controller同时完整支持 Gateway API 及其 Inference Extension。随着 Nginx Ingress 计划于 2026 年退役Higress 可作为安全、即插即用的替代方案——兼容主流 Nginx Ingress 注解以 xDS 控制面与 Wasm 沙箱替代脆弱的配置注入模式消除传统架构中的安全风险。无论是继续使用 Ingress 还是迁移至 Gateway APIHigress 均提供统一、可扩展的流量治理能力。AI 原生网关能力 Higress 将 AI 流量视为一等公民原生支持 LLM 调用、Model Context ProtocolMCP及 AI 推理场景提供基于 Token 的限流、多模型 Fallback、RAG 检索、模型感知路由与智能负载均衡等能力标准化云原生应用消费大语言模型的方式使 Higress 成为 AI Agent 与 LLM 流量的标准入口。Higress 企业案例Higress 已在多种不同的环境中展现出了足以投入生产的可靠性。目前的企业采用者包括阿里巴巴集团、蚂蚁集团、携程、大疆创新、国泰产险、唯品会、Boss 直聘、快手、Sealos 等覆盖互联网、金融、旅游出行、硬件、娱乐、创新企业等多个行业和领域。这些企业既使用了Higress 云原生网关的能力也将其 AI 网关能力部署到企业的 Agent 应用或 MCP 服务上。此外在 Higress 的基础上延伸出诸多 AI 相关的创新开源项目包括 HiMarket、HiClaw 等。为什么申请加入 CNCFHigress 加入云原生计算基金会CNCF是其发展进程中的关键一步主要源于以下三方面的考虑CNCF 汇聚了包括 Kubernetes、Envoy 等在内的众多核心开源项目。Higress 基于 Envoy 和 Istio 构建其技术基因与云原生环境天然契合。成为 CNCF 的一员意味着 Higress 能够更深入地与这些顶级项目协作共同定义技术标准确保其在云原生架构中的兼容性和领先地位。其次开源项目的长期健康发展依赖于一个多元且活跃的贡献者社区。依托 CNCF 的中立地位和成熟的治理框架Higress 可以吸引更多来自不同组织的开发者、用户和企业参与贡献避免项目发展受单一厂商意志的影响。这种开放的社区模式将加速技术创新使 Higress 能够更敏捷地响应全球用户不断演进的需求。最后加入 CNCF 有助于推动 AI 网关技术的标准化和普及。随着 AI 应用的爆发市场迫切需要专门针对 AI 场景优化的基础设施。Higress 凭借其在 AI 代理Agent、多模型统一管理等方面的领先实践有望在 CNCF 的平台上推动 AI 网关相关标准的建立。后续规划长期兼容与生态共建展望未来项目将围绕两大核心方向持续演进长期兼容 Ingress支持完善的 Gateway API 及其 Inference Extension同时提供完善的 Nginx Ingress 迁移方案 持续支持并兼容 Ingress 与 Nginx Ingress 注解与 Gateway API 双栈共存强化对 Gateway API 及 Inference Extension 核心版本与能力的适配与稳定供给为云原生网络与 AI 应用提供可持续的开源基础设施选择提供完善的 Ingress 迁移方案无论用户选择迁移至 Gateway API 还是继续使用 Ingress均能获得平滑、可落地的迁移路径。持续推进 AI 能力建设 深化对 Model Context ProtocolMCP的支持使 Higress 成为 AI Agent 与 LLM 流量的标准入口引入「Higress Agent」实现自主流量治理支持 AI 场景的实时通信需求构建 Skill 渐进式披露与安全管理能力持续完善基于 Token 的限流、多模型 Fallback、智能负载均衡等 AI 原生能力。Sandbox 只是起点加入 CNCF Sandbox 是起点而非终点。Higress 社区将持续投入治理、文档与社区建设。接下来我们将继续向 CNCF Incubation孵化 阶段迈进。感谢 CNCF 技术监督委员会、更广泛的云原生社区以及所有支持 Higress 的贡献者与采用方。我们期待与 CNCF 生态携手共建安全、可扩展、AI 友好的云原生基础设施。了解更多: higress.ai | GitHub | Documentation 文档

相关文章:

Higress 加入 CNCF:保障 Nginx Ingress 迁移,提供企业级 AI 网关

我们很高兴地宣布,Higress 已正式通过 TOC 投票表决,加入云原生计算基金会(CNCF)Sandbox 项目,成为 CNCF 生态的一员。 Higress 是什么? Higress 是一款基于 Envoy 和 Istio 构建的 AI 原生、高性能 API …...

【MCP协议实战白皮书】:20年架构师亲测——REST API吞吐量下降47%的真相与MCP生产级部署 checklist

第一章:【MCP协议实战白皮书】:20年架构师亲测——REST API吞吐量下降47%的真相与MCP生产级部署 checklist某金融核心系统在接入MCP(Model Control Protocol)协议后,其关键REST API平均吞吐量骤降47%,P95延…...

Gemma-3-270m与STM32开发实战:智能硬件项目

Gemma-3-270m与STM32开发实战:智能硬件项目 1. 项目背景与价值 最近我在做一个智能家居项目,需要让设备能够理解简单的语音指令并做出响应。传统的语音识别方案要么太贵,要么功耗太高,直到我发现了Gemma-3-270m这个超轻量级模型…...

Neeshck-Z-lmage_LYX_v2高效方案:单次生成耗时<12秒的轻量推理优化

Neeshck-Z-lmage_LYX_v2高效方案&#xff1a;单次生成耗时<12秒的轻量推理优化 想体验国产文生图模型&#xff0c;但被复杂的部署、缓慢的生成速度和繁琐的参数调节劝退&#xff1f;今天介绍的这个工具&#xff0c;或许能彻底改变你的看法。Neeshck-Z-lmage_LYX_v2&#xf…...

Fish Speech 1.5语音合成:5分钟快速部署,新手也能玩转多语言TTS

Fish Speech 1.5语音合成&#xff1a;5分钟快速部署&#xff0c;新手也能玩转多语言TTS 1. 从零开始&#xff1a;5分钟搭建你的专属语音合成站 上周有个做知识付费的朋友找我&#xff0c;他想把课程文稿转成多国语言的音频&#xff0c;方便海外学员学习。市面上工具要么贵&am…...

从懵逼到通关:我的第一次 SSH 暴力破解与后门植入实验(小白视角)

大家好&#xff0c;我是刚接触网络安全的小白老许&#xff0c;今天想跟大家聊聊我在靶机环境下完成的第一次渗透实验 —— 全程从上课懵圈到课后一步步啃下来&#xff0c;踩了无数坑&#xff0c;也终于搞懂了「暴力破解」和「持久化后门」到底是怎么回事。⚠️ 重要声明&#x…...

MedGemma应用场景探索:医学教育、科研验证与原型开发

MedGemma应用场景探索&#xff1a;医学教育、科研验证与原型开发 1. 引言&#xff1a;医学AI的多模态革命 在医学影像分析领域&#xff0c;传统方法往往需要专家花费大量时间进行人工解读。MedGemma Medical Vision Lab的出现&#xff0c;为这一过程带来了智能化的解决方案。…...

Z-Image-GGUF惊艳案例集:抽象艺术×中国传统纹样×数字人像融合创作

Z-Image-GGUF惊艳案例集&#xff1a;抽象艺术中国传统纹样数字人像融合创作 1. 项目简介与核心价值 今天我想和你分享一个特别有意思的AI图像生成项目——Z-Image-GGUF。这可不是普通的文生图工具&#xff0c;而是阿里巴巴通义实验室开源模型的一个量化版本&#xff0c;专门为…...

STM32HAL库实战:J-Link RTT高效调试技巧与性能优化

1. J-Link RTT调试技术入门指南 第一次接触J-Link RTT调试技术时&#xff0c;我正被传统串口调试的各种限制困扰着。每次修改代码后都需要重新插拔串口线&#xff0c;调试信息输出速度慢得像老牛拉车&#xff0c;更别提那些因为串口占用导致的资源冲突问题了。直到发现了J-Link…...

Qt 利用QDialog打造动态遮罩层:提升弹窗交互体验

1. 为什么需要动态遮罩层&#xff1f; 做Qt开发的朋友们肯定都遇到过这样的场景&#xff1a;当你点击某个按钮弹出一个对话框时&#xff0c;如果对话框和主窗口的背景色太接近&#xff0c;用户很难快速分辨出对话框的边界。这种情况在深色主题的UI中尤其明显&#xff0c;我曾经…...

WSL2-Debian下CUDA与cuDNN环境配置全攻略

1. WSL2-Debian环境准备 在开始配置CUDA和cuDNN之前&#xff0c;我们需要确保WSL2-Debian环境已经正确设置。WSL2是微软推出的第二代Windows子系统&#xff0c;它提供了接近原生Linux的性能&#xff0c;非常适合开发者和研究人员使用。不过&#xff0c;与原生Linux系统相比&…...

红日靶场(二)Apache与MySQL服务异常排查与修复指南

1. 红日靶场环境简介 红日靶场是网络安全学习者常用的实战演练环境&#xff0c;它模拟了真实的服务器配置和常见漏洞场景。在这个环境中&#xff0c;Apache和MySQL作为基础服务组件&#xff0c;经常会出现各种启动异常问题。我自己在搭建红日靶场时&#xff0c;就遇到过好几次服…...

从计算机组成原理角度看AI模型推理:春联生成的GPU算力消耗

从计算机组成原理角度看AI模型推理&#xff1a;春联生成的GPU算力消耗 春节临近&#xff0c;想用AI模型生成一副独一无二的春联&#xff0c;体验一下科技与传统文化的碰撞。你可能已经试过&#xff0c;输入几个关键词&#xff0c;几秒钟后一副对仗工整、寓意吉祥的春联就跃然屏…...

Windows10环境下DETR模型实战:从零构建自定义数据集训练流程

1. 环境准备与依赖安装 在Windows10上跑通DETR模型的第一步就是搭建合适的开发环境。我建议使用Anaconda创建独立的Python环境&#xff0c;这样可以避免与其他项目的依赖冲突。实测下来Python 3.7版本兼容性最好&#xff0c;PyTorch建议选择1.7.0以上版本。 安装基础依赖时最容…...

实战指南:压控电压源二阶带通滤波器设计与参数优化

1. 压控电压源二阶带通滤波器基础认知 第一次接触压控电压源二阶带通滤波器时&#xff0c;我完全被那些公式和参数搞晕了。后来在实验室熬了三个通宵才明白&#xff0c;这其实就是个"频率筛子"——只让特定频率范围的信号通过&#xff0c;其他频率要么被挡在外面&…...

CTF(misc) USB流量解析实战:从键盘数据到Flag获取

1. USB流量解析在CTF比赛中的重要性 在CTF比赛中&#xff0c;杂项&#xff08;misc&#xff09;类题目往往考验选手的综合分析能力。USB流量解析作为其中的经典题型&#xff0c;近年来频繁出现在各类赛事中。这类题目通常会提供一个包含USB设备通信数据的流量包文件&#xff08…...

Stable Yogi Leather-Dress-Collection生成伦理探讨:建立负责任的AI设计准则

Stable Yogi Leather-Dress-Collection生成伦理探讨&#xff1a;建立负责任的AI设计准则 最近&#xff0c;一个名为Stable Yogi Leather-Dress-Collection的AI设计工具在时尚圈里小火了一把。它能让设计师输入几个关键词&#xff0c;比如“复古机车风”、“鳄鱼纹”、“修身连…...

如何用n8n+Gemini+Pollinations.ai打造小红书爆款笔记全自动生产线

如何用n8nGeminiPollinations.ai打造小红书爆款笔记全自动生产线 在内容为王的时代&#xff0c;小红书运营者每天面临的最大挑战是如何持续产出高质量笔记。传统人工创作模式不仅耗时耗力&#xff0c;更难以保证内容风格的一致性。本文将揭示一套基于n8n工作流引擎的自动化解决…...

ASN.1编码规则实战:从BER到XER的完整解析与避坑指南

ASN.1编码规则实战&#xff1a;从BER到XER的完整解析与避坑指南 在网络协议开发和安全传输领域&#xff0c;数据编码的效率与可靠性直接影响系统性能。ASN.1&#xff08;Abstract Syntax Notation One&#xff09;作为描述数据结构的标准语言&#xff0c;其编码规则的选择往往让…...

赋能中国企业出海:欧洲展台搭建欧标实操解析与孚锐实践

随着中国企业全球化布局持续深化&#xff0c;欧洲作为全球会展业的核心阵地&#xff0c;凭借成熟的行业体系、广阔的市场潜力&#xff0c;成为中国企业出海展示品牌实力的重要舞台。展台作为品牌与欧洲市场对话的核心载体&#xff0c;其搭建质量不仅关乎品牌形象&#xff0c;更…...

DASD-4B-Thinking惊艳效果:gpt-oss-120b知识蒸馏后的4B推理表现

DASD-4B-Thinking惊艳效果&#xff1a;gpt-oss-120b知识蒸馏后的4B推理表现 1. 引言&#xff1a;小模型也能有大智慧 你可能会好奇&#xff0c;一个只有40亿参数的模型&#xff0c;在数学、编程和科学推理这些需要深度思考的任务上&#xff0c;能有什么样的表现&#xff1f;毕…...

STM32G473闪存保护全攻略:PCROP+安全区域配置避坑指南

STM32G473闪存保护全攻略&#xff1a;PCROP安全区域配置避坑指南 在物联网设备开发中&#xff0c;固件和敏感数据的安全保护至关重要。STM32G4系列微控制器提供了多种闪存保护机制&#xff0c;包括专有代码读出保护(PCROP)和安全存储区域配置&#xff0c;这些功能能有效防止未经…...

ComfyUI双PuLID节点工作流排错实录:如何解决KSampler的Float/Half类型冲突问题

ComfyUI双PuLID节点工作流排错实录&#xff1a;如何解决KSampler的Float/Half类型冲突问题 当你在ComfyUI中尝试运行包含两个Apply PuLID Flux节点的复杂工作流时&#xff0c;可能会遇到一个令人困惑的错误&#xff1a;"KSampler expected scalar type Float but found Ha…...

GD32F103上电不启动?5个硬件排查技巧帮你快速定位问题

GD32F103上电不启动&#xff1f;硬件工程师的深度排查实战指南 作为一名常年和GD32F1系列MCU打交道的硬件工程师&#xff0c;我太清楚那种感觉了——电路板焊接完毕&#xff0c;满怀期待地接通电源&#xff0c;结果指示灯不亮&#xff0c;串口没反应&#xff0c;调试器连不上&a…...

AD丝印调整终极指南:从文字居中到批量修改的5个工业级技巧

AD丝印调整终极指南&#xff1a;从文字居中到批量修改的5个工业级技巧 在PCB设计的最后阶段&#xff0c;丝印处理往往成为硬件工程师最容易忽视的环节。那些看似微不足道的白色文字和符号&#xff0c;却是电路板可读性和可维护性的关键所在。想象一下&#xff0c;当你的设计进入…...

CTFshow逆向实战:Base64多层嵌套解码的Python自动化脚本解析(附完整代码)

CTFshow逆向实战&#xff1a;Base64多层嵌套解码的Python自动化脚本解析&#xff08;附完整代码&#xff09; 在CTF竞赛中&#xff0c;Base64编码的嵌套使用是一种常见的混淆手段。本文将深入探讨如何通过Python脚本自动化处理多层Base64嵌套解码问题&#xff0c;帮助参赛者快速…...

开源方案:利用万象熔炉API为LaTeX论文创建动态插图库

开源方案&#xff1a;利用万象熔炉API为LaTeX论文创建动态插图库 1. 学术插图的自动化革命 在撰写学术论文时&#xff0c;插图制作往往是耗时最长的环节之一。传统流程需要研究者掌握专业绘图工具&#xff0c;或与设计师反复沟通&#xff0c;严重分散科研注意力。以量子计算领…...

MAI-UI-8B使用教程:Web界面访问与Python API集成

MAI-UI-8B使用教程&#xff1a;Web界面访问与Python API集成 1. MAI-UI-8B简介 MAI-UI-8B是一款革命性的GUI智能体&#xff0c;它能像人类一样理解和操作图形用户界面。想象一下&#xff0c;有一个AI助手不仅能理解你的指令&#xff0c;还能实际点击按钮、填写表单、导航菜单…...

神经符号AI:让机器“既懂规则,又会学习”的自然语言理解新范式

神经符号AI&#xff1a;让机器“既懂规则&#xff0c;又会学习”的自然语言理解新范式 引言&#xff1a;当神经网络遇见符号逻辑 在追求通用人工智能&#xff08;AGI&#xff09;的道路上&#xff0c;我们常常面临一个两难选择&#xff1a;以深度学习为代表的神经网络方法拥有强…...

Kafka 消费者组频繁 Rebalance?我用一套可观测脚本把根因揪出来了

Kafka 消费者组频繁 Rebalance&#xff1f;我用一套可观测脚本把根因揪出来了 搞了两个晚上&#xff0c;我才把这次 Kafka 抖动的根因彻底揪出来。 表面上看只是消费者组频繁 Rebalance&#xff0c;实际上它带来的连锁反应很恶心&#xff1a;消费延迟突然拉长、业务日志开始堆错…...