当前位置：首页 > article >正文

Go + Redis 实现可恢复的 LLM 流式推送：断线不丢数据的实战方案

article 2026/4/16 5:58:40

做 LLM 流式输出的时候用户刷新一下页面流就断了后端还在跑token 白烧。本文分享一种基于 Redis Streams 的断线续传方案附完整 Go 代码。一、问题背景最近做了一个 AI 对话服务后端 GoLLM 输出通过 SSE 推给前端。上线后发现一个很头疼的问题用户刷新页面 → SSE 断了 → 后端还在跑 → token 白烧用户看不到输出 → 点重新生成 → 又烧一遍钱分布式部署下LLM worker 和 HTTP handler 不在同一台机器重连后负载均衡打到新节点找不到原来的流二、JS 生态有方案Go 没有调研了一圈JS/TS 已经有成熟方案方案说明vercel/resumable-streamVercel 官方绑定 AI SDKdurable-streamsElectricSQL 出品多语言 SDK需要跑专用 serverai-resumable-stream社区方案也是绑 AI SDK核心思路都一样chunk 存 Redis断线重连时 replay。但 Go 生态里一个能用的都没有。三、方案设计自己造了个轮子streamhub3.1 架构LLM Worker (Instance A) │ ├── Publish chunks ──→ Redis Stream持久化 │ │ │ ├──→ Consumer (Instance B) ──→ SSE │ └──→ 新连接自动 replay 历史 │ └── Listen cancel ←── Redis Pub/Sub ←── 任意节点3.2 两个 Redis 原语Redis StreamsXADD/XREAD存 chunk支持从任意位置回放Redis Pub/Sub传 cancel 信号延迟低3.3 防重复机制Generation ID作为 fencing token旧 producer 的写入会被拒绝单 Producer 注册同 session 只允许一个 producer不会重复调 LLM四、核心代码4.1 安装go get github.com/gtoxlili/streamhubv0.1.04.2 创建 Hubclient,_:rueidis.NewClient(rueidis.ClientOption{InitAddress:[]string{127.0.0.1:6379},})hub:streamhub.New(client)4.3 生产端stream,created,err:hub.Register(chat:123,func(){// 收到 cancel 信号的回调llmCancel()})if!created{return// 其他实例已经在跑了}deferstream.Close()// 可以设置 metadatastream.SetMetadata(map[string]any{model:gpt-4})fortoken:rangellmOutput{stream.Publish(token)}关键点created为false说明已有 producer不要重复生产。4.4 消费端任意实例stream:hub.Get(chat:123)ifstreamnil{return// session 不存在}chunks,unsub:stream.Subscribe(128)deferunsub()forchunk:rangechunks{// 自动先 replay 历史再无缝切 livefmt.Fprintf(w,data: %s\n\n,chunk)w.(http.Flusher).Flush()}4.5 远程取消hub.Get(chat:123).Cancel()// 通过 Redis Pub/Sub 广播producer 所在实例收到回调五、对比特性streamhubvercel/resumable-streamdurable-streams语言GoTypeScript多语言存储复用现有 RedisRedis专用 server断线 replay✅✅✅跨实例 cancel✅❌❌单 producer✅❌❌额外依赖无Vercel AI SDK需部署 server六、适用场景LLM / AI Agent 流式响应需要断线续传SSE / WebSocket 推送要求不丢数据微服务架构生产者消费者在不同实例从其他服务远程取消正在进行的生成任务七、总结核心就是一句话把流的状态从进程内存搬到 Redis让生产和消费彻底解耦。项目地址github.com/gtoxlili/streamhub目前还在早期阶段API 可能会调整。如果你也在做类似的项目欢迎提 Issue 交流。

Go + Redis 实现可恢复的 LLM 流式推送：断线不丢数据的实战方案

相关文章：

Go + Redis 实现可恢复的 LLM 流式推送：断线不丢数据的实战方案

技术实战：基于CLI与AgentSkill 构建工业级AI影视解说自动化链路

2026年本地geo推广服务商大盘点，这些你都知道吗？

做了5年软考班主任，我发现能一次上岸的学员，都有这3个共同点

OpenEuler 硬盘挂载

Golang如何部署到Kubernetes_Golang K8s部署教程【推荐】

DeepSeek-R1-Distill-Qwen-7B入门实战：从零开始搭建推理环境

李佳琦后退，美ONE在赌一场没有“顶流”的未来

酷狗音乐API深度解析：5大核心技术构建完整的音乐服务生态

Step3-VL-10B-Base从零开始：C语言基础与模型底层调用原理

DAMOYOLO-S检测展示：支持PNG透明通道输入，保留原始Alpha信息输出

3步实现《重返未来：1999》智能托管：M9A助手如何让你每天节省2小时游戏时间

文脉定序环境部署：适配中小企业知识库的轻量级重排序服务搭建指南

前端组件设计原则

人工智能之知识蒸馏第三章知识类型分类与蒸馏对象选择策略

Zend VM直接运行PHP代码出结果就不需要CPU了？

GME-Qwen2-VL-2B-Instruct开发入门：Git版本控制与团队协作实践

【2026奇点智能技术大会权威解码】：多模态导航如何重构LBS服务底层逻辑？

SDMatte提示词（Prompt）工程：如何描述图片以获得更好抠图效果

AI 3D内容生成全攻略：从建模到渲染，一站式搞定商用需求

Python第三课: 基础语法（2）：顺序、条件、循环全攻略+人生重开模拟器

万物识别-中文-通用领域镜像与Linux安装教程结合：系统部署指南

SeqGPT-560M多场景：物联网设备日志中自动提取错误码、时间戳、模块名、原因描述

【智能家居奇点倒计时】：仅剩18个月！2026大会认证的7个必须升级的多模态交互协议

免费商用的专业中文宋体：思源宋体TTF完整指南

c++ 跨平台线程封装 c++如何封装pthread和std--thread

终极指南：Jellyfin Android TV客户端与服务器版本兼容性完全解析

循环神经网络（RNN）深度解析：从数学原理到智能输入法实战

深度学习炼丹神器！PyTorch + TensorBoard 可视化完全指南，训练过程一目了然

2025届学术党必备的五大AI辅助论文网站推荐榜单