uniapp 小程序如何实现大模型流式交互?前端SSE技术完整实现解析
文章目录
- 一、背景概述
- 二、核心流程图解
- 三、代码模块详解
- 1. UTF-8解码器(处理二进制流)
- 2. 请求控制器(核心通信模块)
- 3. 流式请求处理器(分块接收)
- 4. 数据解析器(处理SSE格式)
- 5. 回调处理三剑客
- 四、关键问题解决方案
- 1. 乱码问题处理
- 2. 数据截断问题
- 3. 性能优化建议
- 五、扩展思考
- 1. 为什么要用SSE而不是WebSocket?
- 2. 流量控制策略
- 六、完整技术栈推荐
一、背景概述
在大模型应用中,流式响应技术(Server-Sent Events, SSE)能显著提升用户体验。本文将以代码为核心,讲解基于uni-app框架的流式交互完整实现方案,涵盖数据接收、解码、解析全流程。
二、核心流程图解
三、代码模块详解
1. UTF-8解码器(处理二进制流)
decodeUTF8(data) {// 将二进制数据转为Uint8数组const uint8Array = new Uint8Array(data);// 传统方式转换字符串(兼容旧环境)let string = '';for (let i = 0; i < uint8Array.length; i++) {string += String.fromCharCode(uint8Array[i]);}// 双重解码处理特殊字符(如中文)return decodeURIComponent(escape(string));
}
关键点说明:
Uint8Array:将原始二进制数据转为可操作数组escape():将字符串转义为ASCII字符decodeURIComponent:解析URI编码内容(等效于UTF-8解码)
2. 请求控制器(核心通信模块)
getContent() {const sendContent = {"messages": [{"role": "user","content": this.content,}],"section_id": this.id,"token": this.token}// 显示等待状态this.waitingForResponse = true;// 发起流式请求this.streamPost('/api/xxx/xxx', sendContent, this.onDataReceived, this.onError, this.onComplete);
}
参数解析:
| 参数名 | 类型 | 说明 |
|---|---|---|
| role | String | 角色标识(user/assistant) |
| content | String | 用户输入的提问内容 |
| section_id | Number | 会话分区ID |
| token | String | 用户身份验证令牌 |
3. 流式请求处理器(分块接收)
streamPost(url, data, onData, onError = null, onComplete = null) {const requestTask = uni.request({url: this.$baseUrl + url,method: 'POST',header: {'Accept': 'text/event-stream', // 声明接受事件流'token': uni.getStorageSync('token')},data,enableChunked: true, // 启用分块传输模式responseType: 'arraybuffer', // 接收二进制数据// 分块数据到达时触发success: (res) => { /*...*/ },// 注册分块接收监听器onChunkReceived: (res) => {const decodedData = this.decode(res.data);if (decodedData) {onData(decodedData); // 触发数据回调}}});
}
技术要点:
enableChunked: true:启用微信小程序分块接收能力responseType: 'arraybuffer':确保正确处理二进制流onChunkReceived:微信小程序特有分块事件监听
4. 数据解析器(处理SSE格式)
decode(data) {const text = this.decodeUTF8(data);const lines = text.split('\n');let result = '';for (let line of lines) {if (line.startsWith('data: ')) {const jsonData = line.slice(6).trim();// 结束标识处理if (jsonData === '[DONE]') return result;// 清理控制字符(防止JSON解析失败)const cleanedData = jsonData.replace(/[\u0000-\u001F\u007F-\u009F]/g, '');try {const parsedData = JSON.parse(cleanedData);// 提取AI生成内容result += parsedData.choices[0].delta.content || '';} catch (e) {console.error('解析失败:', e);}}}return result;
}
数据示例:
// 原始SSE数据格式
data: {"id":"chatcmpl-123","choices":[{"delta":{"content":"你好"}}]}// 解析后结果
"你好"
5. 回调处理三剑客
// 实时数据渲染
onDataReceived(data) {if (data.trim()) {this.displayText += data; // 增量更新显示内容this.resultCount = this.displayText.length; // 统计字数}
}// 异常处理
onError(error) {console.error('请求异常:', error);uni.showToast({ title: '服务响应异常', icon: 'none' });
}// 完成处理
onComplete() {this.waitingForResponse = false;console.log('会话结束');// 可添加历史记录存储等逻辑
}
四、关键问题解决方案
1. 乱码问题处理
- 现象:接收到
å“啊类乱码 - 解决方案:
- 检查
decodeUTF8是否被正确调用 - 验证服务端编码是否为UTF-8
- 替换解码方案为
new TextDecoder().decode(uint8Array)
- 检查
2. 数据截断问题
- 现象:JSON解析报错
Unexpected end of JSON input - 处理策略:
// 增加数据清洗步骤 const cleanedData = jsonData.replace(/\n/g, '') // 移除换行符.replace(/\u2028/g, '') // 处理行分隔符.replace(/\u2029/g, ''); // 处理段落分隔符
3. 性能优化建议
// 使用文档片段批量更新
let fragment = '';
onDataReceived(data) {fragment += data;if (fragment.length > 100) { // 每100字符更新一次this.displayText += fragment;fragment = '';}
}
五、扩展思考
1. 为什么要用SSE而不是WebSocket?
- SSE优势:
- 基于HTTP协议,无需额外握手
- 自动重连机制
- 更简单的服务端实现
2. 流量控制策略
// 节流处理(每500ms更新一次)
let updateTimer = null;
onDataReceived(data) {this.buffer += data;if (!updateTimer) {updateTimer = setTimeout(() => {this.displayText += this.buffer;this.buffer = '';updateTimer = null;}, 500);}
}
六、完整技术栈推荐
| 层级 | 技术选型 |
|---|---|
| 前端框架 | Vue3 + uni-app |
| 状态管理 | Pinia |
| HTTP库 | uni.request |
| 数据格式 | JSON + SSE |
| 部署环境 | 微信小程序 + Web |
通过以上实现方案,开发者可以构建出高可用的大模型流式交互系统。建议在实际项目中加入加载状态提示、错误重试机制和历史会话管理等功能模块,以提升完整用户体验。
相关文章:
uniapp 小程序如何实现大模型流式交互?前端SSE技术完整实现解析
文章目录 一、背景概述二、核心流程图解三、代码模块详解1. UTF-8解码器(处理二进制流)2. 请求控制器(核心通信模块)3. 流式请求处理器(分块接收)4. 数据解析器(处理SSE格式)5. 回调…...
因子分析详解:从理论到MATLAB实战
内容摘要: 本文系统解析因子分析的核心原理与MATLAB实战,涵盖数学模型、载荷矩阵估计、因子旋转及得分计算。通过上市公司盈利能力、消费者偏好等案例,演示数据标准化、因子提取与解释的全流程,并提供完整代码实现。深入对比因子分…...
【组态PLC】基于三菱西门子S7-200PLC和组态王液料混合系统组态设计【含PLC组态源码 M016期】
控制要求 总体控制要求:如面板图所示,本装置为三种液体混合模拟装置,由液面传感器SL1、SL2、SL3,液体A、B、C阀门与混合液阀门由电磁阀YV1、YV2、YV3、YV4,搅匀电机M,加热器H,温度传感器T组成。…...
js:根据后端返回的数组取出每一个数组的keyword字段然后拼接成一个逗号分隔的字符串
问: 现在有一个el-select, 后端接口返回数据为keyword:xxx,referenceNum:1,tagId:132sf32fasdfaf组成的数组, 现在select是多选, 但是但我选择多个下拉框选项后,后端需要前端返回的数据tagIds字段需要时一个字符串…...
基于大模型的肺纤维化预测及临床方案研究报告
目录 一、引言 1.1 研究背景与意义 1.2 研究目的与方法 二、大模型技术概述 2.1 大模型的基本原理 2.2 大模型在医疗领域的应用现状 三、肺纤维化相关知识 3.1 肺纤维化的病因与发病机制 3.2 肺纤维化的临床症状与诊断方法 3.3 肺纤维化的治疗现状与挑战 四、大模型…...
7. 【.NET 8 实战--孢子记账--从单体到微服务--转向微服务】--微服务基础工具与技术--Ocelot 网关--路由
路由是API网关的核心功能,对系统性能和可靠性至关重要。路由通过定义规则,将客户端请求准确地转发到相应的后端服务,确保请求能够正确处理,简化了微服务架构中的服务调用逻辑。有效的路由配置能够提高系统的灵活性和可维护性。 一…...
【GESP】C++二级模拟 luogu-b3995, [GESP 二级模拟] 小洛的田字矩阵
GESP二级模拟题,多层循环、分支语句练习,难度★✮☆☆☆。 题目题解详见:https://www.coderli.com/gesp-2-luogu-b3995/ 【GESP】C二级模拟 luogu-b3995, [GESP 二级模拟] 小洛的田字矩阵 | OneCoderGESP二级模拟题,多层循环、分…...
监督学习——基于线性回归的波士顿房价预测:理论、实践与评估
基于线性回归的波士顿房价预测:理论、实践与评估 文章目录 基于线性回归的波士顿房价预测:理论、实践与评估一、引言二、线性回归基础理论2.1 线性回归原理2.2 线性回归在房价预测中的应用逻辑三、波士顿房价数据集介绍3.1 数据集概述3.2 特征说明3.3 目标变量四、波士顿房价…...
Selenium 调用模型接口实现功能测试
要使用 Selenium 调用模型接口实现功能测试,可按以下步骤进行: 1. 环境准备 安装 Selenium:使用 pip install selenium 安装 Selenium 库。安装浏览器驱动:根据使用的浏览器(如 Chrome、Firefox 等)下载对应的驱动,并将其添加到系统的环境变量中。例如,Chrome 浏览器需…...
回调函数的用法
回调函数的基本用法 回调函数是一种被作为参数传递给另一个函数的函数,接收回调函数作为参数的函数在合适的时候会调用这个回调函数。回调函数为代码提供了更高的灵活性和可扩展性,下面为你详细介绍回调函数的基本用法。 基本概念 回调函数的核心在于函…...
springboot实现文件上传到华为云的obs
一、前言 有时在项目中需要使用一些存储系统来存储文件,那么当项目要接入obs作为存储系统时,就会利用obs来进行文件的上传下载,具体实现如下。 二、如何通过obs实现文件的上传下载? 1.添加相关的obs的maven依赖。 <dependency…...
南京布局产业园剖析:成都树莓集团的战略逻辑
在数字产业飞速发展的当下,成都树莓集团在南京布局产业园,这一举措蕴含着深刻的战略考量,是基于对市场环境、产业趋势以及自身发展需求的综合研判。 一、政策利好与发展机遇 南京作为长三角地区的重要城市,在数字经济发展方面享有…...
C++ QT 6.6.1 QCustomPlot的导入及使用注意事项和示例 | 关于高版本QT使用QCustomPlot报错问题解决的办法
C QT 6.6.1 QCustomPlot的导入及使用注意事项和示例 | 关于高版本QT使用QCustomPlot报错问题解决的办法 记录一下 qmake .pro文件的配置 QT core gui printsupportgreaterThan(QT_MAJOR_VERSION, 4): QT widgetsCONFIG c17# You can make your code fail to compil…...
【算法】哈希表详解
【算法】哈希表详解 1. 哈希表的基本概念2. 哈希表的优缺点3. 哈希表的实现方法4. 哈希表的应用场景5. 哈希表的性能优化6. 哈希表 vs 其他数据结构7. 总结 哈希表(Hash Table) 是一种高效的数据结构,用于存储键值对(Key-Value Pa…...
【红队利器】单文件一键结束火绒6.0
关于我们 4SecNet 团队专注于网络安全攻防研究,目前团队成员分布在国内多家顶级安全厂商的核心部门,包括安全研究领域、攻防实验室等,汇聚了行业内的顶尖技术力量。团队在病毒木马逆向分析、APT 追踪、破解技术、漏洞分析、红队工具开发等多个…...
Docker小游戏 | 使用Docker部署star-battle太空飞船射击小游戏
Docker小游戏 | 使用Docker部署star-battle太空飞船射击小游戏 前言项目介绍项目简介项目预览二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署star-battle网页小游戏下载镜像创建容器检查容器状态检查服务端口安全设置四、访问star-battle网页小游戏五、总…...
【EB-06】SystemCreator dbc转arxml
SystemCreator dbc转arxml 1. SystemCreator 意义2. SystemCreator使用方法2.1 实现步骤2.2 参考官方文档方法1. SystemCreator 意义 EB Tresos 对dbc直接导入的支持不是很完善,dbc也不是AUTOSAR标准的数据库文件,EB建议所有通信矩阵通过ARXML交互比较合理(AUTOSAR定义的)…...
(0)阿里云大模型ACP-考试回忆
这两天通过了阿里云大模型ACP考试,由于之前在网上没有找到真题,导致第一次考试没有过,后面又重新学习了一遍文档才顺利通过考试,这两次考试内容感觉考试题目90%内容是覆盖的,后面准备分享一下每一章的考题,…...
按键精灵鹰眼中控:ios多设备管理工具
在当今数字化时代,高效管理多设备已成为许多企业和个人的迫切需求。无论是游戏多开、自动化测试,还是电商运营,如何同时操作多台设备并确保精准执行,一直是一个难题。现在,按键精灵的鹰眼群控功能为您提供了完美的解决…...
__对于初学者的CCS 汉化
IDE:Code Composer Studio 20.0.2 CCS安装后默认是英文,目前最新的20版其Help工具栏是没有安装软件包的选项。不过,想要汉化还有更简单的方法 安装插件 在左边找到扩展,然后在框内搜索Chinese,可以找到两个语言插件&am…...
OFA-VE部署教程:WSL2环境下Windows平台OFA-VE完整安装指南
OFA-VE部署教程:WSL2环境下Windows平台OFA-VE完整安装指南 1. 为什么要在WSL2上部署OFA-VE? 你是不是也遇到过这样的问题:想在Windows上跑一个需要CUDA加速的多模态AI系统,但又不想折腾双系统,也不愿忍受虚拟机的性能…...
Qwen2.5-VL-7B-Instruct多场景落地:博物馆文物图像→历史背景+保护建议
Qwen2.5-VL-7B-Instruct多场景落地:博物馆文物图像→历史背景保护建议 1. 引言:当AI遇见文物 想象一下,当你站在博物馆的青铜器展柜前,看着那些精美的纹饰,是否曾好奇它们背后的故事?或者面对一件脆弱的古…...
Go语言中的反射与接口:从原理到实践
Go语言中的反射与接口:从原理到实践 1. 反射与接口的重要性 反射和接口是Go语言中两个强大的特性,它们使得Go语言具有高度的灵活性和可扩展性。反射允许程序在运行时检查和操作类型,而接口则提供了一种抽象机制,使得不同类型可以…...
TrackingNet在线评估全流程指南:从注册到结果查看(附常见问题解决)
TrackingNet在线评估全流程指南:从注册到结果查看(附常见问题解决) 在计算机视觉领域,目标跟踪算法的性能评估是研究过程中不可或缺的一环。TrackingNet作为业内广泛使用的基准测试平台,为研究人员提供了标准化的评估环…...
G-Helper:告别华硕笔记本卡顿耗电的轻量级控制神器
G-Helper:告别华硕笔记本卡顿耗电的轻量级控制神器 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Strix, Scar,…...
算法的时间和空间复杂度
1算法效率主要取决于时间和空间,一般从时间和空间衡量一个算法的好坏2时间复杂度算法的时间复杂度是一个函数,算法基本的执行次数,为算法的时间复杂度。对于时间复杂度的计算,我们采用大O的渐进表示法。大O渐进表示法1用常数1取代…...
i.MX6ULL 裸机 ECSPI 驱动开发详解:
在嵌入式裸机开发中,SPI(串行外设接口)是最常用的高速同步串行总线之一,广泛用于连接 Flash、加速度传感器、ADC、OLED 屏等外设。i.MX6ULL 作为 Cortex-A7 内核的工业级 MPU,内置了 4 路增强型可配置 SPI 外设&#x…...
Dhall性能优化与部署指南:构建高效配置管理系统的终极方案
Dhall性能优化与部署指南:构建高效配置管理系统的终极方案 【免费下载链接】dhall-lang Maintainable configuration files 项目地址: https://gitcode.com/gh_mirrors/dh/dhall-lang Dhall是一个强大的配置语言,旨在提供可维护的配置文件解决方案…...
实战分享:我把Qwen2.5-7B-Instruct变成专属文本分类器,LlamaFactory LoRA微调+推理加速全记录
从零构建Qwen2.5-7B文本分类引擎:LlamaFactory LoRA微调与vLLM推理加速实战 去年接手一个政务文本分类项目时,传统BERT模型在长文本场景下的表现让我屡次陷入调参困境。直到尝试用Qwen2.5-7B-Instruct配合LlamaFactory进行LoRA微调,才发现大语…...
如何将微信聊天记录变为个人数字资产:WeChatMsg完全指南
如何将微信聊天记录变为个人数字资产:WeChatMsg完全指南 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trending/we/WeC…...
