当前位置: 首页 > article >正文

AI应用测试:遇到类ChatGPT的流式接口要如何压测?

先说结论:

使用最普遍的JMeter 就能支持类 OpenAI 的流式接口(如 ChatGPT 的流式聊天接口)的测试

总体设置

  • JMeter 支持测试 OpenAI 的流式接口,但需要额外配置(如启用 KeepAlive 和调整超时)。
  • 如果需要实时处理流式响应,使用 Regular Expression Extractor 或自定义脚本(如 Groovy)进行处理。
  • 对于复杂的流式接口测试,建议结合 JMeter 和自定义脚本实现。

1. OpenAI 流式接口有什么特殊性?

OpenAI 的流式接口(streaming API)会以 Server-Sent Events (SSE)chunked transfer encoding 的形式返回数据。这意味着响应是分块的,而不是一次性返回完整的 JSON。

JMeter 默认不支持直接处理流式响应,但可以通过以下方法实现测试。


2. 使用 JMeter 测试流式接口的步骤

步骤 1:添加 HTTP 请求
  1. 在 JMeter 中添加一个 HTTP Request 组件。
  2. 配置 HTTP 请求:
    • Server Name or IP: 填写 OpenAI 的 API 地址(如 api.openai.com)。
    • Path: 填写 API 路径(如 /v1/chat/completions)。
    • Method: 选择 POST
    • Body Data: 填写请求体,例如:
      {"model": "gpt-4","messages": [{"role": "user", "content": "Hello!"}],"stream": true
      }
      
    • 设置 Header
      • Content-Type: application/json
      • Authorization: Bearer <your-api-key>
步骤 2:启用流式响应处理

默认情况下,JMeter 会等待完整的 HTTP 响应。为了处理流式响应,需要修改以下配置:

  1. 在 HTTP 请求中,勾选 Use KeepAlive
  2. HTTP Request 的高级选项中,设置:
    • Implementation: 选择 HttpClient4
    • Response Timeout: 设置为一个较大的值(如 60000 毫秒),以确保不会超时。
步骤 3:添加后置处理器

由于流式接口会分块返回数据,可以使用 Regular Expression ExtractorJSON Extractor 提取响应中的内容。

  1. 添加 Regular Expression Extractor

    • 正则表达式:根据流式响应的格式提取数据。例如,如果响应是 data: {...},可以使用:
      data: (\{.*?\})
      
    • 模板:$1$
    • 匹配编号:0(表示提取所有匹配项)。
  2. 如果需要处理 JSON 数据,可以添加 JSON Extractor

    • JSON Path 表达式:例如 $.choices[0].delta.content
步骤 4:添加监听器
  1. 添加 View Results Tree 监听器,查看请求和响应的详细信息。
  2. 添加 Summary ReportAggregate Report,查看性能测试结果。

总体来看,处理流式响应的挑战有这几点:
  • 分块响应:JMeter 默认会将所有分块合并为一个完整的响应。如果需要实时处理每个分块,可能需要自定义脚本。
  • 超时设置:流式接口可能会持续较长时间,需要适当调整超时设置。
  • 性能测试:流式接口的性能测试可能需要模拟长时间连接和高并发场景。

3. 替代方案:使用自定义脚本

如果 JMeter 的功能无法满足需求,可以考虑使用 JSR223 Sampler 编写自定义脚本(如 Groovy 或 Python)来处理流式响应。例如:

Groovy 脚本示例
import org.apache.http.client.methods.HttpPost
import org.apache.http.entity.StringEntity
import org.apache.http.impl.client.CloseableHttpClient
import org.apache.http.impl.client.HttpClients
import org.apac

相关文章:

AI应用测试:遇到类ChatGPT的流式接口要如何压测?

先说结论: 使用最普遍的JMeter 就能支持类 OpenAI 的流式接口(如 ChatGPT 的流式聊天接口)的测试 总体设置 JMeter 支持测试 OpenAI 的流式接口,但需要额外配置(如启用 KeepAlive 和调整超时)。如果需要实时处理流式响应,使用 Regular Expression Extractor 或自定义脚…...

Linux磁盘情况查询

一、查询系统整体磁盘使用情况 1、基本语法 df -h 2、示例 二、查询指定目录的磁盘占用情况 1、基本语法 du -h 查询指定目录的磁盘占用情况&#xff0c;默认为当前目录 2、常用选项 选项 说明 -h 以人类可读的格式显示磁盘使用情况&#xff08;例如&#xff0c;KB、…...

数据库原理3

1.在SQL中&#xff0c;外模式对应于试图(VIEW)和部分基本表;模式对应于基本表;内模式对应于存储文件。 2.FETCH&#xff1a;实施游标推进 3.数据操纵&#xff1a;insert,update,delete 数据控制&#xff1a;grant,revoke 数据定义&#xff1a;create,drop,alter 4.物理结构…...

【3D格式转换SDK】HOOPS Exchange技术概览(二):3D数据处理高级功能

​ 在当今数字化工程领域&#xff0c;HOOPS Exchange作为一款强大的SDK&#xff0c;为3D工程应用程序的开发提供了关键支持。本文将深入剖析其基本组件、特定功能以及数据结构&#xff0c;带您全面了解这一驱动3D数据处理的核心工具。 一、概述 HOOPS Exchange专注于访问和重…...

利用Adobe Acrobat 实现PPT中图片分辨率的提升

1. 下载适用于 Windows 的 64 位 Acrobat 注册方式参考&#xff1a;https://ca.whu.edu.cn/knowledge.html?type1 2. 将ppt中需要提高分辨率的图片复制粘贴到新建的pptx问价中&#xff0c;然后执行“文件—>导出---->创建PDF、XPS文档” 3. 我们会发现保存下来的distrib…...

Python frozenset介绍

在 Python 中&#xff0c;frozenset 是一种不可变&#xff08;immutable&#xff09;的集合类型&#xff0c;它是 set 的不可变版本。与普通的 set 类型不同&#xff0c;frozenset 的内容一旦创建就不能被修改&#xff0c;这使得它在某些场景下非常有用。 1. 特点 不可变性&am…...

docer swarm集群部署springboot项目

1.准备两台服务器&#xff0c;安装好docker、docker-compose 因为用到了docker仓库&#xff0c;安装harbor,可以从github下载离线安装包 2. 我这边用到了gitlab-ci,整体流程也都差不多 1&#xff09;打包mvn clean install 2&#xff09;打镜像 docker-compose -f docker-compo…...

Elasticsearch:解锁深度匹配,运用Elasticsearch DSL构建闪电般的高效模糊搜索体验

目录 Elasticsearch查询分类 叶子查询 全文检索查询 match查询 multi_match查询 精确查询 term查询 range查询 复杂查询 bool查询简单应用 bool查询实现排序和分页 bool查询实现高亮 场景分析 问题思考 解决方案 search_after方案(推荐) point in time方案 方案…...

解决局域网访问Dify却仅显示nginx页面的问题

为什么dify在本机可以正常访问&#xff0c;局域网通过ip访问却只看到欢迎使用nginx的提示&#xff0c;如果访问服务器ip/apps则直接提示404 Not Found。这是怎么回事该如何解决呢&#xff1f;文章中将一步步解决这些问题。 前言 之前在服务器部署了dify&#xff0c;也在服务器…...

deepseek思考,谁是下一个deepseek?

这两天连续看了两篇某B站up关于AI的分析&#xff0c;也是感触很多 讲得内容咱先不说&#xff0c;讲得是真好。怎么说呢&#xff0c;就“活该人家能赚到钱”就对了。 第一篇&#xff0c;他说了一个事儿&#xff0c;就是AI未来的趋势&#xff0c;1000天内&#xff0c;代替世界上…...

从小米汽车召回看智驾“命门”:智能化时代 — 时间就是安全

2025年1月&#xff0c;小米因车辆“授时同步异常”召回3万余辆小米SU7&#xff0c;成为其造车历程中的首个重大安全事件。 从小米SU7召回事件剖析&#xff0c;授时同步何以成为智能驾驶的命门&#xff1f; 2024年11月&#xff0c;多名车主反馈SU7标准版的智能泊车辅助功能出现…...

OpenAI 最后一代非推理模型:OpenAI 发布 GPT-4.5预览版

最后一代非推理大模型 在人工智能领域&#xff0c;OpenAI 一直以其创新的技术和卓越的产品引领着行业的发展。近期&#xff0c;OpenAI 正式发布了 GPT-4.5 研究预览版。不仅如此&#xff0c;官方还宣称 GPT-4.5 被定位为 “最后一代非推理模型”&#xff0c;这一消息再次引起了…...

React Native国际化实践(react-i18next)

React Native国际化实践 一、主流国际化方案选择 react-i18next react-native-localize react-i18next&#xff1a;功能强大的国际化框架&#xff0c;支持复数、插值、嵌套等复杂语法&#xff0c;且与React无缝集成。react-native-localize&#xff1a;用于获取设备语言和地区…...

ioday2----->标准io函数

思维导图&#xff1a; 练习&#xff1a; 1将当前的时间写入到time. txt的文件中&#xff0c;如果ctrlc退出之后&#xff0c;在再次执行支持断点续写 1.2022-04-26 19:10:20 2.2022-04-26 19:10:21 3.2022-04-26 19:10:22 //按下ctrlc停止&#xff0c;再次执行程序 4.2022…...

竞争只属于失败者

“竞争只属于失败者”这一观点源自知名投资人、PayPal联合创始人彼得蒂尔&#xff08;Peter Thiel&#xff09;。他在斯坦福大学的创业课程中提出&#xff0c;成功的企业应追求垄断地位&#xff0c;而非陷入激烈的市场竞争。蒂尔认为&#xff0c;垄断使企业能够专注于长期发展和…...

【代码分享】基于IRM和RRT*的无人机路径规划方法详解与Matlab实现

基于IRM和RRT*的无人机路径规划方法详解与Matlab实现 1. IRM与RRT*的概述及优势 IRM&#xff08;Influence Region Map&#xff09;通过建模障碍物的影响区域&#xff0c;量化环境中的安全风险&#xff0c;为RRT算法提供启发式引导。RRT&#xff08;Rapidly-exploring Random…...

深度学习代码解读——自用

代码来自&#xff1a;GitHub - ChuHan89/WSSS-Tissue 借助了一些人工智能 2_generate_PM.py 功能总结 该代码用于 生成弱监督语义分割&#xff08;WSSS&#xff09;所需的伪掩码&#xff08;Pseudo-Masks&#xff09;&#xff0c;是 Stage2 训练的前置步骤。其核心流程为&a…...

C++第六节:stack和queue

本节目标&#xff1a; stack的介绍与使用queue的介绍与使用priority_queue的介绍与使用容器适配器模拟实现与结语 1 stack&#xff08;堆&#xff09;的介绍 stack是一种容器适配器&#xff0c;专门用在具有后进先出操作的上下文环境中&#xff0c;只能从容器的一端进行元素的插…...

华宇“ITSS咨询服务标准助力政务服务区块链解决方案设计”案例成功入选ITSS典型应用案例库

近日&#xff0c;华宇“ITSS咨询服务标准助力政务服务区块链解决方案设计”案例经专家评审后成功入选由全国信息技术标准化技术委员会信息技术服务分技术委员会和中国电子工业标准化技术协会信息技术服务分会&#xff08;以下简称“ITSS分会”&#xff09;联合组织建立的“信息…...

从0到1构建AI深度学习视频分析系统--基于YOLO 目标检测的动作序列检查系统:(0)系统设计与工具链说明

文章大纲 系统简介Version 1Version2环境摄像机数据流websocket 发送图像帧RTSP 视频流树莓派windows消息队列参考文献项目地址提示词系统简介 Version 1 Version2 环境 # 配置 conda 源 # 配置conda安装源 conda config --add channels https://mirrors.tuna.tsinghua.edu.c…...

串口通讯基础

第1章 串口的发送和接收过程 1.1 串口接收过程 当上位机给串口发送(0x55)数据时&#xff0c;MCU的RX引脚接受到&#xff08;0x55&#xff09;数据&#xff0c;数据(0x55)首先进入移位寄存器。数据全部进入移位寄存器后&#xff0c;一次将&#xff08;0x55&#xff09;全部搬运…...

WebP2P技术在嵌入式设备中的应用:EasyRTC音视频通话SDK如何实现高效通信?

在数字化时代&#xff0c;实时通信技术&#xff08;RTC&#xff09;与人工智能&#xff08;AI&#xff09;的融合正在重塑各个行业的交互方式。从在线教育到远程医疗&#xff0c;从社交娱乐到企业协作&#xff0c;RTC的应用场景不断拓展。然而&#xff0c;传统的RTC解决方案往往…...

Windows 使用 Docker + WSL2 部署 Ollama(AMD 显卡推理)搭建手册‌

Windows 使用 Docker WSL2 部署 Ollama&#xff08;AMD 显卡推理&#xff09;搭建手册‌ ‌手册目标‌ 在 Windows 11 上通过 ‌Docker WSL2‌ 调用 AMD 显卡运行 Ollama 推理服务。 实现 ‌低延迟、高性能的本地模型推理‌&#xff0c;同时不影响 Windows 正常使用。 标记…...

视频提取硬字幕,字幕擦除,字幕翻译工具推荐

背景 最近有一些视频短剧资源&#xff0c;要提取视频中的硬字幕&#xff0c;并把中文字幕翻译成为英文&#xff0c;找了好些工具&#xff0c;都不是特别的理想。偶然间发现个平台&#xff0c; 灵犀AI&#xff0c;平台上介绍是主打视频硬字幕提取&#xff0c;擦除&#xff0c;多…...

table 拖拽移动

表格拖拽 Sortable.js中文网|配置 <!-- 教务处 --><template><div class"but"><el-button click"mergeAndPrintArrays()" type"primary">保存数据</el-button><el-button click"restoration()" t…...

软件工程---软件测试

软件测试是指在软件开发过程中&#xff0c;通过一系列的测试活动来评估和验证软件系统或应用程序的质量。它是一种用于发现和修复软件缺陷、错误和问题的过程&#xff0c;旨在确保软件能够满足其预期功能、性能和安全需求。 软件测试分类 软件测试可以按照多个维度进行分类&a…...

快速高效使用——阿里通义万相2.1的文生图、文生视频功能

前言&#xff1a;你仅需提供简单的几个提示词&#xff0c;即可快速高效帮你生成更为丰富的提示词并生成满意的图片或者视频。无论是为了创作艺术作品、设计商业宣传素材&#xff0c;还是满足个人兴趣爱好等&#xff0c;都能快速将脑海中的想法转化为逼真的图片或生动的视频。 目…...

量子算法:英译名、概念、历史、现状与展望?

李升伟 整理 #### 英译名 量子算法的英文为 **Quantum Algorithm**。 #### 概念 量子算法是利用量子力学原理&#xff08;如叠加态、纠缠态和干涉&#xff09;设计的算法&#xff0c;旨在通过量子计算机高效解决经典计算机难以处理的问题。其核心在于利用量子比特&#xff08…...

厦门大学第3弹:DeepSeek大模型及其企业应用实践(150页PPT,企业人员的大模型宝典)

本报告由厦门大学大数据教学团队制作&#xff0c;由林子雨副教授主讲&#xff0c;旨在为企业人员提供一份关于大模型技术及其应用的科普资料。从大模型的基本概念出发&#xff0c;详细介绍了其发展历程、分类方式以及与人工智能的关系&#xff0c;重点探讨了大模型在企业中的多…...

Qt显示一个hello world

一、显示思路 思路一&#xff1a;通过图形化方式&#xff0c;界面上创建出一个控件显示。 思路二&#xff1a;通过编写C代码在界面上创建控件显示。 二、思路一实现 点开 Froms 的 widget.ui&#xff0c;拖拽 label 控件&#xff0c;显示 hello world 即可。 qmake 基于 .…...