当前位置：首页 > news >正文

通过LLM多轮对话生成单元测试用例

news 2025/10/14 14:33:20

通过LLM多轮对话生成单元测试用例

代码

在采用随机生成pytorch算子测试序列且保证算子参数合法这种方法之前,曾通过本文的方法生成算子组合测试用例。目前所测LLM生成的代码均会出现BUG,且多次交互后仍不能解决.也许随着LLM的更新,这个问题会得到解决.记录备用。

代码

import re
import os
import logging
import random
import numpy as np
import os
import re
import traceback
import subprocess
import tempfile
import copy
import requests
import jsonimport os
os.environ['MKL_THREADING_LAYER'] = 'GNU'
os.environ['MKL_SERVICE_FORCE_INTEL'] = '1'os.environ["QIANFAN_AK"] = ""
os.environ["QIANFAN_SK"] = ""
os.environ['DASHSCOPE_API_KEY'] = 'sk-'
os.environ['MOONSHOT_API_KEY']="sk-"
os.environ['SPARKAI_APP_ID'] = ''
os.environ['SPARKAI_API_SECRET'] = ''
os.environ['SPARKAI_API_KEY'] = ''
os.environ['SPARKAI_DOMAIN'] = 'generalv3.5'
os.environ['ZhipuAI_API_KEY'] = ''
os.environ['YI_API_KEY']=""logger = logging.getLogger('llm_logger')
logger.setLevel(logging.DEBUG)  # 设置日志级别# 创建一个handler，用于写入日志文件
log_file = 'llm_opt.log'
file_handler = logging.FileHandler(log_file)
file_handler.setLevel(logging.DEBUG)# 创建一个handler，用于将日志输出到控制台
console_handler = logging.StreamHandler()
console_handler.setLevel(logging.DEBUG)# 设置日志格式
formatter = logging.Formatter('%(message)s')
file_handler.setFormatter(formatter)
console_handler.setFormatter(formatter)# 将handlers添加到logger
logger.addHandler(file_handler)
logger.addHandler(console_handler)system_prompt="你是一位pytorch专家,现在需要编写各种测试程序,挖掘算子的潜在BUG"question =f'''
背景描述:
1.为了测试pytorch不同算子组合时的精度是否正常,需要构建module级别的测试用例
2.尤其需要关注unsqueeze,repeat,permute,transpose,reshape,expand,view等维度变换算子的各种组合
3.以及在这些组合之后添加其它io或计算类的算子如(contiguous,matmul,mul,concat等)需求:
1.你一次生成一个测试用例(pytorch module及测例),只包含cpu计算
2.之后,我会从的回复中提取出python代码,执行并将结果反馈给你
3.你根据我的反馈,预测性地生成下一个测试用例
4.我们通过多次交互,最大程度地挖掘出潜在的BUG约束:
1.所有测试用例的代码放在一个```python ```中,方便提取
2.为了防止shape不匹配,建议在forward中计算shape,并根据当前的shape合理地设置下一个算子的参数
3.你每次提供的代码都必须是完整的,不要添加任何注释
4.测试代码只输出成功、失败或抛异常,不需要输出任何多余信息
5.特别需要注意矩阵乘维度是否匹配如果你明白我的意思,请直接输出第一个测试用例
'''def extract_and_run_python_code(markdown_text):pattern = re.compile(r'```python\n([^```].*?)\n```', re.DOTALL)code_blocks = pattern.findall(markdown_text)if len(code_blocks)==0:return "没有找到Python代码块。"results = []for code in code_blocks:try:with tempfile.NamedTemporaryFile(delete=False, suffix=".py") as temp_file:temp_file.write(code.encode())temp_filename = temp_file.nameresult = subprocess.run(['python3', temp_filename], capture_output=True, text=True)    output=f"{result.stderr}{result.stdout}"results.append(output)except Exception as e:error_message = f"error:{traceback.format_exc()}"results.append(error_message)        finally:os.remove(temp_filename)return "".join(results)class LLMInfer(object):def __init__(self, system_prompt,question,history_len=5):self.system_prompt=system_promptself.question=question    self.history_len=history_len   def infer(self,user_input=None):pass    def reset(self):passclass dashscope_llm(LLMInfer):def __init__(self, system_prompt, question):super().__init__(system_prompt, question)import dashscopedashscope.api_key=os.environ['DASHSCOPE_API_KEY'] self.history=[]self.history.append({'role': 'system', 'content': self.system_prompt})self.history.append({'role': 'user', 'content': self.question})		def reset(self):if len(self.history)>self.history_len:self.history=self.history[:2] + self.history[-3:]def infer(self,user_input=None):from dashscope import Generationfrom http import HTTPStatus          if user_input:self.history.append({'role': 'user', 'content': user_input})response = Generation.call(model="qwen-plus", messages=self.history,result_format='message')if response.status_code == HTTPStatus.OK:role=response.output.choices[0]['message']['role']content=response.output.choices[0]['message']['content']self.history.append({'role': role,'content': content})return contentelse:return Noneclass moonshot_llm(LLMInfer):def __init__(self, system_prompt, question):super().__init__(system_prompt, question)'''pip install --upgrade 'openai>=1.0''''from openai import OpenAIself.client = OpenAI(api_key = os.environ['MOONSHOT_API_KEY'],base_url = "https://api.moonshot.cn/v1",)self.history=[]self.history.append({'role': 'system', 'content': self.system_prompt})self.history.append({'role': 'user', 'content': self.question})		def reset(self):if len(self.history)>self.history_len:self.history=self.history[:2] + self.history[-3:]def infer(self,user_input=None):      if user_input:self.history.append({'role': 'user', 'content': user_input})completion = self.client.chat.completions.create(model="moonshot-v1-128k",messages=self.history,temperature=0.3,top_p=0.1)role="assistant"content=completion.choices[0].message.contentself.history.append({'role': role,'content': content})return contentclass qianfan_llm(LLMInfer):def __init__(self, system_prompt, question):super().__init__(system_prompt, question)'''pip3 install qianfan'''self.history=[]#self.history.append({'role': 'system', 'content': self.system_prompt})self.history.append({'role': 'user', 'content': self.question})		def reset(self):if len(self.history)>self.history_len:self.history=self.history[:1] + self.history[-2:]def infer(self,user_input=None):    import qianfan  if user_input:self.history.append({'role': 'user', 'content': user_input})response = qianfan.ChatCompletion().do(endpoint="completions_pro", messages=self.history,temperature=0.7, top_p=0.8, penalty_score=1,                                             disable_search=False, enable_citation=False)role="assistant"content=response.body["result"]self.history.append({'role': role,'content': content})return contentclass sparkai_llm(LLMInfer):def __init__(self, system_prompt, question):super().__init__(system_prompt, question)'''pip3 install --upgrade spark_ai_python'''from sparkai.llm.llm import ChatSparkLLMfrom sparkai.core.messages import ChatMessageself.spark = ChatSparkLLM(spark_api_url='wss://spark-api.xf-yun.com/v3.5/chat',spark_app_id=os.environ['SPARKAI_APP_ID'],spark_api_key=os.environ['SPARKAI_API_KEY'],spark_api_secret=os.environ['SPARKAI_API_SECRET'],spark_llm_domain=os.environ['SPARKAI_DOMAIN'],streaming=False,        temperature=0.1)self.history=[]self.history.append(ChatMessage(role="system",content=self.system_prompt))self.history.append(ChatMessage(role="user",content=self.question))def reset(self):if len(self.history)>self.history_len:self.history=self.history[:2] + self.history[-3:]def infer(self,user_input=None):    from sparkai.core.messages import ChatMessagefrom sparkai.llm.llm import ChunkPrintHandlerif user_input:self.history.append(ChatMessage(role="user",content=user_input))        handler = ChunkPrintHandler()response = self.spark.generate([self.history], callbacks=[handler])self.history.append(response.generations[0][0].message)return response.generations[0][0].textclass zhipuai_llm(LLMInfer):def __init__(self, system_prompt, question):super().__init__(system_prompt, question)'''pip install zhipuai'''from zhipuai import ZhipuAIself.client = ZhipuAI(api_key=os.environ['ZhipuAI_API_KEY'])self.history=[]self.history.append({'role': 'system', 'content': self.system_prompt})self.history.append({'role': 'user', 'content': self.question})		def reset(self):if len(self.history)>self.history_len:self.history=self.history[:2] + self.history[-3:]def infer(self,user_input=None):      if user_input:self.history.append({'role': 'user', 'content': user_input})completion = self.client.chat.completions.create(model="glm-4",messages=self.history,temperature=0.3,top_p=0.1)role="assistant"content=completion.choices[0].message.contentself.history.append({'role': role,'content': content})return contentclass yi_llm(LLMInfer):def __init__(self, system_prompt, question):super().__init__(system_prompt, question)'''pip install --upgrade 'openai>=1.0''''from openai import OpenAIself.client = OpenAI(api_key = os.environ['YI_API_KEY'],base_url = "https://api.lingyiwanwu.com/v1",)self.history=[]self.history.append({'role': 'system', 'content': self.system_prompt})self.history.append({'role': 'user', 'content': self.question})		def reset(self):if len(self.history)>self.history_len:self.history=self.history[:2] + self.history[-3:]def infer(self,user_input=None):      if user_input:self.history.append({'role': 'user', 'content': user_input})completion = self.client.chat.completions.create(model="yi-large",messages=self.history,temperature=0.3,top_p=0.1)role="assistant"content=completion.choices[0].message.contentself.history.append({'role': role,'content': content})return contentllms=[dashscope_llm,moonshot_llm,qianfan_llm,sparkai_llm,zhipuai_llm,yi_llm]
for llm in llms:logger.info(f" ---------------------------------- {llm.__name__} ---------------------------------- ")llm=llm(system_prompt,question)response = llm.infer()for i in range(15):llm.reset()logger.info(f" ---------------------------------- 第{i}轮 ---------------------------------- ")result=Nonelogger.info("####### bot #######")logger.info(f"{response}")if response:result=f"{extract_and_run_python_code(response)}"     logger.info("####### user #######")logger.info(f"{result}")response=llm.infer(result)

通过LLM多轮对话生成单元测试用例

通过LLM多轮对话生成单元测试用例代码在采用随机生成pytorch算子测试序列且保证算子参数合法这种方法之前,曾通过本文的方法生成算子组合测试用例。目前所测LLM生成的代码均会出现BUG,且多次交互后仍不能解决.也许随着LLM的更新,这个问题会得到解决.记录备用。代码 impo…...

编程日记 2024/5/30 11:31:28

[Redis]String类型

基本命令 set命令将 string 类型的 value 设置到 key 中。如果 key 之前存在，则覆盖，无论原来的数据类型是什么。之前关于此 key 的 TTL 也全部失效。 set key value [expiration EX seconds|PX milliseconds] [NX|XX] 选项[EX|PX] EX seconds⸺使用…...

编程日记 2024/5/30 11:30:27

Ai速递5.29

全球AI新闻速递 1.摩尔线程与无问芯穹合作，实现国产 GPU 端到端 AI 大模型实训。 2.宝马工厂：机器狗上岗，可“嗅探”故障隐患。 3.ChatGPT：macOS 开始公测。 4.Stability AI：推出Stable Assistant，可用S…...

编程日记 2024/5/30 11:26:22

Android9.0 MTK平台如何增加一个系统应用

在安卓定制化开发过程中，难免遇到要把自己的app预置到系统中，作为系统应用使用，其实方法有很多，过程很简单，今天分享一下我是怎么做的，共总分两步： 第一步：要找到当前系统应用apk存…...

编程日记 2024/5/30 11:24:20

LabVIEW中实现Trio控制器的以太网通讯

在LabVIEW中实现与Trio控制器的以太网通讯，可以通过使用TCP/IP协议来完成。这种方法包括配置Trio控制器的网络设置、使用LabVIEW中的TCP/IP函数库进行数据传输和接收，以及处理通讯中的错误和数据解析。本文将详细说明实现步骤，包括配置、编程…...

编程日记 2024/5/30 11:23:18

C/C++运行时库与 UCRT 通用运行时库：全面总结与问题实例剖析

推荐一个AI网站，免费使用豆包AI模型，快去白嫖👉海鲸AI 1. 概述在开发C/C应用程序时，运行时库（Runtime Library）是不可或缺的一部分。它们提供了一系列函数和功能，使得开发者能够更方便地进行编…...

编程日记 2024/5/30 11:21:16

【Python001】python批量下载、插入与读取Oracle中图片数据（已更新）

1.熟悉、梳理、总结数据分析实战中的python、oracle研发知识体系 2.欢迎点赞、关注、批评、指正，互三走起来，小手动起来！文章目录 1.背景说明2.环境搭建2.1 参考链接2.2 `oracle`查询测试代码3.数据请求与插入3.1 `Oracle`建表语句3.2 `Python`代码实现3.3 效果示例4.问题链…...

编程日记 2024/5/30 11:19:12

流形学习（Manifold Learning）

基本概念 Manifold Learning（流形学习）是一种机器学习和数据分析的方法，它专注于从高维数据中发现低维的非线性结构。流形学习的基本假设是，尽管数据可能在高维空间中呈现，但它们实际上分布在一个低维的流形上。这个流…...

编程日记 2024/5/30 11:17:10

区块链技术和应用

文章目录前言一、区块链是什么？ 二、区块链核心数据结构 2.1 交易 2.2 区块三、交易 3.1 交易的生命周期 3.2 节点类型 3.3 分布式系统 3.4 节点数据库 3.5 智能合约 3.6 多个记账节点-去中心化 3.7 双花问题 3.8 共识算法 3.8.1 POW工作量证明总结前言学习长…...

编程日记 2024/5/30 11:12:01

Docker拉取镜像报错：x509: certificate has expired or is not yet v..

太久没有使用docker进行镜像拉取，今天使用docker-compose拉取mongo发现报错（如下图）： 报错信息翻译：证书已过期或尚未有效。解决办法： 1.一般都是证书问题或者系统时间问题导致，可以先执行 da…...

编程日记 2024/5/30 11:08:57

一、导入依赖库 pip install opencv-python pip install numpy pip install tensorflow pip install keras 二、模型建立 pip install opencv-python pip install numpy pip install tensorflow pip install kerasimport os import xml.etree.ElementTree as ETimpor…...

编程日记 2024/5/30 11:06:52

React Native 之 ToastAndroid（提示语）（二十一）

ToastAndroid 是 React Native 提供的一个特定于 Android 平台的 API，用于显示简单的消息提示（Toast）。两个方法： 1. ToastAndroid.show(message, duration, gravity) message: 要显示的文本消息。duration: Toast 的持续时间&…...

编程日记 2024/5/30 11:03:47

合约之间调用-如何实现函数静态调用？

合约之间的函数调用 EOA，external owned account，外部账号，例如metamask调用最终总是由EOA发起的合约之间的调用使得一次完整的调用成为一个调用链条合约间调用过程调用者须持有被调用合约的地址得到被调用合约的信息将地址重载为被调用合…...

编程日记 2024/5/30 11:02:45

【5.基础知识和程序编译及调试】

一、GCC概述：是GUN推出的多平台编译器，可将C/C源程序编译成可执行文件。编译流程分为以下四个步骤： 1、预处理 2、编译 3、汇编 4、链接注：编译器根据程序的扩展名来分辨编写源程序所用的语言。根据不同的后缀名对他们进行相…...

编程日记 2024/5/30 10:57:39

微信小程序（路由传参）

微信小程序的路由系统和其他Web应用类似，主要通过页面路径和URL参数进行页面导航和数据传递。下面详细介绍微信小程序路由的基本使用方法和相关技巧。 1. 基本页面导航 1.1 配置页面路径在微信小程序的 app.json 文件中，需要配置小程序的页面路径。这…...

编程日记 2024/5/30 10:56:38

电脑显示不出网络

你的电脑是否在开机后显示不出网络，或者有网络消失的现象？今天和大家分享我学到的一个办法，希望对大家有用。分析出现这类现象的原因：可能是电脑网卡松动了，电脑中存在静电流。解决办法：先将电脑关机&am…...

编程日记 2024/5/30 10:55:36

random模块一

random模块用于生成随机数。 random()返回[0,1)之间随机浮点数例子： import randomfor i in range(5):print(random.random()) 结果： 0.5026620465128847 0.9841750667006002 0.5515465602585887 0.42796563433917456 0.2627959451391586 see…...

编程日记 2024/5/30 10:54:34

Spring OAuth2：开发者的安全盾牌！(下)

上文我们教了大家如何像海盗一样寻找宝藏，一步步解锁令牌的奥秘，今天将把更加核心的技巧带给大家一起学习，共同进步！ 文章目录 6. 客户端凭证与密码模式6.1 客户端凭证模式应用适用于后端服务间通信 6.2 密码模式考量直接传递用户…...

编程日记 2024/5/30 10:53:32

kotlin基础之协程

Kotlin协程（Coroutines）是Kotlin提供的一种轻量级的线程模型，它允许我们以非阻塞的方式编写异步代码，而无需使用回调、线程或复杂的并发API。协程是一种用户态的轻量级线程，它可以在需要时挂起和恢复，从而有…...

编程日记 2024/5/30 10:49:29

法那科机器人M-900iA维修主要思路

发那科工业机器人是当今制造业中常用的自动化设备之一，而示教器是发那科机器人操作和维护的重要组成部分。一、FANUC机械手示教器故障分类 1. 硬件故障硬件故障通常是指发那科机器人M-900iA示教器本身的硬件问题，如屏幕损坏、按键失灵、电源故障等。 2…...

编程日记 2024/5/30 10:38:16

Zustand 状态管理库：极简而强大的解决方案

Zustand 是一个轻量级、快速和可扩展的状态管理库，特别适合 React 应用。它以简洁的 API 和高效的性能解决了 Redux 等状态管理方案中的繁琐问题。核心优势对比基本使用指南 1. 创建 Store // store.js import create from zustandconst useStore create((set)…...

编程新知 2025/10/14 12:38:24

线程同步：确保多线程程序的安全与高效！

全文目录： 开篇语前序前言第一部分：线程同步的概念与问题1.1 线程同步的概念1.2 线程同步的问题1.3 线程同步的解决方案第二部分：synchronized关键字的使用2.1 使用 synchronized修饰方法2.2 使用 synchronized修饰代码块第三部分&#xff…...

编程新知 2025/9/24 16:02:40

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility 1. 实验室环境1.1 实验室环境1.2 小测试 2. The Endor System2.1 部署应用2.2 检查现有策略 3. Cilium 策略实体3.1 创建 allow-all 网络策略3.2 在 Hubble CLI 中验证网络策略源3.3 …...

编程新知 2025/10/11 14:42:26

k8s业务程序联调工具-KtConnect

概述原理工具作用是建立了一个从本地到集群的单向VPN，根据VPN原理，打通两个内网必然需要借助一个公共中继节点，ktconnect工具巧妙的利用k8s原生的portforward能力，简化了建立连接的过程，apiserver间接起到了中继节…...

编程新知 2025/9/28 3:32:04

网络编程（UDP编程）

思维导图 UDP基础编程（单播） 1.流程图服务器：短信的接收方创建套接字 (socket)-----------------------------------------》有手机指定网络信息-----------------------------------------------》有号码绑定套接字 (bind)--------------…...

编程新知 2025/10/5 13:58:16

全志A40i android7.1 调试信息打印串口由uart0改为uart3

一，概述 1. 目的将调试信息打印串口由uart0改为uart3。 2. 版本信息 Uboot版本：2014.07； Kernel版本：Linux-3.10； 二，Uboot 1. sys_config.fex改动使能uart3(TX:PH00 RX:PH01)，并让boo…...

编程新知 2025/10/6 4:05:23

华硕a豆14 Air香氛版，美学与科技的馨香融合

在快节奏的现代生活中，我们渴望一个能激发创想、愉悦感官的工作与生活伙伴，它不仅是冰冷的科技工具，更能触动我们内心深处的细腻情感。正是在这样的期许下，华硕a豆14 Air香氛版翩然而至，它以一种前所未有的方式&#x…...

编程新知 2025/9/28 3:34:22

初探Service服务发现机制

1.Service简介 Service是将运行在一组Pod上的应用程序发布为网络服务的抽象方法。主要功能：服务发现和负载均衡。 Service类型的包括ClusterIP类型、NodePort类型、LoadBalancer类型、ExternalName类型 2.Endpoints简介 Endpoints是一种Kubernetes资源&#xf…...

编程新知 2025/9/28 3:35:13

七、数据库的完整性

七、数据库的完整性主要内容 7.1 数据库的完整性概述 7.2 实体完整性 7.3 参照完整性 7.4 用户定义的完整性 7.5 触发器 7.6 SQL Server中数据库完整性的实现 7.7 小结 7.1 数据库的完整性概述数据库完整性的含义正确性指数据的合法性有效性指数据是否属于所定…...

编程新知 2025/10/12 16:38:40

深入浅出深度学习基础：从感知机到全连接神经网络的核心原理与应用

文章目录前言一、感知机 (Perceptron)1.1 基础介绍1.1.1 感知机是什么？1.1.2 感知机的工作原理 1.2 感知机的简单应用：基本逻辑门1.2.1 逻辑与 (Logic AND)1.2.2 逻辑或 (Logic OR)1.2.3 逻辑与非 (Logic NAND) 1.3 感知机的实现1.3.1 简单实现 (基于阈…...

编程新知 2025/9/29 2:39:33

通过LLM多轮对话生成单元测试用例

通过LLM多轮对话生成单元测试用例

代码

相关文章：

通过LLM多轮对话生成单元测试用例

[Redis]String类型

Ai速递5.29

Android9.0 MTK平台如何增加一个系统应用

LabVIEW中实现Trio控制器的以太网通讯

C/C++运行时库与 UCRT 通用运行时库：全面总结与问题实例剖析

【Python001】python批量下载、插入与读取Oracle中图片数据（已更新）

流形学习（Manifold Learning）

区块链技术和应用

Docker拉取镜像报错：x509: certificate has expired or is not yet v..

猫狗分类识别模型建立②模型建立

React Native 之 ToastAndroid（提示语）（二十一）

合约之间调用-如何实现函数静态调用？

【5.基础知识和程序编译及调试】

微信小程序（路由传参）

电脑显示不出网络

random模块一

Spring OAuth2：开发者的安全盾牌！(下)

kotlin基础之协程

法那科机器人M-900iA维修主要思路

Zustand 状态管理库：极简而强大的解决方案

线程同步：确保多线程程序的安全与高效！

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility

k8s业务程序联调工具-KtConnect

网络编程（UDP编程）

全志A40i android7.1 调试信息打印串口由uart0改为uart3

华硕a豆14 Air香氛版，美学与科技的馨香融合

初探Service服务发现机制

七、数据库的完整性

深入浅出深度学习基础：从感知机到全连接神经网络的核心原理与应用