当前位置：首页 > news >正文

微调Qwen2大语言模型加入领域知识

news 2025/11/5 3:12:24

试用Qwen2做推理

参考：https://qwen.readthedocs.io/en/latest/getting_started/quickstart.html

from transformers import AutoModelForCausalLM, AutoTokenizer
device = "cuda" # the device to load the model onto# Now you do not need to add "trust_remote_code=True"
model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen2-7B-Instruct",torch_dtype="auto",device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen2-7B-Instruct")# Instead of using model.chat(), we directly use model.generate()
# But you need to use tokenizer.apply_chat_template() to format your inputs as shown below
prompt = "Give me a short introduction to large language model."
messages = [{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(messages,tokenize=False,add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(device)# Directly use generate() and tokenizer.decode() to get the output.
# Use `max_new_tokens` to control the maximum output length.
generated_ids = model.generate(model_inputs.input_ids,max_new_tokens=512
)
generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(response)

执行此操作后模型会缓存到如下目录
/root/.cache/huggingface/hub/models–Qwen–Qwen2-7B-Instruct/

安装LLaMA-Factory

参考：https://github.com/hiyouga/LLaMA-Factory

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

使用自有数据集微调Qwen2

参考：https://qwen.readthedocs.io/en/latest/training/SFT/llama_factory.html

启动web ui 界面来进行微调

llamafactory-cli webui

在这里插入图片描述

数据集选择提前准备好的自有数据集train_data.json
编辑LLaMA-Factory/data路径下的dataset_info.json，把自有数据集加入进去
在这里插入图片描述

按照自己需求配置训练参数，所有的参数都配置好之后，点一下“预览命令”，确认命令没有问题之后，就可以点击“开始”进行训练了。训练的过程中可以看到 loss的变化曲线、训练耗时等。

参考：https://blog.csdn.net/u012505617/article/details/137864437

验证微调效果

可以直接点击webui界面中的“chat”选项卡，然后点击“加载模型”，然后就可以进行对话了，不过使用A100实测非常慢，一次会话花了四十多分钟。

所以建议在webui 界面训练好模型之后点击“Export”选项卡，然后，在“模型路径”中输入原始模型路径，然后在“检查点路径”中选择自己微调得到的 checkpoint路径，然后在“最大分块大小（GB）”中设置为4，同时设置一下导出目录，最后点击“开始导出”，就可以看到输出的模型了

本地部署模型，并做推理测试
参考：https://qwen.readthedocs.io/en/latest/run_locally/llama.cpp.html

这里使用的是vLLM
参考：https://qwen.readthedocs.io/en/latest/deployment/vllm.html

from transformers import AutoTokenizer
from vllm import LLM, SamplingParams# Initialize the tokenizer
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen2-7B-Instruct")# Pass the default decoding hyperparameters of Qwen2-7B-Instruct
# max_tokens is for the maximum length for generation.
sampling_params = SamplingParams(temperature=0.1, top_p=0.1, repetition_penalty=1.05, max_tokens=512) #这里想要推理的结果跟我们微调的预期严格一致，所以调低了前两个参数的值。# Input the model name or path. Can be GPTQ or AWQ models.
llm = LLM(model="LLaMA-Factory/saves/Qwen2-7B-Chat/sft") #这里填写前面Export时填写的Path# Prepare your prompts
prompt = "这里输入与微调数据集中类似的问题来验证"
messages = [{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(messages,tokenize=False,add_generation_prompt=True
)# generate outputs
outputs = llm.generate([text], sampling_params)# Print the outputs.
for output in outputs:prompt = output.promptgenerated_text = output.outputs[0].textprint(f"Prompt: {prompt!r}, Generated text: {generated_text!r}")

微调Qwen2大语言模型加入领域知识

目录试用Qwen2做推理安装LLaMA-Factory使用自有数据集微调Qwen2验证微调效果试用Qwen2做推理参考：https://qwen.readthedocs.io/en/latest/getting_started/quickstart.html from transformers import AutoModelForCausalLM, AutoTokenizer device "cuda…...

编程日记 2024/7/13 20:56:01

【Linux】内核文件系统系统调用流程摸索

内核层可以看到当前调用文件处理的进程ID 这个数据结构是非常大的： 我们打印的pid,tgid就是从这里来的，然后只需要找到pid_t的数据类型就好了。下图这是运行的日志信息： 从上述日志，其实我也把write的系统调用加了入口的打印信…...

编程日记 2024/7/13 20:55:01

【HZHY-AI300G智能盒试用连载体验】文档资料

感谢电子发烧友和北京合众恒跃科技有限公司提供的的产品试用机会。 HZHY-AI300G工业级国产化智盒，采用RK3588工业级芯片组适应-40℃-85℃工业级宽温网关。以前测试过其他厂家的RK3568产品，对瑞芯微的工具也比较了解。在合众恒跃的网站上可以看到基本…...

编程日记 2024/7/13 20:50:56

Linux--深入理与解linux文件系统与日志文件分析

目录一、文件与存储系统的 inode 与 block 1.1 硬盘存储 1.2 文件存取--block 1.3 文件存取--inode 1.4 文件名与 inode 号编辑 1.5 查看 inode 号码方法 1.6 Linux 系统文件的三个主要的时间属性 1.7 硬盘分区结构 1.8 访问文件的简单了流程 1.9 inode 占用 1.…...

编程日记 2024/7/13 20:47:53

Postman 中的 API 安全性测试：最佳实践与技巧

在当今快速发展的数字化世界中，API（应用程序编程接口）已成为软件系统之间通信的桥梁。然而，随着API使用的增加，安全风险也随之上升。本文将详细介绍如何在 Postman 中进行 API 的安全性测试，帮助开发者和测…...

编程日记 2024/7/13 20:46:52

PTC可复位保险丝 vs 传统型保险丝：全面对比分析

PTC可复位保险丝，又称为自恢复保险丝、自恢复熔断器或PPTC保险丝，是一种电子保护器件。它利用材料的正温度系数效应，即电阻值随温度升高而显著增加的特性，来实现电路保护。当电路正常工作时，PTC保险丝呈现低阻态&…...

编程日记 2024/7/13 20:45:52

深入了解Rokid UXR2.0 SDK内置的Unity AR Glass开发组件

本文将了解到Rokid AR开发组件一、RKCameraRig组件1.脚本属性说明2.如何使用二、PointableUI组件1.脚本属性说明2.如何使用三、PointableUICurve组件1.脚本属性说明2.如何使用四、RKInput组件1.脚本属性说明2.如何使用五、RKHand组件1.脚本属性说明2.如何使用3.如何禁用手…...

编程日记 2024/7/13 20:44:51

Lottery 分布式抽奖（个人向记录总结）

1.搭建（DDDRPC）架构 DDD——微服务架构（微服务是对系统拆分的方式） （Domain-Driven Design 领域驱动设计） DDD与MVC同属微服务架构是由Eric Evans最先提出，目的是对软件所涉及到的领域进行建…...

编程日记 2024/7/13 20:42:49

我的AI音乐梦：ChatGPT帮我做专辑

🌈个人主页：前端青山 🔥系列专栏：AI篇 🔖人终将被年少不可得之物困其一生依旧青山,本期给大家带来ChatGPT帮我做音乐专辑嘿，朋友们！ 想象一下，如果有个超级聪明的机器人能帮你写…...

编程日记 2024/7/13 20:40:47

新手-前端生态

文章目录新手的前端生态一、概念的理解1、脚手架2、组件二、基础知识1、HTML2、css3、JavaScript 三、主流框架vue3框架四、工具（特定框架）1、uinapp 五、组件库（）1、uView如何在哪项目中导入uView 六、应用（各种应…...

编程日记 2024/7/13 20:39:46

C#中的类

声明类 public class MyClass{ } 注意类里面的属性可以输入prop之后再按Tab键然后再按Tab进行修改属性的名称等等 Random rnd new Random(); int arnd.Next(3); 范围是0-3的整数但是不包含3 Random rnd new Random(); int arnd.Next(2,3); 只包含2一个数 int?[]…...

编程日记 2024/7/13 20:37:44

探索数据库编程：基础与进阶之存储函数

引言❤️❤️ 数据库存储过程是一组为了执行特定功能的SQL语句集合，它被存储在数据库中，可以通过指定存储过程的名称并给出相应的参数来调用。使用存储过程可以提高数据库操作的效率，减少网络传输量，并且可以封装复杂的逻辑。编…...

编程日记 2024/7/13 20:31:38

Count数据转换为TPM数据方法整理-常规方法、DGEobj.utils和IOBR包

在正式分析之前，对于数据的处理是至关重要的，这种重要性是体现在很多方面，其中有一点是要求分析者采用正确的数据类型。对于芯片数据，原始数据进行log2处理之后可以进行很多常见的分析，比如差异分析、热图、箱线图、…...

编程日记 2024/7/13 20:29:36

简易限流实现

需求描述写一个1秒两个的限流工具类，2r/s 使用semaphore 代码实现-类似令牌桶算法 public class LimitHelper {private int maxLimit;private Semaphore semaphore;private int timeoutSeconds;public LimitHelper(int maxLimit, int timeoutSeconds) {this.max…...

编程日记 2024/7/13 20:28:35

用Qwt进行图表和数据可视化开发

目录 Qwt介绍示例应用场景典型QWT开发流程举一些Qwt的例子，多绘制几种类型的图像 1. 绘制折线图 (Line Plot) 2. 绘制散点图 (Scatter Plot) 3. 绘制柱状图 (Bar Plot) 4. 绘制直方图 (Histogram) Qwt介绍 QWT开发主要涉及使用QWT库进行图表和数据可视化…...

编程日记 2024/7/13 20:27:34

sqlalchemy使用with_entities返回指定数据列

sqlalchemy使用with_entities返回指定数据列在 SQLAlchemy 中，with_entities 方法用于指定查询语句返回的实体（Entity）或列（Column）。它允许你限制查询的返回结果，只包含你感兴趣的特定字段或实体使用方法假设有一个名为 User 的 SQLAlchemy 模型类，包含以下字段：…...

编程日记 2024/7/13 20:26:33

express

文章目录 🟢 Express⭐️ 1.初始Express✨安装✨使用Express 搭建一台服务器⭐️2.Express-基本路由✨1.使用字符串模式的路由路径示例：✨2.使用正则表达式的路由路径示例：✨3.中间件浅试(demo)⭐️3.Express-中间件✨1.应用级中间件✨2.路由级中间件✨3.错误处理中间件✨4…...

编程日记 2024/7/13 20:24:31

HTML网页大设计-家乡普宁德安里

代码地址: https://pan.quark.cn/s/57e48c3b3292...

编程日记 2024/7/13 20:23:25

深度学习：从数据采集到模型测试的全面指南

摘要随着人工智能和大数据技术的迅猛发展，深度学习已成为解决复杂问题的有力工具。然而，从项目启动到模型部署，包含了数据处理和模型研发的多个环节，每个环节的细致和严谨性直接决定了最终模型的性能和可靠性。本论文详细探讨了…...

编程日记 2024/7/13 20:20:22

Excel第29享：基于sum嵌套sumifs的多条件求和

1、需求描述如下图所示，现要统计12.17-12.23这一周各个人员的“上班工时（a1）”。下图为系统直接导出的工时数据明细样例。 2、解决思路首先，确定逻辑：“对多个条件（日期、人员）进行“工时”…...

编程日记 2024/7/13 20:18:20

Linux 文件类型，目录与路径，文件与目录管理

文件类型后面的字符表示文件类型标志普通文件：-（纯文本文件，二进制文件，数据格式文件） 如文本文件、图片、程序文件等。目录文件：d（directory） 用来存放其他文件或子目录。设备…...

编程新知 2025/11/1 0:21:42

（十）学生端搭建

本次旨在将之前的已完成的部分功能进行拼装到学生端，同时完善学生端的构建。本次工作主要包括： 1.学生端整体界面布局 2.模拟考场与部分个人画像流程的串联 3.整体学生端逻辑一、学生端在主界面可以选择自己的用户角色选择学生则进入学生登录界面…...

编程新知 2025/10/30 4:27:23

React第五十七节 Router中RouterProvider使用详解及注意事项

前言在 React Router v6.4 中，RouterProvider 是一个核心组件，用于提供基于数据路由（data routers）的新型路由方案。它替代了传统的 <BrowserRouter>，支持更强大的数据加载和操作功能（如 loader 和…...

编程新知 2025/10/31 15:31:54

【第二十一章 SDIO接口(SDIO)】

第二十一章 SDIO接口目录第二十一章 SDIO接口(SDIO) 1 SDIO 主要功能 2 SDIO 总线拓扑 3 SDIO 功能描述 3.1 SDIO 适配器 3.2 SDIOAHB 接口 4 卡功能描述 4.1 卡识别模式 4.2 卡复位 4.3 操作电压范围确认 4.4 卡识别过程 4.5 写数据块 4.6 读数据块 4.7 数据流…...

编程新知 2025/11/4 13:37:05

macOS多出来了：Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用

文章目录问题现象问题原因解决办法问题现象 macOS启动台（Launchpad）多出来了：Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用。问题原因很明显，都是Google家的办公全家桶。这些应用并不是通过独立安装的…...

编程新知 2025/9/24 19:23:45

LLM基础1_语言模型如何处理文本

基于GitHub项目：https://github.com/datawhalechina/llms-from-scratch-cn 工具介绍 tiktoken：OpenAI开发的专业"分词器" torch：Facebook开发的强力计算引擎，相当于超级计算器理解词嵌入：给词语画"…...

编程新知 2025/9/25 5:16:24

【Java_EE】Spring MVC

目录 Spring Web MVC 编辑注解 RestController RequestMapping RequestParam RequestParam RequestBody PathVariable RequestPart 参数传递注意事项编辑参数重命名 RequestParam 编辑编辑传递集合 RequestParam 传递JSON数据编辑RequestBody …...

编程新知 2025/11/3 19:15:05

【python异步多线程】异步多线程爬虫代码示例

claude生成的python多线程、异步代码示例，模拟20个网页的爬取，每个网页假设要0.5-2秒完成。代码 Python多线程爬虫教程核心概念多线程：允许程序同时执行多个任务，提高IO密集型任务（如网络请求）的效率…...

编程新知 2025/10/24 7:04:27

jmeter聚合报告中参数详解

sample、average、min、max、90%line、95%line,99%line、Error错误率、吞吐量Thoughput、KB/sec每秒传输的数据量 sample（样本数） 表示测试中发送的请求数量，即测试执行了多少次请求。单位，以个或者次数表示。示例：…...

编程新知 2025/9/22 12:41:30

[大语言模型]在个人电脑上部署ollama 并进行管理,最后配置AI程序开发助手.

ollama官网: 下载 https://ollama.com/ 安装查看可以使用的模型 https://ollama.com/search 例如 https://ollama.com/library/deepseek-r1/tags # deepseek-r1:7bollama pull deepseek-r1:7b改token数量为409622 16384 ollama命令说明 ollama serve #&#xff1a…...

编程新知 2025/11/3 2:44:08

目录

试用Qwen2做推理

安装LLaMA-Factory

使用自有数据集微调Qwen2

验证微调效果

相关文章：