当前位置：首页 > news >正文

用DeepSeek-R1-Distill-data-110k蒸馏中文数据集微调Qwen2.5-7B-Instruct！

news 2026/2/10 12:38:01

下载模型与数据

模型下载：
huggingface：
Qwen/Qwen2.5-7B-Instruct · HF MirrorWe’re on a journey to advance and democratize artificial intelligence through open source and open science.https://hf-mirror.com/Qwen/Qwen2.5-7B-Instruct
魔搭：
魔搭社区汇聚各领域最先进的机器学习模型，提供模型探索体验、推理、训练、部署和应用的一站式服务。https://www.modelscope.cn/models/Qwen/Qwen2.5-7B-Instruct
数据下载：
https://huggingface.co/datasets/Congliu/Chinese-DeepSeek-R1-Distill-data-110khttps://huggingface.co/datasets/Congliu/Chinese-DeepSeek-R1-Distill-data-110k

安装swift

使用 pip 安装：

pip install ms-swift -U

从源安装：

# pip install git+https://github.com/modelscope/ms-swift.gitgit clone https://github.com/modelscope/ms-swift.git
cd ms-swift
pip install -e .

微调

CUDA_VISIBLE_DEVICES=0,1 \
swift sft \--model /home/models/pretrained_models/llm/Qwen2.5-7B-Instruct \ --train_type lora \--dataset  /home/data/Chinese-DeepSeek-R1-Distill-data-110k-SFT/new_distill_r1_110k_sft.json \--torch_dtype bfloat16 \--num_train_epochs 6 \--per_device_train_batch_size 1 \--per_device_eval_batch_size 1 \--learning_rate 1e-4 \--lora_rank 8 \--lora_alpha 32 \--target_modules all-linear \--gradient_accumulation_steps 16 \--eval_steps 50 \--save_steps 50 \--save_total_limit 5 \--logging_steps 5 \--output_dir output \--system 'You are a deep thinking assistant.' \--warmup_ratio 0.05 \--dataloader_num_workers 4 \--model_author Q \                                 --model_name Q-AILab-Qwen2.5-7B-Instruct-R1-Distill

训练过程

2张A800，训练时长5天，共训练6轮。

推理效果

推理：

CUDA_VISIBLE_DEVICES=0,1 \
swift infer \--adapters /home/model/swift/output/v6-20250217-075043/checkpoint-50 \--stream true \--temperature 0 \--max_new_tokens 8192

推理测试：

Qwen2.5-7B-Instruct-DeepSeek-R1-Distill-data-110K 训练完成！

后续合并Loar、断点训练、推送模型、可参考Swift github项目地址：

https://github.com/modelscope/ms-swifthttps://github.com/modelscope/ms-swift

用DeepSeek-R1-Distill-data-110k蒸馏中文数据集微调Qwen2.5-7B-Instruct！

下载模型与数据模型下载： huggingface： Qwen/Qwen2.5-7B-Instruct HF MirrorWe’re on a journey to advance and democratize artificial intelligence through open source and open science.https://hf-mirror.com/Qwen/Qwen2.5-7B-Instruct 魔搭&a…...

编程日记 2025/3/6 14:48:05

【C++设计模式】第四篇：建造者模式（Builder）

注意：复现代码时，确保 VS2022 使用 C17/20 标准以支持现代特性。分步骤构造复杂对象，实现灵活装配 1. 模式定义与用途核心目标：将复杂对象的构建过程分离，使得同样的构建步骤可以创建不同的表示形式。常见场景&am…...

编程日记 2025/3/6 14:43:59

【杂谈】信创电脑华为w515（统信系统）登录锁定及忘记密码处理

华为w515麒麟芯片版，还有非麒麟芯片版本，是一款信创电脑，一般安装的UOS系统。准备一个空U盘，先下载镜像文件及启动盘制作工具，连接如下： 百度网盘请输入提取码 http://livecd.uostools.com/img/apps/l…...

编程日记 2025/3/6 14:38:50

VBA信息获取与处理第五节:如何在单个工作表中查找某个给定值

《VBA信息获取与处理》教程(版权10178984)是我推出第六套教程，目前已经是第一版修订了。这套教程定位于最高级，是学完初级，中级后的教程。这部教程给大家讲解的内容有：跨应用程序信息获得、随机信息的利用、电子邮件的发送、VBA互…...

编程日记 2025/3/6 14:37:47

版本控制器Git和gdb

一.版本控制器Git 1.版本控制简单来讲可以对每一份代码版本进行复制保存，保证每一版代码都可查 2.仓库的本质也是一个文件夹 3.git既是一个客户端，也是一个服务器，是一个版本控制器。而gitee和GitHub都是基于git的网站或平台 4.git的基本…...

编程日记 2025/3/6 14:36:46

关于tresos Studio（EB）的MCAL配置之GPT

概念 GPT，全称General Purpose Timer，就是个通用定时器，取的名字奇怪了点。定时器是一定要的，要么提供给BSW去使用，要么提供给OS去使用。配置 General GptDeinitApi控制接口Gpt_DeInit是否启用 GptEnableDisable…...

编程日记 2025/3/6 14:32:40

大学至今的反思与总结

现在是2025年的3月5日，我大三下学期。自大学伊始，我便以考研作为自己的目标，有时还会做自己考研上岸头部985,211，offer如潮水般涌来的美梦。但是我却忽略了一点，即便我早早下定了决心去考研，但并没有早…...

编程日记 2025/3/6 14:30:37

我们来学nginx -- 优化下游响应速度

优化下游响应速度题记启用 Gzip 压缩优化缓冲区设置设置超时时间题记专家给出的配置文件真是…，信息量有点大啊！ nginx：我只想作为一个简单的代理专家爸爸：都是为了你好！ 这样，先从有关响应速度的角度&…...

编程日记 2025/3/6 14:29:35

国内外优秀AI外呼产品推荐

在数字化转型浪潮中，AI外呼系统凭借其高效率、低成本、精准交互的特点，成为企业客户触达与服务的核心工具。本文基于行业实践与技术测评，推荐国内外表现突出的AI外呼产品，重点解析国内标杆企业云蝠智能，并对比其他代表…...

编程日记 2025/3/6 14:28:34

观察者模式的C++实现示例

核心思想观察者模式是一种行为型设计模式，定义了对象之间的一对多依赖关系。当一个对象（称为Subject，主题）的状态发生改变时，所有依赖于它的对象（称为Observer，观察者）都会自动收到…...

编程日记 2025/3/6 14:24:28

爬虫（持续更新ing）

爬虫（持续更新ing） # 网络请求 # url统一资源定位符（如：https://www.baidu.com） # 请求过程：客户端的web浏览器向服务器发起请求 # 请求又分为四部分：请求网址，请求方法&#xff08…...

编程日记 2025/3/6 14:22:25

AD学习-最小系统板，双层

第一章简单电阻容模型的创建捕捉栅格在摆放器件时，一般设置成 10mil。移动器件时一般设置成100mil。比如绘制电容的原理图库，直接就是两根线条竖着成电容， 按Tab键进行颜色变更，按shift键拖动会复制一个出来。 …...

编程日记 2025/3/6 14:18:20

自动驾驶---不依赖地图的大模型轨迹预测

1 前言早期传统自动驾驶方案通常依赖高精地图（HD Map）提供道路结构、车道线、交通规则等信息，可参考博客《自动驾驶---方案从有图迈进无图》，本质上还是存在问题： 数据依赖性高：地图构建成本昂贵&#xf…...

编程日记 2025/3/6 14:17:18

【五.LangChain技术与应用】【8.LangChain提示词模板基础：从入门到精通】

早上八点，你端着咖啡打开IDE，老板刚甩来需求：“做个能自动生成产品描述的AI工具”。你自信满满地打开ChatGPT的API文档，结果半小时后对着满屏的"输出结果不稳定"、"格式总出错"抓耳挠腮——这时候你真需要好好认识下LangChain里的提示词模板了。一、…...

编程日记 2025/3/6 14:15:14

【AGI】智谱开源2025：一场AI技术民主化的革命正在到来

智谱开源2025：一场AI技术民主化的革命正在到来引言：开源，一场技术平权的革命一、CogView4：中文AI生成的里程碑1. 破解汉字生成的“AI魔咒”2. 开源协议与生态赋能二、AutoGLM：人机交互的范式跃迁1. 自然语言驱动的跨…...

编程日记 2025/3/6 14:14:13

Markdown HTML 图像语法

插入图片 Markdown ![图片描述](图片链接)一般来说，直接复制粘贴过来就行了，部分网页/应用可以拖拽，没人会真敲图片的链接吧…… 示例图片： ![Creeper?](https://i-blog.csdnimg.cn/direct/f5031c8c4f15421c9882d7eb23540b8…...

编程日记 2025/3/6 14:10:08

DeepSeek 角色设定与风格控制

🧑 博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编…...

编程日记 2025/3/6 14:09:06

国产化替换案例：CACTER邮件网关为Groupwise系统加固邮件安全防线

电子邮件作为企业信息流转的命脉，承载着商业机密与客户数据。然而，网络攻击手段日益复杂，钓鱼邮件等威胁正快速侵蚀企业安全防线。据《2024年第四季度企业邮箱安全性研究报告》显示，2024年Q4企业邮箱用户遭遇的钓鱼邮件数量激增至…...

编程日记 2025/3/6 14:08:05

Element UI-Select选择器结合树形控件终极版

Element UI Select选择器控件结合树形控件实现单选和多选，并且通过v-model的方式实现节点的双向绑定，封装成vue组件，文件名为electricity-meter-tree.vue，其代码如下： <template><div><el-select:valu…...

编程日记 2025/3/6 14:07:03

《底层逻辑》总结书摘

《底层逻辑》由张羽所著，聚焦于职场与个人发展，深入阐述了定位、结果、学习等十大底层逻辑，旨在帮助读者掌握思考和解决问题的有效方法，提升职场竞争力与个人成就。核心观点：思维和行动决定命运，格局与价值…...

编程日记 2025/3/6 14:03:58

eNSP-Cloud(实现本地电脑与eNSP内设备之间通信)

说明： 想象一下，你正在用eNSP搭建一个虚拟的网络世界，里面有虚拟的路由器、交换机、电脑（PC）等等。这些设备都在你的电脑里面“运行”，它们之间可以互相通信，就像一个封闭的小王国。但是&#…...

编程新知 2026/2/8 4:37:17

Linux 文件类型，目录与路径，文件与目录管理

文件类型后面的字符表示文件类型标志普通文件：-（纯文本文件，二进制文件，数据格式文件） 如文本文件、图片、程序文件等。目录文件：d（directory） 用来存放其他文件或子目录。设备…...

编程新知 2026/2/8 20:42:46

基于FPGA的PID算法学习———实现PID比例控制算法

基于FPGA的PID算法学习前言一、PID算法分析二、PID仿真分析1. PID代码2.PI代码3.P代码4.顶层5.测试文件6.仿真波形总结前言学习内容：参考网站： PID算法控制 PID即：Proportional（比例）、Integral（积分&…...

编程新知 2026/2/8 18:25:56

React Native 开发环境搭建（全平台详解）

React Native 开发环境搭建（全平台详解） 在开始使用 React Native 开发移动应用之前，正确设置开发环境是至关重要的一步。本文将为你提供一份全面的指南，涵盖 macOS 和 Windows 平台的配置步骤，如何在 Android 和 iOS…...

编程新知 2025/10/7 2:47:54

《Qt C++ 与 OpenCV：解锁视频播放程序设计的奥秘》

引言：探索视频播放程序设计之旅在当今数字化时代，多媒体应用已渗透到我们生活的方方面面，从日常的视频娱乐到专业的视频监控、视频会议系统，视频播放程序作为多媒体应用的核心组成部分，扮演着至关重要的角色。无论是在个人电脑、移动设备还是智能电视等平台上，用户都期望…...

编程新知 2026/2/7 13:17:38

【JVM】- 内存结构

引言 JVM：Java Virtual Machine 定义：Java虚拟机，Java二进制字节码的运行环境好处： 一次编写，到处运行自动内存管理，垃圾回收的功能数组下标越界检查（会抛异常，不会覆盖到其他代码…...

编程新知 2026/1/30 13:40:43

什么是库存周转？如何用进销存系统提高库存周转率？

你可能听说过这样一句话： “利润不是赚出来的，是管出来的。” 尤其是在制造业、批发零售、电商这类“货堆成山”的行业，很多企业看着销售不错，账上却没钱、利润也不见了，一翻库存才发现： 一堆卖不动的旧货…...

编程新知 2026/1/26 13:21:10

从零开始打造 OpenSTLinux 6.6 Yocto 系统（基于STM32CubeMX）（九）

设备树移植和uboot设备树修改的内容同步到kernel将设备树stm32mp157d-stm32mp157daa1-mx.dts复制到内核源码目录下源码修改及编译修改arch/arm/boot/dts/st/Makefile，新增设备树编译 stm32mp157f-ev1-m4-examples.dtb \stm32mp157d-stm32mp157daa1-mx.dtb修改…...

编程新知 2026/2/5 12:11:18