基于deepseek和开放题库,构建专业大模型微调在线答题系统
为什么要进行大模型微调
大模型微调是将预训练模型适配到特定任务或领域的关键技术,正常情况下大模型通过海量通用数据训练获得广泛知识,但其参数和表征空间面向通用场景,难以直接适配垂直领域或复杂任务。例如在通用医疗问答模型在具体病症诊断任务中可能缺乏细粒度知识。针对这种情况,微调可调整模型参数,使其更贴合特定领域的数据分布。在法律咨询场景中,将法律文本适配到预训练模型,能显著提升合同条款解析的准确率。
大模型微调是连接通用能力与垂直应用的桥梁,其核心价值在于将预训练模型的“通才”转化为“专才,通过技术选型(如LoRA、部分参数、全参)实现最优投入产出比以及快速适配需求变化,支撑持续迭代,随着AI的持续发展以及对于垂直应用场景需求的提升,大模型微调将逐渐成为大模型应用的核心环节。
大模型微调的应用场景
1. 垂直领域知识适配

场景:
微调后模型可理解医学术语(如ICD-10编码)和诊断逻辑,用于电子病历分析。基于PubMed文献微调的BioBERT,在疾病分类任务中准确率提升12%。

场景:
适配合同条款解析、风险预警等场景,如微调模型识别SEC文件中的潜在违规行为。
2. 任务深度优化

通过数学题集微调,增强模型逻辑推理能力。

风格调整,如新闻稿的正式语气,自动转为社交媒体文案的轻松风格。
3. 数据安全合规

使用本地化数据微调模型,避免内部敏感信息外泄,如银行客户数据训练风险评估模型。

调整模型输出以满足GDPR等数据保护要求,例如自动过滤隐私信息。
大模型微调的方式和资源需求
目前博云BMP支持全参数微调、LoRA和部分参数微调三种微调模式,可以根据客户的不同场景来满足大模型微调的需求。

全参微调是指对预训练模型的所有参数进行更新,使其适配下游任务的一种微调方法。与参数冻结或部分微调(如LoRA)不同,全参微调通过调整模型所有权重来捕捉任务特定模式,通常需要较大的计算资源和数据量。
LoRA是一种针对大模型的高效微调技术,其核心思想是通过低秩矩阵分解,在冻结原始预训练模型参数的基础上,引入少量可训练参数,从而在降低计算和存储成本的同时保持模型性能。
部分参数训练是一种分层选择性训练的模型适配方法,通过冻结预训练模型的部分参数(通常为底层或中间层),仅微调顶层或特定任务相关层的参数。其核心思想是利用预训练模型的通用表征能力,减少冗余参数更新,同时降低计算资源消耗。
不同微调模式的不同维度对比表:

大模型微调流程
01数据集准备
对于平台而言,微调所用的数据集需要满足如下格式:
{
"instruction": "使用XXX框架实现XX功能,要求为XX",
"input": "",
"output": "对应代码"
}
这样模型在微调的过程中就可以进行识别,博云会提供对应数据转换服务,把客户提供的数据集转为以上要求的JSON文件。
例如:我们根据在线教育客户提供的一个题库,将题库转为以上格式的JSON文件:

JSON文件创建好以后,保存到本地,上传到BMP里面的数据集,如下图所示:

02微调操作流程
进入BMP界面,选择大模型微调

点击创建微调任务来创建微调任务,选择需要微调的大模型,根据微调的模型配置对应的算力资源


算力资源匹配完成以后,就可以进入微调面板进行微调


根据微调需求选择对应的阶段、微调方式,根据以上要求准备好相应的数据集即可。
03微调参数配置建议
LoRA微调核心参数
秩(lora_rank):建议 8-64,简单任务选择小秩(如8),复杂任务需≥16以保留表达能力12。
Alpha(lora_alpha):通常设为秩的整数倍(如秩8时alpha=16),控制权重更新强度,值越大对新任务适应能力越强1。
Dropout(lora_dropout):小数据场景设为 0.3 防过拟合,大数据场景可设为 01。
通用参数
学习率:建议 1e-5 到 5e-4,比全参数微调更低,避免破坏预训练知识2。
批处理大小:显存不足时可用梯度累积(如batch_size=2 + 梯度累积步数8),等效batch_size=161。
适用场景
资源有限、需快速迭代的任务(如对话生成),支持多任务共享基础模块。
全参数微调关键参数
学习率:推荐 1e-6 到 5e-5(比LoRA更低),大型模型(如百亿参数)优先小学习率。
训练轮次:大数据集(百万级样本)建议 5-10 轮,小数据集需早停防止过拟合。
显存需求:至少需A100(80GB)级别GPU,支持大batch_size(如32)。
优化策略
混合精度训练:启用 bf16 或 fp16 加速训练,同时降低显存占用。
适用场景
数据充足、任务复杂(如领域迁移),需全面调整模型参数。
部分参数微调核心参数
冻结层数:通常冻结底层(如前20层),仅微调顶层全连接层,保留通用语义特征。
学习率:可略高于全参数微调(如 5e-5),因高层参数需快速适应任务。
训练轮次:推荐 3-5 轮,小数据集也能快速收敛。
关于博云AIOS
AIOS是博云专为AI应用推出的企业级一站式人工智能操作系统,屏蔽底层异构算力差异,面向AI大模型、生信、仿真渲染、气象、智能控制、图像视频处理等领域的分布式计算提供调度器管理,在网络、存储等基础能力方面增强高性能适配,为AI应用提供稳定、高效、可观测的部署与服务运行时管理能力。
同时AIOS提供轻量化多框架AI训推工具链平台,支持多种分布式AI深度学习框架,模型推理框架,IDE工具,算法、模型仓库,以及模型量化和转化能力,覆盖数据标注、算法开发、模型训练、模型推理的全生命周期。
AIOS可以帮助企业和开发者自主构建人工智能业务,助力企业保持行业领先能力。
相关文章:
基于deepseek和开放题库,构建专业大模型微调在线答题系统
为什么要进行大模型微调 大模型微调是将预训练模型适配到特定任务或领域的关键技术,正常情况下大模型通过海量通用数据训练获得广泛知识,但其参数和表征空间面向通用场景,难以直接适配垂直领域或复杂任务。例如在通用医疗问答模型在具体病症诊…...
ios 小组件和数据共享
创建主工程就不必讲了 1 创建小组件 创建子工程 [new Target ] 选择 [ Widger Extension] 小组件入口是WidgetBundle文件,可以进行多个小组件的调试 TestWidget2文件是主要操作,小组件使用swiftUI布局,使用 AppIntent进行事件处理ÿ…...
LVTTL(Low Voltage Transistor-Transistor Logic)电平详解
一、LVTTL电平的定义与核心特性 LVTTL(低压晶体管-晶体管逻辑)是传统TTL(5V)的低电压版本,工作电压通常为3.3V,旨在降低功耗并适配现代低电压集成电路,同时保持与TTL的逻辑兼容性。其核心特点如…...
element tree树形结构默认展开全部
背景: el-tree树形结构,默认展开全部,使用属性default-expand-all【是否默认展开所有节点】;默认展开一级,设置default-expanded-keys【默认展开的节点的 key 的数组】属性值为数组。 因为我这里的数据第一级是四川【省…...
统计登录系统10秒内连续登录失败超过3次的用户
为防止暴力破解用户账号的行为,在输入账号和密码时一般都会限制用户尝试密码输出错误的次数,如果用户多次输错密码后,将在一段时间内锁定账号,常见的有银行类APP、个税App等应用,如下是用户账号密码输入错误的提示图&a…...
音视频软件工程师面试题
一、基础知识 编解码相关 H.264 和 H.265(HEVC)的主要区别是什么?视频编解码的基本流程是什么?关键技术有哪些?音频编解码(如 AAC、MP3、Opus)的区别和应用场景?什么是 B 帧、P 帧、I 帧?它们的作用是什么? 流媒体协议RTMP、HTTP-FLV、HLS、WebRTC 的区别和应用场景…...
架构师面试(十四):注册中心设计
问题 大家或多或少都接触过【注册中心】,对注册中心的基本功能,如:服务注册、服务发现、健康检查和变更通知 ,肯定是耳熟能详的;那么大家对注册中心的架构设计是否了解呢? 如果让你负责设计一个分布式的注…...
ctf-web: php原生类利用 -- GHCTF Popppppp
源代码 <?php error_reporting(0); class CherryBlossom { public $fruit1; public $fruit2; public function __construct($a) {$this->fruit1 $a; } function __destruct() { echo $this->fruit1; } public function __toString() { $newFunc …...
「Unity3D」UGUI将元素固定在,距离屏幕边缘的某个比例,以及保持元素自身比例
在不同分辨率的屏幕下,UI元素按照自身像素大小,会发生位置与比例的变化,本文仅利用锚点(Anchors)使用,来实现UI元素,固定在某个比例距离的屏幕边缘。 首先,将元素的锚点设置为中心&…...
nextjs15简要介绍以及配置eslint和prettier
目录 一、Next.js 何时使用服务器端渲染(SSR)?何时使用静态生成(SSG)? 1、服务器端渲染(SSR - getServerSideProps) 2、 静态生成(SSG - getStaticProps) …...
存储过程和自定义函数在银行信贷业务中的应用(oracle)
数据校验和清洗 例如,检查客户的年龄是否在合理范围内,贷款金额是否符合规定的上下限等。 对于不符合规则的数据,可以进行清洗和修正。比如,将空值替换为默认值,或者对错误的数据进行纠正。 CREATE OR REPLACE PROC…...
基于Ollama平台部署的Qwen大模型实现聊天机器人
文章目录 基于Ollama平台部署的Qwen大模型实现聊天机器人1 概述2 技术栈2.1 开发技术2.2 环境 3 技术架构4 实现步骤4.1 环境搭建4.1.1 WSL配置及Ubuntu安装4.1.2 Ollama安装及模型部署 4.2 模块安装4.2.1 安装Streamlit 1.42.24.2.2 安装requests 2.32.34.2.3 安装ollama 0.4.…...
在 JDK 1.8 的 ConcurrentHashMap 中,为什么存在两种插入方式?
在 JDK 1.8 的 ConcurrentHashMap 中,之所以对“容器为空”和“计算位置为空”采取不同的处理方式,主要是因为 并发场景下的性能优化和并发安全保证。我们可以分开来看这两种情况: 1. 容器为空时,使用 volatile CAS 初始化 原因…...
如何让powershell的界面变成全屏显示?
刚打开powershell,原来的样子: 全屏:可以按一下键盘上的alt enter 键,效果:...
语音识别踩坑记录
本来想在原来的语音识别的基础上增加本地扩展本地词典, 采用的语音识别是Vosk识别器,模型是 vosk-model-small-cn-0.22 // 初始化Vosk识别器 if (recognizer null) {using (Model model new Model(modelPath)){string grammar "{""…...
图片查看器:用PyQt5实现本地图片预览工具
通过python代码,基于PyQt5实现本地图片预览查看工具。 我们对窗口进行了圆角设计,图片的翻页按钮半透明处理,当鼠标移动至按钮上的动画效果,当选择某一张图片,进行左右翻页则轮播同目录所有支持的图片格式。 import …...
Deepin通过二进制方式升级部署高版本 Docker
一、背景: 在Deepin系统中通过二进制方式升级部署高版本 Docker,下面将详细介绍二进制方式升级部署高版本 Docker 的具体步骤。 二、操作步骤 1.根据需求下载二进制文件,下载地址如下: https://mirrors.tuna.tsinghua.e…...
车架号VIN查询 API 接口用JAVA如何调用?
以下是车架号VIN查询 API 接口用JAVA如何调用的示例代码: package com.shuxun.data.impl.demo;import com.shuxun.common.core.util.HttpUtil; import org.apache.commons.codec.digest.DigestUtils;import java.util.HashMap; import java.util.Map;public class …...
Vulnhub 靶机 VulnOSv2 write up opendocman cms 32075 sql注入 账号密码 ssh连接 37292.c 脏牛提权
Vulnhub 靶机 VulnOSv2 write up opendocman cms 32075 sql注入 账号密码 ssh连接 37292.c 脏牛提权 一、信息收集 1、首先拿到靶场先扫一下ip arp-scan -l 3、 2、指纹扫描 nmap -sS -sV 192.168.66.178nmap -p- -sV -A 192.168.66.253 PORT STATE SERVICE VERSION 22…...
爬虫的精准识别:基于 User-Agent 的正则实现
🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,精通Java编…...
Linux应用开发之网络套接字编程(实例篇)
服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …...
Linux链表操作全解析
Linux C语言链表深度解析与实战技巧 一、链表基础概念与内核链表优势1.1 为什么使用链表?1.2 Linux 内核链表与用户态链表的区别 二、内核链表结构与宏解析常用宏/函数 三、内核链表的优点四、用户态链表示例五、双向循环链表在内核中的实现优势5.1 插入效率5.2 安全…...
IGP(Interior Gateway Protocol,内部网关协议)
IGP(Interior Gateway Protocol,内部网关协议) 是一种用于在一个自治系统(AS)内部传递路由信息的路由协议,主要用于在一个组织或机构的内部网络中决定数据包的最佳路径。与用于自治系统之间通信的 EGP&…...
对WWDC 2025 Keynote 内容的预测
借助我们以往对苹果公司发展路径的深入研究经验,以及大语言模型的分析能力,我们系统梳理了多年来苹果 WWDC 主题演讲的规律。在 WWDC 2025 即将揭幕之际,我们让 ChatGPT 对今年的 Keynote 内容进行了一个初步预测,聊作存档。等到明…...
页面渲染流程与性能优化
页面渲染流程与性能优化详解(完整版) 一、现代浏览器渲染流程(详细说明) 1. 构建DOM树 浏览器接收到HTML文档后,会逐步解析并构建DOM(Document Object Model)树。具体过程如下: (…...
第25节 Node.js 断言测试
Node.js的assert模块主要用于编写程序的单元测试时使用,通过断言可以提早发现和排查出错误。 稳定性: 5 - 锁定 这个模块可用于应用的单元测试,通过 require(assert) 可以使用这个模块。 assert.fail(actual, expected, message, operator) 使用参数…...
python爬虫:Newspaper3k 的详细使用(好用的新闻网站文章抓取和解析的Python库)
更多内容请见: 爬虫和逆向教程-专栏介绍和目录 文章目录 一、Newspaper3k 概述1.1 Newspaper3k 介绍1.2 主要功能1.3 典型应用场景1.4 安装二、基本用法2.2 提取单篇文章的内容2.2 处理多篇文档三、高级选项3.1 自定义配置3.2 分析文章情感四、实战案例4.1 构建新闻摘要聚合器…...
mysql已经安装,但是通过rpm -q 没有找mysql相关的已安装包
文章目录 现象:mysql已经安装,但是通过rpm -q 没有找mysql相关的已安装包遇到 rpm 命令找不到已经安装的 MySQL 包时,可能是因为以下几个原因:1.MySQL 不是通过 RPM 包安装的2.RPM 数据库损坏3.使用了不同的包名或路径4.使用其他包…...
论文笔记——相干体技术在裂缝预测中的应用研究
目录 相关地震知识补充地震数据的认识地震几何属性 相干体算法定义基本原理第一代相干体技术:基于互相关的相干体技术(Correlation)第二代相干体技术:基于相似的相干体技术(Semblance)基于多道相似的相干体…...
mac 安装homebrew (nvm 及git)
mac 安装nvm 及git 万恶之源 mac 安装这些东西离不开Xcode。及homebrew 一、先说安装git步骤 通用: 方法一:使用 Homebrew 安装 Git(推荐) 步骤如下:打开终端(Terminal.app) 1.安装 Homebrew…...

