当前位置：首页 > news >正文

本地离线模型搭建指南-中文大语言模型底座选择依据

news 2026/5/12 21:58:51

搭建一个本地中文大语言模型（LLM）涉及多个关键步骤，从选择模型底座，到运行机器和框架，再到具体的架构实现和训练方式。以下是一个详细的指南，帮助你从零开始构建和运行一个中文大语言模型。

本地离线模型搭建指南将按照以下四个部分展开

中文大语言模型底座选择依据
本地运行显卡选择
RAG架构实现
LLaMA-Factory训练框架及工具

1 中文大语言模型底座选择依据

在选择中文大语言模型（LLM）的底座时，可以参考以下几个关键因素：

1.1 模型规模与参数

根据具体应用场景选择不同规模的模型。比如：

ChatGLM系列：包含6B参数的模型，适合中小规模应用，且支持商业用途。
LLaMA系列：提供7B、8B、13B、33B和70B等多种规模，部分版本可商用。
Baichuan系列：提供7B和13B参数的模型，适合需要较大规模的应用。
Qwen系列：提供7B、14B、72B和110B参数的模型，支持较长的上下文长度，适合复杂场景。
BLOOM：从1B到176B-MT，多种规模选择。
Aquila系列：包括7B和34B参数版本。
InternLM系列：从7B到20B参数，支持代码应用。
Mixtral、Yi、DeepSeek、XVERSE等：提供多种参数规模，适合不同应用需求。

在这里插入图片描述

常见底座模型细节概览：

底座	包含模型	模型参数大小	训练token数	训练最大长度	是否可商用
ChatGLM	ChatGLM/2/3 Base&Chat	6B	1T/1.4	2K/32K	可商用
LLaMA	LLaMA/2/3 Base&Chat	7B/8B/13B/33B/70B	1T/2T	2k/4k	部分可商用
Baichuan	Baichuan/2 Base&Chat	7B/13B	1.2T/1.4T	4k	可商用
Qwen	Qwen/1.5 Base&Chat	7B/14B/72B/110B	2.2T/3T	8k/32k	可商用
BLOOM	BLOOM	1B/7B/176B-MT	1.5T	2k	可商用
Aquila	Aquila/2 Base/Chat	7B/34B	-	2k	可商用
InternLM	InternLM/2 Base/Chat/Code	7B/20B	-	200k	可商用
Mixtral	Base&Chat	8x7B	-	32k	可商用
Yi	Base&Chat	6B/9B/34B	3T	200k	可商用
DeepSeek	Base&Chat	1.3B/7B/33B/67B	-	4k	可商用
XVERSE	Base&Chat	7B/13B/65B/A4.2B	2.6T/3.2T	8k/16k/256k	可商用

1.2 训练数据与Token数

不同模型经过不同规模的数据训练，影响其在特定任务上的表现：

ChatGLM：经过1到1.4T的中英文标识符训练，适合中文问答和对话。
LLaMA：经过1T到2T的训练。
Baichuan：训练数据在1.2T到1.4T之间。
Qwen：训练数据量高达2.2T到3T，支持复杂任务。
BLOOM：经过1.5T的训练。
XVERSE：训练数据量达2.6T到3.2T。

1.3 上下文长度支持

根据应用需求选择支持较长上下文长度的模型：

ChatGLM2-6B：上下文长度扩展到32K。
Qwen：支持8K到32K的上下文长度。
Mixtral、Yi、DeepSeek：支持200k到256k的上下文长度。

1.4 商业用途许可

确保所选模型允许商业用途：

ChatGLM、LLaMA、Baichuan、Qwen、BLOOM、Aquila、InternLM、Mixtral、Yi、DeepSeek、XVERSE等模型均允许商业用途。

1.5 垂直领域微调与应用

考虑模型在特定领域的微调效果：

医疗、法律、金融、教育、科技、电商、网络安全、农业等领域的垂直应用。

1.6 具体模型推荐

以下是一些具体的模型推荐及其特点：

ChatGLM系列：适合中文问答和对话，经过中英文双语训练，支持商业用途。
LLaMA系列：提供多种规模，部分版本适合商用。
Baichuan系列：适合需要较大规模训练的应用。
Qwen系列：支持复杂任务和长上下文长度。
InternLM系列：适合代码相关应用。

更多详细信息和具体模型的链接，请访问 Awesome-Chinese-LLM 项目。

下一篇介绍
本地离线模型搭建指南-本地运行显卡选择

本地离线模型搭建指南-中文大语言模型底座选择依据

搭建一个本地中文大语言模型（LLM）涉及多个关键步骤，从选择模型底座，到运行机器和框架，再到具体的架构实现和训练方式。以下是一个详细的指南，帮助你从零开始构建和运行一个中文大语言模型。本地离线模型搭…...

编程日记 2024/6/27 19:43:09

【代码随想录】【算法训练营】【第51天】 [115]不同的子序列 [583]两个字符串的删除操作 [72]编辑距离

前言思路及算法思维，指路代码随想录。题目来自 LeetCode。 day 51，周四，又是不能坚持的一天~ 题目详情 [115] 不同的子序列题目描述 115 不同的子序列解题思路前提： 思路： 重点： 代码实现 …...

编程日记 2024/6/27 19:42:09

24下半年软考集合！30s打破信息差！

01软考是什么？ 软考，全称为计算机技术与软件专业技术资格（水平）考试，也称为计算机资格考试，是由国家人力资源和社会保障部、工业和信息化部领导的国家级考试。它既是国家级资格证书，又是职称资…...

编程日记 2024/6/27 19:41:07

如何在Xcode中设置库路径

在Xcode中设置库路径的过程可以分为以下几个步骤，下面将结合参考文章中的信息，以清晰、分点表示和归纳的方式给出指导： 1. 确定库的类型和来源动态库（.dylib或.framework）或静态库（.a）&#…...

编程日记 2024/6/27 19:40:06

小程序的基本使用

【 0 】前言【 0 】这个就是js代码的存放地方 app.json // pages/banner/banner.js Page({/*** 页面的初始数据*/data: {},/*** 生命周期函数--监听页面加载*/onLoad(options) {},/*** 生命周期函数--监听页面初次渲染完成*/onReady() {},/*** 生命周期函数--监听页面显示…...

编程日记 2024/6/27 19:38:04

[保姆级教程]uniapp设置字体引入字体格式

文章目录在 UniApp 中设置和引入自定义字体（如 .ttf、.woff、.woff2 等格式）通常涉及几个步骤。准备字体文件： 首先，你需要有字体文件。这些文件通常以 .ttf、.woff 或 .woff2 格式提供。确保有权使用这些字体，并遵守…...

编程日记 2024/6/27 19:37:02

【Webpack】前端工程化之Webpack与模块化开发

目录前言模块化开发Stage1 - 文件划分方式Stage2 - 命名空间方式Stage3 - IIFE（立即调用函数表达式）Stage 4 - IIFE 依赖参数模块化的标准规范使用Webpack实现模块化打包安装WebpackWebpack基本配置Webpack构建流程Webpack热更新Webpack打包优化前言…...

编程日记 2024/6/27 19:36:01

【Android】记录在自己的AMD处理器无法使用Android studio 虚拟机处理过程

文章目录问题：无法在AMD平台打开Android studio 虚拟机，已解决平台：AMD 5700g系统：win10专业版1、在 amd平台上使用安卓虚拟机需要安装硬件加速器2、关闭win10上的系统服务问题：无法在AMD平台打开Android studio 虚拟…...

编程日记 2024/6/27 19:33:59

LearnOpenGL - Android OpenGL ES 3.0 使用 FBO 进行离屏渲染

系列文章目录 LearnOpenGL 笔记 - 入门 01 OpenGLLearnOpenGL 笔记 - 入门 02 创建窗口LearnOpenGL 笔记 - 入门 03 你好，窗口LearnOpenGL 笔记 - 入门 04 你好，三角形OpenGL - 如何理解 VAO 与 VBO 之间的关系LearnOpenGL - Android OpenGL ES 3.0 绘制…...

编程日记 2024/6/27 19:31:56

人工智能虚拟仿真系统，解决算法难、编程难、应用场景难三大难题

近年来，人工智能技术迅猛发展，广泛渗透至各行业，市场份额持续扩大，预示着智能化转型的广阔前景。该行业本质上属于知识高度密集型，近年来的迅猛发展进一步加剧了对专业人才的迫切需求。然而，我国目前在人工…...

编程日记 2024/6/27 19:29:54

CTE（公共表表达式）和视图在查询时的性能影响

在SQL查询优化和数据库设计中，CTE（公共表表达式）和视图都是常用的工具。尽管它们在功能和使用场景上有很多相似之处，但在查询性能方面可能存在显著差异。本文将探讨CTE和视图在查询时的性能影响，帮助您在实际项目中做出…...

编程日记 2024/6/27 19:28:53

新能源行业必会基础知识-----电力市场概论笔记-----绪论

新能源行业知识体系-------主目录-----持续更新(进不去说明我没写完)：https://blog.csdn.net/grd_java/article/details/139946830 目录 1. 电力市场的定义2. 对传统电力系统理论的挑战 1. 电力市场的定义 1. 我国电力市场的进程我国新一轮电力体制改革的5大亮点&…...

编程日记 2024/6/27 19:27:52

003 SpringBoot操作ElasticSearch7.x

文章目录 5.SpringBoot集成ElasticSearch7.x1.添加依赖2.yml配置3.创建文档对象4.继承ElasticsearchRepository5.注入ElasticsearchRestTemplate 6.SpringBoot操作ElasticSearch1.ElasticsearchRestTemplate索引操作2.ElasticsearchRepository文档操作3.ElasticsearchRestTempl…...

编程日记 2024/6/27 19:26:51

npm install报错Maximum call stack size exceeded

npm 报错方案： npm cache clean --force npm install...

编程日记 2024/6/27 19:25:50

第1章基础知识

第1章基础知识 1.1 机器语言机器语言就是机器指令的集合，机器指令展开来讲就是一台机器可以正确执行的命令 1.2 汇编语言的产生汇编语言的主题是汇编指令。汇编指令和机器指令的差别在于指令的表示方法上，汇编指令是机器指令便于记忆的书写格式。…...

编程日记 2024/6/27 19:24:49

python脚本限制外部访问 linux服务器端口

注意：该脚本会清空linux防火墙的filter表的规则和用户自定义链路脚本的效果是将端口限制为仅服务器内部访问可以提供ip地址白名单具体脚本： #!/usr/bin/python3 import argparse, subprocess, sys, redef popen(cmd):global resulttry:result su…...

编程日记 2024/6/27 19:23:48

Redis-哨兵模式-主机宕机-推选新主机的过程

文章目录 1、为哨兵模式准备配置文件2、启动哨兵3、主机6379宕机3.4、查看sentinel控制台日志3.5、查看6380主从信息 4、复活63794.1、再次查看sentinel控制台日志 1、为哨兵模式准备配置文件 [rootlocalhost redis]# ll 总用量 244 drwxr-xr-x. 2 root root 150 12月 6 2…...

编程日记 2024/6/27 19:22:47

游戏工厂：AI（AIGC/ChatGPT）与流程式游戏开发

游戏工厂：AI（AIGC/ChatGPT）与流程式游戏开发码客卢益贵 ygluu 关键词：AI（AIGC、ChatGPT、文心一言）、流程式管理、好莱坞电影流程、电影工厂、游戏工厂、游戏开发流程、游戏架构、模块化开发一、前言…...

编程日记 2024/6/27 19:21:45

每日一练 - OSPF 组播地址

01 真题题目判断以下陈述是否正确： 224.0.0.6 是 ALL DRouters 监听地址 224.0.0.5 是 ALL SPFRouters 监听地址 A.正确 B.错误 02 真题答案 A 03 答案解析在OSPF (Open Shortest Path First) 路由协议中，为了实现高效的信息交换和发现邻居&#x…...

编程日记 2024/6/27 19:20:43

AMHS工程师的培养

一、岗位职责主要包括： 1. 负责生产现场设备运行维护及异常处理，确保设备安全操作与保养。 2. 制定并实施AMHS计划和措施，对过程问题进行追踪解决。 3. 监控生产过程中的不良品率，确保生产过程的稳定性。 4. 建立AMHS标准作业程序文件，并定期更新和维护。 5. 负责AMHS…...

编程日记 2024/6/27 19:18:41

开发AI智能体时利用Taotoken统一调度多模型提升任务完成率

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度开发AI智能体时利用Taotoken统一调度多模型提升任务完成率在构建需要处理复杂、多模态任务的AI智能体时，单一模型的能…...

编程新知 2026/5/12 20:59:37

教培机构管理越忙越乱？用对工具，比多雇两个人更高效

不少培训机构校长都有同样的感受：明明团队很拼，每天从早忙到晚，可机构依旧问题不断。招生线索散落在微信、表格、登记本里，跟进不及时就白白流失；排课全靠人工核对，老师冲突、教室撞期、调课通知不到位是常…...

编程新知 2026/5/12 20:52:44

重塑Cherry MX键帽个性化生态：从开源3D模型到无限定制可能

重塑Cherry MX键帽个性化生态：从开源3D模型到无限定制可能【免费下载链接】cherry-mx-keycaps 3D models of Chery MX keycaps 项目地址: https://gitcode.com/gh_mirrors/ch/cherry-mx-keycaps 传统机械键盘键帽市场长期被少数厂商垄断，个性化选…...

编程新知 2026/5/12 20:33:03

回归分析：机器学习预测建模的基石与工业实践

1. 项目概述：为什么回归分析是机器学习的“定海神针” 如果你刚接触机器学习，可能会被各种炫酷的算法名字搞得眼花缭乱——神经网络、支持向量机、随机森林……但在所有这些“明星”算法背后，有一个基础得不能再基础，却又重要得不…...

编程新知 2026/5/12 19:37:04

如何快速配置ComfyUI ControlNet预处理器：完整安装与使用指南

如何快速配置ComfyUI ControlNet预处理器：完整安装与使用指南【免费下载链接】comfyui_controlnet_aux ComfyUIs ControlNet Auxiliary Preprocessors 项目地址: https://gitcode.com/gh_mirrors/co/comfyui_controlnet_aux ComfyUI ControlNet Aux预处理器…...

编程新知 2026/5/12 19:32:47

面试官追问LDA与PCA区别？用这张对比图+3个核心公式轻松讲明白

LDA与PCA本质区别：3个核心公式实战对比解析当面试官要求你解释LDA和PCA的区别时，他们真正想考察的是什么？不是简单的概念复述，而是对两种降维技术底层逻辑的深刻理解。本文将用几何直觉、数学本质和代码实例，带你穿透…...

编程新知 2026/5/12 17:01:44

Claude API代理网关：开源项目newaiproxy/claude-api架构解析与部署实战

1. 项目概述：一个连接Claude的API代理网关如果你正在尝试将Claude的对话能力集成到自己的应用里，或者想绕过官方Web界面的一些限制，那么你很可能已经听说过或者正在寻找一个可靠的API代理方案。newaiproxy/claude-api这个项目，本质…...

编程新知 2026/5/12 16:38:23

3分钟掌握跨平台鼠标连点器：免费开源自动化工具快速上手指南

3分钟掌握跨平台鼠标连点器：免费开源自动化工具快速上手指南【免费下载链接】MouseClick 🖱️ MouseClick 🖱️ 是一款功能强大的鼠标连点器和管理工具，采用 QT Widget 开发 ，具备跨平台兼容性。软件界面美观 &#…...

编程新知 2026/5/12 14:44:01

机箱机柜模块化设计方法

在机箱机柜制造领域，模块化设计正逐渐成为提升生产效率、降低成本、增强产品灵活性的关键方法。今天，我们就来深入探讨机箱机柜模块化设计方法，同时为大家推荐深圳市机汇五金制品有限公司（以下简称“机汇五金”）&#…...

编程新知 2026/5/12 14:09:45

3分钟解决Windows 11 LTSC应用生态缺失：微软商店一键恢复终极指南

3分钟解决Windows 11 LTSC应用生态缺失：微软商店一键恢复终极指南【免费下载链接】LTSC-Add-MicrosoftStore Add Windows Store to Windows 11 24H2 LTSC 项目地址: https://gitcode.com/gh_mirrors/ltscad/LTSC-Add-MicrosoftStore 你是否正在使用Windows …...

编程新知 2026/5/12 9:42:28