当前位置：首页 > news >正文

LLM - 第2版 ChatGLM2-6B (General Language Model) 的工程配置

news 2026/2/8 20:10:23

欢迎关注我的CSDN：https://spike.blog.csdn.net/
本文地址：https://blog.csdn.net/caroline_wendy/article/details/131445696

ChatGLM2-6B

ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上，ChatGLM2-6B 引入了如下新特性：

更强大的性能：基于 ChatGLM 初代模型的开发经验，我们全面升级了 ChatGLM2-6B 的基座模型。ChatGLM2-6B 使用了 GLM的混合目标函数，经过了 1.4T 中英标识符的预训练与人类偏好对齐训练，评测结果显示，相比于初代模型，ChatGLM2-6B 在 MMLU（+23%）、CEval（+33%）、GSM8K（+571%）、BBH（+60%）等数据集上的性能取得了大幅度的提升，在同尺寸开源模型中具有较强的竞争力。
更长的上下文：基于 FlashAttention 技术，我们将基座模型的上下文长度（Context Length）由 ChatGLM-6B 的 2K 扩展到了 32K，并在对话阶段使用 8K 的上下文长度训练，允许更多轮次的对话。但当前版本的 ChatGLM2-6B 对单轮超长文档的理解能力有限，我们会在后续迭代升级中着重进行优化。
更高效的推理：基于 Multi-Query Attention 技术，ChatGLM2-6B 有更高效的推理速度和更低的显存占用：在官方的模型实现下，推理速度相比初代提升了 42%，INT4 量化下，6G 显存支持的对话长度由 1K 提升到了 8K。

以上来自于官网的介绍。

ChatGLM v1.0: ChatGLM-6B (General Language Model) 的工程配置
ChatGLM v2.0: 第2版 ChatGLM2-6B (General Language Model) 的工程配置

1. 配置 ChatGLM2-6B 环境

配置 docker 环境：

docker network ls
df -h
docker images | grep "glm"nvidia-docker run -it --privileged --network bridge --net=host --shm-size 32G --name chat-chenlong -p 9300:9300 -v /data:/data -v /nfs:/nfs glm:nvidia-pytorch-1.11.0-cu116-py3

添加自定义的配置 ~/.bashrc 文件：

# myconfig
export TORCH_HOME=/nfs/chenlong/workspace/torch_home/

配置 conda 环境：

conda create -n chatglm2 python=3.8
conda activate chatglm2git clone git@github.com:THUDM/ChatGLM2-6B.git ChatGLM2-6B-official
cd ChatGLM2-6B-official
pip install -r requirements.txt

2. 下载 ChatGLM2-6B 模型

在下载模型之前，需要修改 THU-Cloud-Downloader/main.py 逻辑，使用 file 筛选文件名称，否则 ChatGLM2-6B 文件夹过大：

for obj in objects:if obj["is_dir"]:filelist += dfs_search_files(share_key, obj['folder_path'])elif args.file is None:filelist.append(obj)else:# 修改为 obj['file_path']mat = re.match(args.file.replace('*', '.*'), obj['file_path'])if mat is not None:filelist.append(obj)
return filelist

下载 ChatGLM2-6B 的参数，模型下载路径，即清华云盘 - ChatGLM2-6B：

git clone git@hf.co:THUDM/chatglm2-6b
cd THU-Cloud-Downloaderpython main.py --link https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c --save ../chatglm2-6b-bin/ --file /chatglm2-6b/

同时，相比于ChatGLM-6B，ChatGLM2-6B还要额外下载 tokenizer.model 文件，并不包括在云盘中，再替换相应的文件，否则报错。

tokenizer.model

3. 启动 ChatGLM2-6B 服务

修改 web_demo.py：

demo.queue().launch(share=False, inbrowser=True, server_name='0.0.0.0', server_port=9300)

vscode 支持直接跳转：http://localhost:9300/

ChatGLM2

LLM - 第2版 ChatGLM2-6B (General Language Model) 的工程配置

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://blog.csdn.net/caroline_wendy/article/details/131445696 ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多优…...

编程日记 2023/7/6 3:24:44

从0开始，手写MySQL事务

说在前面：从0开始，手写MySQL的学习价值尼恩曾经指导过的一个7年经验小伙，凭借精通Mysql, 搞定月薪40K。从0开始，手写一个MySQL的学习价值在于： 可以深入地理解MySQL的内部机制和原理，Mysql可谓是面试的…...

编程日记 2023/7/6 2:51:23

React中useState的setState方法请求了好多次

1、问题描述最近在写react的时候碰到了一个很奇怪的问题。可以看到那个getXXX()的方法一直不断的被调用，网页一直请求，根本停不下来了。 2、产生原因要弄明白这个原因，首先要先了解一下react生命周期。 react是组件式的编程，一…...

编程日记 2023/7/6 2:18:02

【MYSQL基础】基础命令介绍

基础命令 MYSQL注释方式 -- 单行注释/* 多行注释哈哈哈哈哈哈哈哈哈 */连接数据库 mysql -u root -p12345678退出数据库连接使用exit;命令可以退出连接查询MYSQL版本 mysql> select version(); ----------- | version() | ----------- | 8.0.27 | ----------- 1…...

编程日记 2023/7/6 1:44:41

多元回归预测 | Matlab基于灰狼算法优化深度置信网络(GWO-DBN)的数据回归预测，matlab代码回归预测，多变量输入模型

文章目录效果一览文章概述部分源码参考资料效果一览文章概述多元回归预测 | Matlab基于灰狼算法优化深度置信网络(GWO-DBN)的数据回归预测，matlab代码回归预测，多变量输入模型，matlab代码回归预测，多变量输入模型，多变量输入模型评价指标包括:MAE、RMSE和R2等，代码质…...

编程日记 2023/7/6 1:11:20

校园wifi网页认证登录入口

很多校园wifi网页认证登录入口是1.1.1.1 连上校园网在浏览器写上http://1.1.1.1就进入了校园网使用说明一、帐户余额 < 0.00元时，帐号被禁用，需追加网费。二、在计算中心机房上机的用户，登录时请选择新建帐号时给您指定的NT域&…...

编程日记 2023/7/6 0:37:59

[SpringBoot]Spring Security框架

目录关于Spring Security框架 Spring Security框架的依赖项 Spring Security框架的典型特征关于Spring Security的配置关于默认的登录页关于请求的授权访问（访问控制） 使用自定义的账号登录使用数据库中的账号登录关于密码编码器使用BCry…...

编程日记 2023/7/6 0:04:38

Unity 之抖音小游戏本地数据最新存储方法分享

Unity 之抖音小游戏本地数据最新存储方法分享一、抖音小游戏文件存储系统背景二、文件存储系统的使用方法2.1 初始化2.1 创建目录2.3 存储数据2.4 删除目录/文件2.5 其他相关操作三，小结抖音小游戏是一种基于抖音平台开发的小型游戏，与传统的 APP 不…...

编程日记 2023/7/5 23:31:16

逍遥自在学C语言 | 函数初级到高级解析

前言函数是C语言中的基本构建块之一，它允许我们将代码组织成可重用、模块化的单元。本文将逐步介绍C语言函数的基础概念、参数传递、返回值、递归以及内联函数和匿名函数。一、人物简介第一位闪亮登场，有请今后会一直教我们C语言的老师 —— 自在…...

编程日记 2023/7/5 22:57:55

Elastic 推出 Elastic AI 助手

作者：Mike Nichols Elastic 推出了 Elastic AI Assistant，这是一款由 ESRE 提供支持的开放式、生成式 AI 助手，旨在使网络安全民主化并支持各种技能水平的用户。最近发布的 Elasticsearch Relevance Engine™ (ESRE™) 提供了用于创建高度相…...

编程日记 2023/7/5 22:24:34

【数据库】MySQL安装（最新图文保姆级别超详细版本介绍）

1.总共两部分（第二部可省略） 安装mysql体验mysql环境变量配置 1.1安装mysql 1.输入官网地址https://www.mysql.com/ 下载完成后，我们双击打开我们的下载文件打开后的界面，如图所示我们选择custom，点击nex…...

编程日记 2023/7/5 21:51:13

前端使用pdf-lib库实现pdf合并，window.open预览合并后的pdf

最近出差开了好多发票，写了一个pdf合并网站，用于把多张发票pdf合并成一张，方便打印使用pdf-lib这个库实现的pdf合并功能，预览使用的是浏览器自身查看pdf功能源码网页地址 https://zqy233.github.io/PDF-merge/ <!DOCTYPE h…...

编程日记 2023/7/5 21:17:51

计算机网络相关知识点总结（二）

比特bit是计算机中数据量的最小单位,可简记为b。字节Byte也是计算机中数据量的单位,可简记为B,1B8bit。常用的数据量单位还有kB、MB、GB、TB等,其中k、M、G、T的数值分别为 2 10 2^{10} 210, 2 20 2^{20} 220, 2 30 2^{30} 230, 2 40 2^{40} 240。 K, M, G, T 分别对应以下…...

编程日记 2023/7/5 20:44:30

Redmine与Gitlab整合（实战版）

网上查了很多文章，总结一下。安装过程略。可参考：(84条消息) Redmine与Gitlab功能集成_redmine gitlab_羽之大公公的博客-CSDN博客配置集成的方法，参考： Redmine与GitLab集成 (ngui.cc) 修改ssh-key密码的方法，参…...

编程日记 2023/7/5 20:11:09

（3）深度学习学习笔记-简单线性模型

文章目录一、线性模型二、实例1.pytorch求导功能2.简单线性模型（人工数据集） 来源一、线性模型一个简单模型：假设一个房子的价格由卧室、卫生间、居住面积决定，用x1，x2，x3表示。那么房价y就可以认为yw…...

编程日记 2023/7/5 19:37:48

pytorch3d 安装报错 RuntimeError: Not compiled with GPU support pytorch3d

安装环境 NVIDIA GeForce RTX 3090 cuda 11.3 python 3.8.5 torch 1.11.0 torchvision 0.12.0 环境安装命令 conda install pytorch1.11.0 torchvision0.12.0 torchaudio0.11.0 cudatoolkit11.3 -c pytorch安装pytorch3d参考官网链接 https://github.com/facebookresearch/p…...

编程日记 2023/7/5 19:04:27

spring工程的启动流程？bean的生命周期？提供哪些扩展点？管理事务？解决循环依赖问题的？事务传播行为有哪些？

1.Spring工程的启动流程： Spring工程的启动流程主要包括以下几个步骤： 加载配置文件：Spring会读取配置文件（如XML配置文件或注解配置）来获取应用程序的配置信息。实例化并初始化IoC容器：Spring会创建并初…...

编程日记 2023/7/5 18:31:06

使用 Zabbix 监控 RocketMQ列举监控项和触发器

在使用 Zabbix 监控 RocketMQ 的过程中，以下是一些可能的监控项和触发器： 监控项集群总体健康状况生产者和消费者的连接数量Broker 的状态消息的生产和消费速度队列深度（即队列中的消息数量）磁盘空间使用内存使用CPU使用网络流…...

编程日记 2023/7/5 17:57:45

uniApp：路由与页面跳转及传参

方式一：声明式导航声明式导航，通过组件进行跳转。官方文档：详情使用 navigator 组件进行页面跳转。属性类型默认值说明urlString应用内的跳转链接，值为相对路径或绝对路径，如：“…/first/first”&#x…...

编程日记 2023/7/5 17:24:24

Java中操作文件(二)

目录一、什么是数据流二、InputStream概述 2.1、方法 2.2、说明三、FileInputStream概述 3.1、构造方法 3.2、利用Scanner进行字符串读取，简化操作四、OutputStream概述 4.1、方法 4.2、PrinterWriter简化写操作五、小程序练习示例1 示例…...

编程日记 2023/7/5 16:51:03

AI-调查研究-01-正念冥想有用吗？对健康的影响及科学指南

点一下关注吧！！！非常感谢！！持续更新！！！ 🚀 AI篇持续更新中！（长期更新） 目前2025年06月05日更新到： AI炼丹日志-28 - Aud…...

编程新知 2026/2/8 5:11:39

java_网络服务相关_gateway_nacos_feign区别联系

1. spring-cloud-starter-gateway 作用：作为微服务架构的网关，统一入口，处理所有外部请求。核心能力： 路由转发（基于路径、服务名等）过滤器（鉴权、限流、日志、Header 处理）支持负…...

编程新知 2025/11/28 2:51:33

Python实现prophet 理论及参数优化

文章目录 Prophet理论及模型参数介绍Python代码完整实现prophet 添加外部数据进行模型优化之前初步学习prophet的时候，写过一篇简单实现，后期随着对该模型的深入研究，本次记录涉及到prophet 的公式以及参数调优，从公式可以更直观…...

编程新知 2026/1/27 5:01:54

MODBUS TCP转CANopen 技术赋能高效协同作业

在现代工业自动化领域，MODBUS TCP和CANopen两种通讯协议因其稳定性和高效性被广泛应用于各种设备和系统中。而随着科技的不断进步，这两种通讯协议也正在被逐步融合，形成了一种新型的通讯方式——开疆智能MODBUS TCP转CANopen网关KJ-TCPC-CANP…...

编程新知 2026/2/6 9:48:02

[10-3]软件I2C读写MPU6050 江协科技学习笔记（16个知识点）

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16...

编程新知 2026/1/28 8:34:48

前端开发面试题总结-JavaScript篇(一)

文章目录 JavaScript高频问答一、作用域与闭包1.什么是闭包（Closure）？闭包有什么应用场景和潜在问题？2.解释 JavaScript 的作用域链（Scope Chain） 二、原型与继承3.原型链是什么？如何实现继承&a…...

编程新知 2026/2/1 3:12:03

Python网页自动化Selenium中文文档

1. 安装 1.1. 安装 Selenium Python bindings 提供了一个简单的API，让你使用Selenium WebDriver来编写功能/校验测试。通过Selenium Python的API，你可以非常直观的使用Selenium WebDriver的所有功能。 Selenium Python bindings 使用非常简洁方便的A…...

编程新知 2026/1/23 18:15:21