当前位置：首页 > news >正文

ChatGLM-6B-部署与使用

news 2026/1/2 4:37:38

✨ Blog’s 主页: 白乐天_ξ( ✿＞◡❛)
🌈 个人Motto：他强任他强，清风拂山冈！
💫 欢迎来到我的学习笔记！

什么是ChatGLM-6B

一、简介

ChatGLM-6B 是由清华大学知识工程实验室（KEG）与智谱 AI 联合打造的一个开源的、支持中英双语的对话语言模型。

二、基本参数

参数量：62 亿参数。

三、技术架构与特点

架构基础：基于 General Language Model（GLM）架构，参考了 OpenAI 的 GPT 和 Google’s BERT 结构，并融合了 GLM 的技术特点。
语言能力：具备良好的中英双语对话生成能力，能够理解和处理中英文混合输入。

四、应用场景

智能客服：为企业提供高效的客户服务解决方案，回答用户的问题，解决用户的疑虑。
智能助手：作为个人智能助手，帮助用户完成各种任务，如日程安排、信息查询、文本创作等。
教育培训：辅助教学，回答学生的问题，提供学习建议和指导。
内容创作：生成文章、故事、诗歌等各种文本内容。

ChatGLM-6B 模型的使用方法

ChatGLM - 6B 模型的使用方法主要有以下几种：

本地部署运行

环境准备：
- 安装 Python（建议使用 Python 3.8 及以上版本）。
- 安装必要的库和依赖项，使用pip install -r requirements.txt，其中transformers库版本推荐为 4.27.1，但理论上不低于 4.23.1 即可。
模型加载：

  from transformers import AutoTokenizer, AutoModeltokenizer = AutoTokenizer.from_pretrained("thudm/chatglm - 6b", trust_remote_code=True)model = AutoModel.from_pretrained("thudm/chatglm - 6b", trust_remote_code=True).half().cuda()model = model.eval()

对话交互

  response, history = model.chat(tokenizer, "白乐天", history=())print(response)response, history = model.chat(tokenizer, "你好，白乐天！", history=history)print(response)

使用网页版 Demo
1. 下载模型仓库：git clone https://github.com/thudm/chatglm - 6b。
2. 进入仓库目录：cd chatglm - 6b。
3. 安装gradio库：pip install gradio。
4. 运行网页版程序：python web_demo.py，程序会运行一个 Web 服务器，并输出地址，在浏览器中打开输出的地址即可使用。

3.通过 API 调用
安装额外的依赖：pip install fastapi uvicorn。
运行仓库中的api.py文件：python api.py，默认部署在本地的 8000 端口。

DAMODEL（丹摩智算）平台-ChatGLM-6B 服务端部署

1.什么是DAMODEL（丹摩智算）？

DAMODEL（丹摩智算）是专为 AI 打造的智算云，致力于提供丰富的算力资源与基础设施助力 AI 应用的开发、训练、部署。

2.实例创建

1. 首先先进入丹摩平台，按照图示进行操作：

进入创建页面后，首先在实例配置中选择付费类型为按量付费，其次选择单卡启动，然后选择需求的 GPU 型号，本次实验可以选择选择：按量付费–GPU 数量 1–NVIDIA-GeForc-RTX-4090，该配置为 60GB 内存，24GB 的显存。

方法和前一篇文章【Llama3.1的部署与使用】一样，看着操作就行了！

配置数据硬盘的大小选择默认大小 50GB，选择 PyTorch1.13.1 的框架启动
点击创建密钥对，输入自定义的名称。创建好密钥对后，选择刚刚创建好的密钥对，并点击立即创建，等待一段时间后即可启动成功！

3.模型准备

启动环境后，打开终端，用 git 克隆ChatGLM-6B项目

cd /home/aistudio/work/
git clone https://github.com/THUDM/ChatGLM-6B.git
# 如果遇见github因为网络问题导致失败，可选择gitcode站点进行下载
# git clone https://gitcode.com/applib/ChatGLM-6B.git

成功克隆项目后，会显示如下文件夹：

cd进入该文件夹，使用pip安装项目依赖：

pip install -r requirements.txt

等待一会儿看见显示如 Successfully installed，就表示安装完成！

安装完依赖，我们现在就开始引入模型文件。
1. 首先点击文件存储，点击上传文件。

下载 Hugging Face 上的 ChatGLM-6B 预训练模型，也可以进入魔塔社区选择Chatglm3-6B里的所有文件进行下载。

将下载下来的模型文件及配置进行上传并解压，上传时尽量保持该界面首页显示，等待上传成功后再进行其他操作。

4.模型启动

上传好预训练模型及解压后，我们就可以启动Python脚本进行运行了。

首先我们使用cli_demo.py命令行进行交互；
然后我们再使用web_ demo.py命令行，使用本机服务器进行网页交互。
确定预训练模型的本地路径。假设你的模型解压后存放在/home/user/models/chatglm-6b路径下。
打开cli_demo.py文件：
- 找到类似以下的代码行：

tokenizer = AutoTokenizer.from_pretrained("thudm/chatglm-6b", trust_remote_code=True)model = AutoModel.from_pretrained("thudm/chatglm-6b", trust_remote_code=True).half().cuda()

将其修改为：

tokenizer = AutoTokenizer.from_pretrained("/home/user/models/chatglm-6b", trust_remote_code=True)model = AutoModel.from_pretrained("/home/user/models/chatglm-6b", trust_remote_code=True).half().cuda()

注意将路径替换为你实际的模型存放路径。

打开web_demo.py文件：
- 同样找到类似的代码行并进行修改，修改方式与cli_demo.py文件一致。

修改完成后，保存文件。现在你就可以使用本地模型启动了，根据你的需求运行相应的脚本文件即可进行命令行交互或网页交互。

如果在终端输入python cli_demo.py成功启动模型后，你将进入一个交互界面，可以按照以下方式进行操作：
1. 对话交互： 当你输入文本时，模型会根据你的输入生成相应的回复。例如，你输入 “今天天气怎么样？”，模型可能会给出类似 “很抱歉，不清楚你所在地区的具体天气情况呢。你可以通过天气预报网站或应用查询。” 这样的回答。
2. 清空对话历史和清除屏幕： 如果输入 “clear”，程序会清空之前的对话历史，并且清除屏幕，为新的对话做好准备。
3. 退出程序： 当你输入 “stop” 时，程序会退出，结束当前的交互会话。

这种交互方式为用户提供了灵活的操作选择，可以根据自己的需求随时调整对话状态或结束程序。同时，通过不断输入不同的问题和指令，可以更好地了解模型的能力和特点。

ChatGLM-6B-部署与使用

✨ Blog’s 主页: 白乐天_ξ( ✿＞◡❛) 🌈 个人Motto：他强任他强，清风拂山冈！ 💫 欢迎来到我的学习笔记！ 什么是ChatGLM-6B 一、简介 ChatGLM-6B 是由清华大学知识工程实验室（KEG&…...

编程日记 2024/9/23 15:05:58

文章目录一、Sequence Labeling 问题概述二、Hidden Markov Model(HMM)三、Conditional Random Field(CRF)四、Structured Perceptron/SVM五、Towards Deep Learning 一、Sequence Labeling 问题概述二、Hidden Markov Model(HMM) 上图 training data 中的黑色字为x&#xff…...

编程日记 2024/9/23 15:03:56

java重点学习-总结

十五总结 https://kdocs.cn/l/crbMWc8xEZda （总结全部的精华） 1.面试准备企业筛选简历规则简历编写注意事项(亮点)项目怎么找，学习到什么程度面试过程(表达结构、什么样的心态去找工作) 2.redis 缓存相关(缓存击穿、穿透、雪崩、缓存过期淘…...

编程日记 2024/9/23 15:02:55

文件操作

文件的由来：在程序中，之前每一个程序都是需要运行然后输入数据，当程序结束时输入的数据也随之消散，为了下一次运行时不再输入数据就有文件的由来，使用文件我们可以将数据直接存放在电脑的硬盘上，做到了数据…...

编程日记 2024/9/23 15:00:52

docker存储

docker分层结构如图所示，容器是由最上面可读可写的容器层，以及若干个只读镜像层组成，创建容器时，容器中的数据都来自镜像层。这样的分层机构最大的特点是写时复制： 1、容器中新生成的数据会直接存放在容器层&#xf…...

编程日记 2024/9/23 14:59:50

Ubuntu20.04.6 环境下docker设置proxy

问题背景： 在进行dokcer pull操作的时候，会失败且出现如下提示Error response from daemon: Get "https://registry-1.docker.io/v2/": net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting h…...

编程日记 2024/9/23 14:56:45

如何给文件夹里面的文件批量添加前缀和编号（利用C#写的小工具）

运行结果将上面的文件编号效果下载过后启动这个程序即可（这个程序灵感来源是上次给美术资源分类和编号的时候给我干吐了，所以写了这个工具） 体验链接：laozhupeiqia/批处理 --- laozhupeiqia/批处理 (github.com) 如果对你有帮助…...

编程日记 2024/9/23 14:55:44

使用分布式调度框架时需要考虑的问题——详解

引言随着企业系统的规模不断扩大，特别是在分布式计算和云计算环境下，如何协调多个节点或服务执行任务成为一个关键问题。分布式调度框架在这种背景下应运而生，它可以调度成千上万的任务，在多个节点上分配、执行和监控任务&#…...

编程日记 2024/9/23 14:54:42

C语言编译四大阶段

目录一、引言二、预处理阶段三、编译阶段四、汇编阶段五、链接阶段六、总结本文将详细介绍C语言编译的四个阶段，包括预处理、编译、汇编和链接。通过学习这些阶段，读者可以更好地理解C语言程序的编译过程，提高编程效率。一、引…...

编程日记 2024/9/23 14:53:41

C# 关于“您与该网站的连接不是私密连接...”的问题

目录问题现象范例运行环境 WebService 类类介绍增加参数实现小结问题现象最近在访问开发的微信支付功能时遇到了无法访问令牌的错误，这个错误是公司内部应用程序接口返回的访问错误。经过排查是访问 HTTPS 站点遇到的错误，提示证书风险…...

编程日记 2024/9/23 14:49:37

【超详细】基于YOLOv8训练无人机视角Visdrone2019数据集

主要内容如下： 1、Visdrone2019数据集介绍 2、下载、制作YOLO格式训练集 3、模型训练及预测 4、Onnxruntime推理运行环境：Python3.8（要求>3.8），torch1.12.0cu113（要求>1.8）&#xff0c…...

编程日记 2024/9/23 14:47:36

VUE项目在Linux子系统部署

1、导读环境：Windows 11、python 3.12.3、Django 4.2.11、 APScheduler 3.10.4 vue 背景：换系统需要重新安装，避免后期忘记，此处记录一下啊事件：20240922 说明：使用node启动，非nginx&…...

编程日记 2024/9/23 14:46:34

开源 | 如何在产品上扩展大储存？合宙LuatOS外挂SPI Flash库轻松搞定

我们都知道芯片的储存都是寸土寸金的，当你的产品需要存储照片、音频、文档等资源的时候，有没有眉头一紧？内部不够只能外扩，但是外扩要编写各种驱动，还有Flash替换，这都要消耗头发啊！ 但&#x…...

编程日记 2024/9/23 14:42:29

20 基于STM32的温度、电流、电压检测proteus仿真系统（OLED、DHT11、继电器、电机）

目录一、主要功能二、硬件资源三、程序编程四、实现现象一、主要功能基于STM32F103C8T6 采用DHT11读取温度、滑动变阻器模拟读取电流、电压。通过OLED屏幕显示，设置电流阈值为80，电流小阈值为50，电压阈值为60，温度阈值…...

编程日记 2024/9/23 14:40:27

spring自定义属性编辑器

文章目录 spring自定义属性编辑器步骤 spring自定义属性编辑器属性编辑器是用来解析bean的配置文件中的属性标签的，spring的BeanWrapperImpl默认会注册CustomCollectionEditor(集合)、CustomMapEditor(Map)、CurrencyEditor(货币)、ByteArrayPropertyEditor等&…...

编程日记 2024/9/23 14:37:23

在VMware16中安装Windows 10：完整教程

在VMware中安装Windows 10：完整教程 1.安装环境准备2.创建虚拟机 1.安装环境准备 1.虚拟机: VMware-workstation-full-16.2.2-19200509 2.系统镜像:win10 2.创建虚拟机 1.自定义 2.下一步 3.稍后安装系统 3.默认下一步 4.虚拟机取名和选择存放路径(按需更改…...

编程日记 2024/9/23 14:36:22

MATLAB系列09：图形句柄

MATLAB系列09：图形句柄 9. 图形句柄9.1 MATLAB图形系统9.2 对象句柄9.3 对象属性的检测和更改9.3.1 在创建对象时改变对象的属性9.3.2 对象创建后改变对象的属性 9.4 用 set 函数列出可能属性值9.5 自定义数据9.6 对象查找9.7 用鼠标选择对象9.8 位置和单位9.8.1 图…...

编程日记 2024/9/23 14:34:19

把设计模式用起来！（4）用不好模式？之原理不明

（清华大学出版社《把设计模式用起来》书稿试读） 上一篇：把设计模式用起来！（3）用不好模式？之时机不对为什么用不好设计模式？——原理不明难搞的顾客：“抹这种霜&#…...

编程日记 2024/9/23 14:31:15

安卓13去掉下拉菜单的Dump SysUI 堆的选项 android13删除Dump SysUI 堆

总纲 android13 rom 开发总纲说明文章目录 1.前言2.问题分析3.代码分析3.1 位置13.2 位置24.代码修改5.编译6.彩蛋1.前言客户需要去掉下拉菜单里面的Dump SysUI 堆图标，不让使用这个功能。 2.问题分析 android的下拉菜单在systemui里面，这里我们只需要定位到对应的添加代…...

编程日记 2024/9/23 14:26:09

vue3常用的组件间通信

一 props props 可以实现父子组件通信，props数据是只读。 1. 基本用法在父组件中，你可以这样传递 props： <template><ChildComponent message"Hello, Vue 3!" /> </template><script setup> import C…...

编程日记 2024/9/23 14:23:05

C++实现分布式网络通信框架RPC(3)--rpc调用端

目录一、前言二、UserServiceRpc_Stub 三、 CallMethod方法的重写头文件实现四、rpc调用端的调用实现五、 google::protobuf::RpcController *controller 头文件实现六、总结一、前言在前边的文章中，我们已经大致实现了rpc服务端的各项功能代…...

编程新知 2025/12/31 7:23:10

【力扣数据库知识手册笔记】索引

索引索引的优缺点优点1. 通过创建唯一性索引，可以保证数据库表中每一行数据的唯一性。2. 可以加快数据的检索速度（创建索引的主要原因）。3. 可以加速表和表之间的连接，实现数据的参考完整性。4. 可以在查询过程中，…...

编程新知 2025/12/30 2:29:32

java调用dll出现unsatisfiedLinkError以及JNA和JNI的区别

UnsatisfiedLinkError 在对接硬件设备中，我们会遇到使用 java 调用 dll文件的情况，此时大概率出现UnsatisfiedLinkError链接错误，原因可能有如下几种类名错误包名错误方法名参数错误使用 JNI 协议调用，结果 dll 未实现 JNI 协…...

编程新知 2025/10/6 16:38:04

为什么需要建设工程项目管理？工程项目管理有哪些亮点功能？

在建筑行业，项目管理的重要性不言而喻。随着工程规模的扩大、技术复杂度的提升，传统的管理模式已经难以满足现代工程的需求。过去，许多企业依赖手工记录、口头沟通和分散的信息管理，导致效率低下、成本失控、风险频发。例如&#…...

编程新知 2025/12/31 11:32:22

智能在线客服平台：数字化时代企业连接用户的 AI 中枢

随着互联网技术的飞速发展，消费者期望能够随时随地与企业进行交流。在线客服平台作为连接企业与客户的重要桥梁，不仅优化了客户体验，还提升了企业的服务效率和市场竞争力。本文将探讨在线客服平台的重要性、技术进展、实际应用，并…...

编程新知 2025/12/27 23:14:38

多模态商品数据接口：融合图像、语音与文字的下一代商品详情体验

一、多模态商品数据接口的技术架构 （一）多模态数据融合引擎跨模态语义对齐通过Transformer架构实现图像、语音、文字的语义关联。例如，当用户上传一张“蓝色连衣裙”的图片时，接口可自动提取图像中的颜色（RGB值&…...

编程新知 2025/7/23 3:55:49

学习STC51单片机31（芯片为STC89C52RCRC）OLED显示屏1

每日一言生活的美好，总是藏在那些你咬牙坚持的日子里。硬件：OLED 以后要用到OLED的时候找到这个文件 OLED的设备地址 SSD1306"SSD" 是品牌缩写，"1306" 是产品编号。驱动 OLED 屏幕的 IIC 总线数据传输格式示意图 …...

编程新知 2025/12/30 16:34:57

GitHub 趋势日报 (2025年06月06日)

📊 由 TrendForge 系统生成 | 🌐 https://trendforge.devlive.org/ 🌐 本日报中的项目描述已自动翻译为中文 📈 今日获星趋势图今日获星趋势图 590 cognee 551 onlook 399 project-based-learning 348 build-your-own-x 320 ne…...

编程新知 2025/9/7 2:12:04

6️⃣Go 语言中的哈希、加密与序列化：通往区块链世界的钥匙

Go 语言中的哈希、加密与序列化：通往区块链世界的钥匙一、前言：离区块链还有多远？区块链听起来可能遥不可及，似乎是只有密码学专家和资深工程师才能涉足的领域。但事实上，构建一个区块链的核心并不复杂，尤其当你已经掌握了一门系统编程语言，比如 Go。要真正理解区…...

编程新知 2025/10/12 1:37:40

书籍“之“字形打印矩阵(8)0609

题目给定一个矩阵matrix，按照"之"字形的方式打印这个矩阵，例如： 1 2 3 4 5 6 7 8 9 10 11 12 ”之“字形打印的结果为：1，…...

编程新知 2025/12/6 11:14:42

ChatGLM-6B-部署与使用

什么是ChatGLM-6B

ChatGLM-6B 模型的使用方法

DAMODEL（丹摩智算）平台-ChatGLM-6B 服务端部署

1.什么是DAMODEL（丹摩智算）？

2.实例创建

3.模型准备

4.模型启动

相关文章：

ChatGLM-6B-部署与使用

李宏毅结构化学习 03

java重点学习-总结

文件操作

docker存储

Ubuntu20.04.6 环境下docker设置proxy

如何给文件夹里面的文件批量添加前缀和编号（利用C#写的小工具）

使用分布式调度框架时需要考虑的问题——详解

C语言编译四大阶段

C# 关于“您与该网站的连接不是私密连接...”的问题

【超详细】基于YOLOv8训练无人机视角Visdrone2019数据集

VUE项目在Linux子系统部署

开源 | 如何在产品上扩展大储存？合宙LuatOS外挂SPI Flash库轻松搞定

20 基于STM32的温度、电流、电压检测proteus仿真系统（OLED、DHT11、继电器、电机）

spring自定义属性编辑器

在VMware16中安装Windows 10：完整教程

MATLAB系列09：图形句柄

把设计模式用起来！（4）用不好模式？之原理不明

安卓13去掉下拉菜单的Dump SysUI 堆的选项 android13删除Dump SysUI 堆

vue3常用的组件间通信

C++实现分布式网络通信框架RPC(3)--rpc调用端

【力扣数据库知识手册笔记】索引

java调用dll出现unsatisfiedLinkError以及JNA和JNI的区别

为什么需要建设工程项目管理？工程项目管理有哪些亮点功能？

智能在线客服平台：数字化时代企业连接用户的 AI 中枢

多模态商品数据接口：融合图像、语音与文字的下一代商品详情体验

学习STC51单片机31（芯片为STC89C52RCRC）OLED显示屏1

GitHub 趋势日报 (2025年06月06日)

6️⃣Go 语言中的哈希、加密与序列化：通往区块链世界的钥匙

书籍“之“字形打印矩阵(8)0609