当前位置：首页 > news >正文

云端部署ChatGLM-6B

news 2026/4/9 20:02:30

大模型这里更新是挺快的，我参考的视频教程就和我这个稍微有些不一样，这距离教程发布只过去4天而已…

不过基本操作也差不多

AutoDL算力云：https://www.autodl.com/home

ChatGLM3：https://github.com/THUDM/ChatGLM3/tree/main

Hugging Face：https://huggingface.co/THUDM/chatglm3-6b/tree/main

视频教程：https://www.bilibili.com/video/BV1E94y1V7Lz

租用

按量计费

注册账号。新用户有免费一个月的会员，学生的话认证后每次认证有一年的会员，会员95折，能便宜一点是一点
租用一个3090的GPU，有很多地区选，多点点，找个便宜的就行

在这里插入图片描述

基础镜像里面的pytorch选最新的就行

需要注意，cuda版本不能超过当前主机最高支持的版本

在这里插入图片描述

租用完成后，在控制台页面先关机，然后选择以无卡方式启动，这个省钱，毕竟部署的时候还不需要GPU

在这里插入图片描述

使用jupyterLab打开

在这里插入图片描述

点击进入数据盘【autodl-tmp】，在数据盘打开终端

在这里插入图片描述

在终端中执行后续操作

在这里插入图片描述

部署

开启学术加速

source /etc/network_turbo

在这里插入图片描述

初始化git lfs

curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bashsudo apt-get install git-lfs

在这里插入图片描述

克隆github仓库

git clone https://github.com/THUDM/ChatGLM3

在这里插入图片描述

cd ChatGLM3clear

升级pip

python -m pip install --upgrade pip

在这里插入图片描述

安装依赖【看见successfully就表示安装成功】

pip install -r requirements.txt

在这里插入图片描述

拉取 Hugging Face下的模型

根据官方的如果从 HuggingFace 下载比较慢，也可以从 ModelScope 中下载。

使用这个我也试了，确实是快一些，可以直接跳到第十步，后面几步都不需要执行了
git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

git clone https://huggingface.co/THUDM/chatglm3-6b

拉取的时候大的模型文件可能拉不下来，需要手动下载。如果【chatglm3-6b】文件夹下有以下10个文件，可以按【Ctrl+C】终止git克隆，手动安装模型权重文件

在这里插入图片描述

依次执行以下代码，下载模型权重文件

一定要在chatglm3-6b文件夹下执行

cd chatglm3-6bwget https://huggingface.co/THUDM/chatglm3-6b/resolve/main/pytorch_model-00001-of-00007.binwget https://huggingface.co/THUDM/chatglm3-6b/resolve/main/pytorch_model-00002-of-00007.binwget https://huggingface.co/THUDM/chatglm3-6b/resolve/main/pytorch_model-00003-of-00007.binwget https://huggingface.co/THUDM/chatglm3-6b/resolve/main/pytorch_model-00004-of-00007.binwget https://huggingface.co/THUDM/chatglm3-6b/resolve/main/pytorch_model-00005-of-00007.binwget https://huggingface.co/THUDM/chatglm3-6b/resolve/main/pytorch_model-00006-of-00007.binwget https://huggingface.co/THUDM/chatglm3-6b/resolve/main/pytorch_model-00007-of-00007.bin

关机，重启，因为刚才是以无卡模式启动的，现在需要跑模型了，需要使用GPU。

测试

修改模型路径。打开【basic_demo】文件夹下的cli_demo.py文件，将里面的model_path改为你刚才下载Hugging Face里面的模型的路径，【“…/chatglm3-6b/”】

关于这个路径的问题，大家一定要看好你执行的这个文件相对于模型文件夹的位置关系，ChatGLM另一个git仓库有的python文件没有放到文件夹中，直接就在根目录里面了

如果路径不对，他就会报错，说你的格式不对，***之类的，这时候不要怀疑你之前没有作对，仅仅只是路径没写对
# 一些报错huggingface_hub.utils._validators.HFValidationError: Repo id must use alphanumeric chars or '-', '_', '.', '--' and '..' are forbidden, '-' and '.' cannot start or end the name, max length is 96: 'chatglm3-6b/'.OSError: ChatGLM3/chatglm3-6b is not a local folder and is not a valid model identifier listed on 'https://huggingface.co/models'
If this is a private repository, make sure to pass a token having permission to this repo with `use_auth_token` or log in with `huggingface-cli login` and pass `use_auth_token=True`.

在这里插入图片描述

运行cli_demo.py，在终端窗口内进行对话

cd basic_demo
python cli_demo.py

在这里插入图片描述

运行基于gradio的网页端的模型，web_demo.py

运行生成的网址是不能直接访问的，根据官方的教程，安装Windows桌面工具下载

然后就可以在本地访问gradio生成的网页

下面streamlit 生成的网页也是这样，但是streamlit生成的网址，我们只需要访问这个端口号就行，直接点击那个生成的网址即使挂代理了也打不开

python web_demo.py

在这里插入图片描述

运行基于streamlit 的网页端的模型，web_demo2.py

直接访问端口号，不用访问他生成的

streamlit run web_demo2.py

在这里插入图片描述

综合 Demo

集成了以下功能

Chat: 对话模式，在此模式下可以与模型进行对话。
Tool: 工具模式，模型除了对话外，还可以通过工具进行其他操作。
Code Interpreter: 代码解释器模式，模型可以在一个 Jupyter 环境中执行代码并获取结果，以完成复杂任务。

新建一个 conda 环境并安装所需依赖

conda create -n chatglm3-demo python=3.10source activatesource deactivateconda activate chatglm3-demopip install -r requirements.txt

使用 Code Interpreter 还需要安装 Jupyter 内核：

ipython kernel install --name chatglm3-demo --user

运行

streamlit run main.py

在这里插入图片描述

云端部署ChatGLM-6B

大模型这里更新是挺快的，我参考的视频教程就和我这个稍微有些不一样，这距离教程发布只过去4天而已… 不过基本操作也差不多 AutoDL算力云：https://www.autodl.com/home ChatGLM3：https://github.com/THUDM/ChatGLM3/tree/main Hug…...

编程日记 2023/11/13 5:08:49

设计模式(3)-结构型模式

结构型模式结构型模式描述如何将类或对象按某种布局组成更大的结构。它分为类结构型模式和对象结构型模式，前者采用继承机制来组织接口和类，后者釆用组合或聚合来组合对象。由于组合关系或聚合关系比继承关系耦合度低，满足“合成复用原则…...

编程日记 2023/11/13 5:06:46

C/C++调试工具 - gdb详解

C/C调试工具 -gdb详解 1 简介 2 常用的命令 3 使用的条件 4 程序调试 4.1 直接运行程序 4.2 断点调试(在某一行) 4.3 断点调试(在函数入口处打断点) 5 调试core文件 5.1 生成core文件的方法 5.2 调试core文件 1 简介 GDB是Linux下非常好用且强大的调试工具。GD…...

编程日记 2023/11/13 5:05:45

传奇GOM引擎微端连接不上如何解决

Gom传奇引擎的微端连不上的原因可能有很多，比如网络问题、服务器配置问题、版本兼容性问题等。1.检查网络连接：首先要确保你的网络连接稳定。如果遇到网络问题，比如网络延迟过高，可能会导致你无法连接到服务器。建议使用稳定的网络…...

编程日记 2023/11/13 5:04:43

Easymesh介绍

1.什么是Easymesh 什么是Easymesh，这里需要介绍到有3个点，分别是WFA、MAP和Easymesh。 WFA是Wi-Fi 联盟，Wi-Fi 联盟是专门针对 Wi-Fi 主题的标准创建机构，并且制定新标准，在 Wi-Fi 基础上提供可用功能，全球成员超过 800 家（SoC、制造商和 SW 公司） MAP 是 Multi-AP Te…...

编程日记 2023/11/13 5:03:42

图像相似度对比方法

1.哈希方法，其中包括均值哈希、插值哈希、感知哈希方法。计算出图片的哈希值，一般使用汉明距离计算两个图片间的差距。 2.直方图算法，其中包括灰度直方图算法，RGB直方图算法， 3.灰度图算法：MSE、SSIM、…...

编程日记 2023/11/13 5:02:41

#include<stdio.h> #include <conio.h> #include<math.h> #include <graphics.h> // 引用图形库头文件 #define N 12 int List[N][N];void draw() {for (int i 0; i < N; i) {int x 200 * cos(2 * 3.14 * i / N);int y 200 * sin(2 * 3.1…...

编程日记 2023/11/13 5:01:39

zookeeper应用之分布式屏障

分布式系统中某些节点任务当满足某个条件时才允许继续运行，如果不满足则当前节点需要等待。这个时候就需要一个屏障来阻止节点的处理。ZooKeeper Barrier是ZooKeeper提供的一种用于分布式环境中实现同步和协调的机制。具体逻辑就是： 1、检测某个barrier…...

编程日记 2023/11/13 4:59:37

PDBADMIN 的作用，命名，重建以及能否DROP

Creating a pluggable database using below SQL: create pluggable database psample1 admin user psample_admin identified by "XXXXXXXXXXXXXXX roles(connect) create_file_destDGEHDB; What if user psample_admin gets dropped accidentally? Is it important?…...

编程日记 2023/11/13 4:58:36

华为L410上制作内网镜像模板02

原文链接：华为L410上制作离线安装软件模板02 hello，大家好啊，今天给大家带来第二篇在内网搭建Apache服务器，用于安装完内网操作系统后，在第一次开机时候，为系统安装软件的文章，今天给大家介绍在…...

编程日记 2023/11/13 4:57:34

美国材料与试验协会ASTM发布新版玩具安全标准 ASTM F963-23

美国材料与试验协会ASTM发布新版玩具安全标准 ASTM F963-23 2023年10月13日，美国材料与试验协会（ASTM）发布了新版玩具安全标准ASTM F963-23 根据CPSIA的规定，当ASTM将ASTM F963的拟定修订意见通知CPSC时，若CPSC认为…...

编程日记 2023/11/13 4:56:34

Postman模拟上传文件

如图，在F12抓到的上传文件的请求那要在postman上模拟这种上传，怎么操作呢，如图，选中【Select File】选取文件上传即可...

编程日记 2023/11/13 4:55:32

【系统架构设计】架构核心知识： 1 系统工程与信息系统基础

目录一系统工程二信息系统三电子政务四企业信息化与电子商务...

编程日记 2023/11/13 4:54:31

加班把数据库重构完毕

加班把数据库重构完毕本文的数据库重构是基于 clickhouse 时序非关系型的数据库。该数据库适合存储股票数据，速度快，一般查询都是 ms 级别，不需要异步查询更新界面 ui。达到目标效果：数据表随便删除，重新拉数据以及指…...

编程日记 2023/11/13 4:53:30

Centos（Linux）安装mysql数据库

1. 环境准备 1.1 更新系统和安装依赖项在进行MySQL安装之前，确保系统包是最新的，并安装必要的依赖项： yum update yum install epel-release yum install wget 1.2 下载MySQL社区版软件包使用https方式下载MySQL社区版软件包&#xf…...

编程日记 2023/11/13 4:52:28

【数据结构】深度剖析ArrayList

目录 ArrayLIst介绍 ArrayList实现的接口有哪些？ ArrayList的序列化：实现Serializable接口 serialVersionUID 有什么用? 为什么一定要实现Serialzable才能被序列化？ transient关键字为什么ArrayList中的elementData会被transient修…...

编程日记 2023/11/13 4:51:28

离线环境通过脚本实现服务器时钟同步（假同步）

1、背景最近遇到一个时钟同步问题，是内网多台服务器之间时钟不同步，然后部署在不同服务器间的应用展示得时间戳不能统一，所以用户让做一下内网服务器间得时钟同步。内网服务器x86和arm都有，而且有得系统是centos有得是ubuntu&…...

编程日记 2023/11/13 4:50:26

2023年9月青少年软件编程（C语言）等级考试试卷（一级）

日期输出给定两个整数，表示一个日期的月和日。请按照"MM-DD"的格式输出日期，即如果月和日不到2位时，填补0使得满足2位。时间限制：10000 内存限制：65536 输入 2个整数m,d（0 < m < 12…...

编程日记 2023/11/13 4:48:23

基于若依的ruoyi-nbcio流程管理系统仿钉钉流程json转bpmn的flowable的xml格式（支持并行网关）

更多ruoyi-nbcio功能请看演示系统 gitee源代码地址前后端代码： https://gitee.com/nbacheng/ruoyi-nbcio 演示地址：RuoYi-Nbcio后台管理系统这个章节来完成并行网关，前端无需修改，直接后端修改就可以了。 1、并行网关后端修…...

编程日记 2023/11/13 4:45:19

软件测试面试-银行篇

今天参加了一场比较正式的面试，汇丰银行的视频面试。在这里把面试的流程记录一下，结果还不确定，但是面试也是自我学习和成长的过程，所以记录下来大家也可以互相探讨一下。请你做一下自我介绍？（汇丰要求英…...

编程日记 2023/11/13 4:44:17

【AI CTO视角】算力不是堆资源，而是一场精细化工程

经常和行业内的朋友交流，发现一个普遍现象：一提到AI算力建设，很多人的第一反应还是堆卡、扩集群、上规模，仿佛GPU数量上去了，算力竞争力自然就来了。但从实际落地与商业化视角看，尤其在大模型规模化服务、…...

编程新知 2026/4/9 18:56:41

7种音频格式一键转换：FlicFlac便携工具完全指南

7种音频格式一键转换：FlicFlac便携工具完全指南【免费下载链接】FlicFlac Tiny portable audio converter for Windows (WAV FLAC MP3 OGG APE M4A AAC) 项目地址: https://gitcode.com/gh_mirrors/fl/FlicFlac 在数字音频处理中，格式转换是每个…...

编程新知 2026/4/9 17:58:16

Maomi.In | .NET 全能多语言解决方案八

AI Agent 时代的沙箱需求从 Copilot 到 Agent：执行能力的质变在生成式 AI 的早期阶段，应用主要以“Copilot”形式存在，AI 仅作为辅助生成建议。然而，随着 AutoGPT、BabyAGI 以及 OpenAI Code Interpreter（现为 Advan…...

编程新知 2026/4/9 17:50:15

高效3D医学图像分割实战：MedSAM从入门到精通

高效3D医学图像分割实战：MedSAM从入门到精通【免费下载链接】MedSAM Segment Anything in Medical Images 项目地址: https://gitcode.com/gh_mirrors/me/MedSAM MedSAM（Segment Anything in Medical Images）是一款专为医学影像设计的…...

编程新知 2026/4/9 17:05:38

硬盘出售 / 淘汰必看：3 种安全擦除方法，数据彻底无法恢复

很多人处理旧硬盘时，只做简单格式化就转手，殊不知格式化仅删除文件索引，数据可轻易被恢复，极易造成隐私泄露。本文整理 3 种实用的硬盘安全擦除方案，覆盖免费工具、简易操作，帮你彻底销毁数据，杜…...

编程新知 2026/4/9 16:54:18

像素剧本圣殿详细步骤：基于Qwen2.5-14B-Instruct的剧本张力增强微调方法

像素剧本圣殿详细步骤：基于Qwen2.5-14B-Instruct的剧本张力增强微调方法 1. 项目概述像素剧本圣殿(Pixel Script Temple)是一款专为剧本创作设计的AI辅助工具，基于Qwen2.5-14B-Instruct大模型深度微调而成。这个工具将先进的自然语言处理技术与复古像…...

编程新知 2026/4/9 16:41:56

Leather Dress Collection开源镜像：236MB轻量级LoRA集合支持消费级GPU本地部署

Leather Dress Collection开源镜像：236MB轻量级LoRA集合支持消费级GPU本地部署 1. 项目介绍 Leather Dress Collection是一个专为时尚设计领域打造的轻量级AI工具包，基于Stable Diffusion 1.5框架开发。这个开源项目包含了12个精心调校的LoRA模型&…...

编程新知 2026/4/9 15:15:20

Obsidian PDF++：构建PDF与知识网络的无缝连接

Obsidian PDF：构建PDF与知识网络的无缝连接【免费下载链接】obsidian-pdf-plus PDF: the most Obsidian-native PDF annotation & viewing tool ever. Comes with optional Vim keybindings. 项目地址: https://gitcode.com/gh_mirrors/ob/obsidian-pdf-plus…...

编程新知 2026/4/9 14:18:50

从理论到实践：NMPC轨迹跟踪控制器的非线性优化与Simulink仿真验证

1. NMPC与MPC的核心差异：为什么非线性问题需要特殊处理？ 我第一次接触NMPC（非线性模型预测控制）时，最困惑的问题是：既然MPC已经能解决大多数控制问题，为什么还要大费周章处理非线性版本&#xf…...

编程新知 2026/4/9 14:08:32

如何用wxhelper实现高效PC微信自动化开发：从原理到实战指南

如何用wxhelper实现高效PC微信自动化开发：从原理到实战指南【免费下载链接】wxhelper Hook WeChat / 微信逆向项目地址: https://gitcode.com/gh_mirrors/wx/wxhelper 在数字化办公与社交自动化需求日益增长的今天，PC微信作为重要的沟通工具&am…...

编程新知 2026/4/9 14:06:25

云端部署ChatGLM-6B

租用

部署

测试

综合 Demo

相关文章：

云端部署ChatGLM-6B

设计模式(3)-结构型模式

C/C++调试工具 - gdb详解

传奇GOM引擎微端连接不上如何解决

Easymesh介绍

图像相似度对比方法

C++ 配合图形库实现画线效果

zookeeper应用之分布式屏障

PDBADMIN 的作用，命名，重建以及能否DROP

华为L410上制作内网镜像模板02

美国材料与试验协会ASTM发布新版玩具安全标准 ASTM F963-23

Postman模拟上传文件

【系统架构设计】架构核心知识： 1 系统工程与信息系统基础

加班把数据库重构完毕

Centos（Linux）安装mysql数据库

【数据结构】深度剖析ArrayList

离线环境通过脚本实现服务器时钟同步（假同步）

2023年9月青少年软件编程（C语言）等级考试试卷（一级）

基于若依的ruoyi-nbcio流程管理系统仿钉钉流程json转bpmn的flowable的xml格式（支持并行网关）

软件测试面试-银行篇

【AI CTO视角】算力不是堆资源，而是一场精细化工程

7种音频格式一键转换：FlicFlac便携工具完全指南

Maomi.In | .NET 全能多语言解决方案八

高效3D医学图像分割实战：MedSAM从入门到精通

硬盘出售 / 淘汰必看：3 种安全擦除方法，数据彻底无法恢复

像素剧本圣殿详细步骤：基于Qwen2.5-14B-Instruct的剧本张力增强微调方法

Leather Dress Collection开源镜像：236MB轻量级LoRA集合支持消费级GPU本地部署

Obsidian PDF++：构建PDF与知识网络的无缝连接

从理论到实践：NMPC轨迹跟踪控制器的非线性优化与Simulink仿真验证

如何用wxhelper实现高效PC微信自动化开发：从原理到实战指南