当前位置：首页 > news >正文

华为昇腾NPU卡 ChatGLM2模型使用

news 2026/2/9 13:13:45

参考：https://gitee.com/mindspore/mindformers/blob/dev/docs/model_cards/glm2.md#chatglm2-6b

1、安装环境：

昇腾NPU卡对应英伟达GPU卡，CANN对应CUDA底层； mindspore对应pytorch；mindformers对应transformers

本次环境：
CANN-6.3.RC2.b20231016
mindspore 2.0.0
mindformers （离线安装：https://gitee.com/mindspore/mindformers）
在这里插入图片描述

在这里插入图片描述
查看npu使用信息：

npu-smi info

在这里插入图片描述

2、ChatGLM2模型使用

参考：https://gitee.com/mindspore/mindformers/blob/dev/docs/model_cards/glm2.md

问题参考：
https://gitee.com/mindspore/mindformers/issues/I897LA#note_22105999

代码：

1）pipline方式运行：

import os
import mindspore as msos.environ['DEVICE_ID']='0'
ms.set_context(mode=ms.GRAPH_MODE, device_target="Ascend", device_id=0)  ##需要使用才能npu加速from mindformers import pipeline, TextGenerationPipelinetask_pipeline = pipeline(task='text_generation', model='glm2_6b', max_length=2048)  ##模型自动会下载到checkpoint_download文件夹下task_pipeline('你好') ## 第一次很慢，加载编译阶段
task_pipeline('写一首关于一带一路的诗') ##第二次开始速度才有提升

在这里插入图片描述

由于mindspore不支持一张卡上运行多个任务，所以启动任务都是直接默认申请31G显存占用的，挺耗资源
在这里插入图片描述
2）接口运行

import os
import mindspore as msos.environ['DEVICE_ID']='0'
ms.set_context(mode=ms.GRAPH_MODE, device_target="Ascend",device_id=0)from mindformers import AutoConfig, AutoModel, AutoTokenizertokenizer = AutoTokenizer.from_pretrained("glm2_6b")config = AutoConfig.from_pretrained("glm2_6b")
config.use_past = True
model = AutoModel.from_config(config)##第一轮问问题
inputs = tokenizer("你好")["input_ids"]
# print(inputs)
outputs = model.generate(inputs, max_new_tokens=20, do_sample=True, top_k=3)response = tokenizer.decode(outputs)
print(response)

第一轮加载编译还是很慢，后续速度才提升

##第二轮问问题
inputs = tokenizer("写一首一带一路的诗")["input_ids"]
# print(inputs)
outputs = model.generate(inputs, max_new_tokens=500, do_sample=True, top_k=3)
response = tokenizer.decode(outputs)
print(response)

在这里插入图片描述

华为昇腾NPU卡 ChatGLM2模型使用

参考：https://gitee.com/mindspore/mindformers/blob/dev/docs/model_cards/glm2.md#chatglm2-6b 1、安装环境： 昇腾NPU卡对应英伟达GPU卡，CANN对应CUDA底层； mindspore对应pytorch；mindformers对应transformers 本…...

编程日记 2023/10/23 20:02:53

【机器学习】集成模型/集成学习：多个模型相结合实现更好的预测

1. 概述 1.1 什么是集成模型/集成学习 "模型集成"和"集成学习"是相同的概念。它们都指的是将多个机器学习模型组合在一起，以提高预测的准确性和稳定性的技术。通过结合多个模型的预测结果，集成学习可以减少单个模型的偏差和方差&am…...

编程日记 2023/10/23 20:01:52

如何提高广告投放转化率？Share Creators 资产库与Appsflyer营销数据的全面结合

如何提高广告投放转化率？Share Creators 资产库与Appsflyer营销数据的全面结合全球经济进入了低迷期。营销成本越来越高， 营销需要更务实，注重投入产出比。众所周知，除了渠道、客群画像以外， 优秀的广告设计图&#…...

编程日记 2023/10/23 20:00:51

《软件方法》2023版第1章（11）1.4.3 具体工作步骤

DDD领域驱动设计批评文集做强化自测题获得“软件方法建模师”称号《软件方法》各章合集 1.4 应用UML的建模工作流 1.4.3 使用UML建模的工作流步骤图1-17中“工件形式”一列所列出的图就是本书推荐的在建模工作流ABCD中的UML用法，我用活动图进一步表示建模的步…...

编程日记 2023/10/23 19:59:50

git将当前分支A强制推送远程分支pro上

前言开发中基于线上分支pro创建了A分支，开发完成之后。又基于线上分支pro创建了B分支，都以此合并到测试分支，两个分支更改中都动用部分共同的文件，这就导致后续开发合并代码越来越乱，这时你想把本地开发的分支强推到…...

编程日记 2023/10/23 19:57:46

【计算机基础】存储器

目录一.概念二.分类1．按存储介质分类2．按存储方式分类3．按存储器的读写功能分类4．按信息的可保存性分类5．按在计算机系统中的作用分类三.主存区分SRAM、DRAM、Flash、DDR1.SRAM（静态随机存储器&#xff0…...

编程日记 2023/10/23 19:56:45

【LCR 159. 库存管理 III】

目录一、题目描述二、算法原理三、代码实现一、题目描述二、算法原理三、代码实现 class Solution { public:int getrandom(int left,int right,vector<int>& stock){return stock[rand()%(right-left1)left];}void qsort(int l,int r,vector<int>& s…...

编程日记 2023/10/23 19:55:43

Android ADB 常见问题和注意事项

Android ADB 常见问题和注意事项在使用 ADB 过程中，可能会遇到一些常见问题和需要注意的事项： 1. USB 调试要使用 ADB，你需要在设备上启用 USB 调试模式。这通常在设备的开发者选项中设置。如果你不能看到开发者选项，可以在设…...

编程日记 2023/10/23 19:53:42

TCP/IP五元组

什么是五元组规则？ 五元组是通信术语，英文名称为five-tuple,或5-tuple，五元组包括源IP地址(source IP)、源端口(source port)、目的IP地址(destination IP)、目的端口(destination port) 和传输层协议(the layer 4 protocol)的五个量集合。…...

编程日记 2023/10/23 19:52:40

aiohttp ssl.SSLError: [SSL: SSLV3_ALERT_HANDSHAKE_FAILURE] 错误处理

这个问题原因吧其实就是3.10 开始官网更新了TLS 堆栈默认安全设置感兴趣的可以看下链接 python官网叙述: Python 3.10 增加了 TLS 堆栈的默认安全设置解决也很简单，将ssl安全等级降下来就行，例如： import ssl import aiohttp ctx ssl.cr…...

编程日记 2023/10/23 19:51:38

分析RPA流程自动化的挑战和解决方案

随着数字化工具和自动化解决方案的日益成熟，各行各业发掘到RPA机器人流程自动化技术的先进性，逐渐规模化部署RPA。为了更好地推进RPA的实施，金智维在这里分享一些运用这项技术时面临的共同挑战，并给出针对性的解决方案。组织架构…...

编程日记 2023/10/23 19:50:38

我试图扯掉这条 SQL 的底裤。只能扯一点点，不能扯多了

之前不是写分页嘛，分页肯定就要说到 limit 关键字嘛。然后我啪的一下扔了一个链接出来： https://dev.mysql.com/doc/refman/8.0/en/limit-optimization.html 这个链接就是 MySQL 官方文档，这一章节叫做“对 Limit 查询的优化”，针对 limit 和 order by 组合的场景进行了较…...

编程日记 2023/10/23 19:49:37

LeNet（pytorch实现

LeNet 本文编写了一个简单易懂的LeNet网络，并在F-MNIST数据集上进行测试，允许使用GPU计算在这里插入代码片 import torch from torch import nn, optim import d2lzh_pytorch as d2ldevice torch.device(cuda if torch.cuda.is_available() else cp…...

编程日记 2023/10/23 19:48:36

Selenium获取百度百科旅游景点的InfoBox消息盒

前面我讲述过如何通过BeautifulSoup获取维基百科的消息盒，同样可以通过Spider获取网站内容，最近学习了SeleniumPhantomjs后，准备利用它们获取百度百科的旅游景点消息盒（InfoBox），这也是毕业设计实体对齐和属…...

编程日记 2023/10/23 19:47:35

springcloud笔记 (8) -网关 Gateway

网关出国需要过海关网关：网络的关卡网关的作用 1：路由转发 2：安全控制保护每个服务，不需要将每个暴露出去 3：负载均衡 1.没有网关：客户端直接访问我们的微服务，会需要在客户端配置很多…...

编程日记 2023/10/23 19:46:34

【C++编程语言】STL常用算法算术生成和集合算法

1.算术生成算法概念算法简介： accumlate 计算容器元素累计总和fill 向容器中添加元素注意：算术生成算法属于小型算法使用时包含头文件为#include<numeric> 2.accumulate /*函数原型：int accumulate(iterator beg ,iterator end…...

编程日记 2023/10/23 19:45:34

解放双手：VMLogin自动化工具的高效便捷

在现代工作环境中，时间和效率是我们追求的关键。幸运的是，随着技术的发展，自动化工具为我们提供了解放双手的机会。其中，防关联浏览器的自动化就是一种强大的工具，能够简化我们的工作流程并提升效率。本文将探讨浏览器…...

编程日记 2023/10/23 19:44:31

深度解析网络代理技术及其在网络安全和爬虫应用中的关键作用

在当今数字化时代，网络代理技术在维护网络安全、保护隐私以及实现高效数据获取方面发挥着不可或缺的作用。本文将全面解析Socks5代理、IP代理等关键技术，并探讨其在网络安全和爬虫开发中的重要作用。 1. Socks5代理与SK5代理：多功能代理协议…...

编程日记 2023/10/23 19:43:30

寻找二叉树的最低公共祖先节点

两个节点沿二叉树向上找，找到的第一个公共的节点例：D和F之间的最低公共节点：B D → B； F → E → B； E和G最低公共节点：A E → B → A； G → C → A； B和F最低公共节点&#xff…...

编程日记 2023/10/23 19:42:29

python网络爬虫（二）基本库的使用urllib/requests

使用urllib 了解一下 urllib 库，它是 Python 内置的 HTTP 请求库，也就是说不需要额外安装即可使用。它包含如下 4 个模块。 request：它是最基本的 HTTP 请求模块，可以用来模拟发送请求。就像在浏览器里输入网址然后回车一样&…...

编程日记 2023/10/23 19:40:28

网络编程（Modbus进阶）

思维导图 Modbus RTU（先学一点理论） 概念 Modbus RTU 是工业自动化领域最广泛应用的串行通信协议，由 Modicon 公司（现施耐德电气）于 1979 年推出。它以高效率、强健性、易实现的特点成为工业控制系统的通信标准。包…...

编程新知 2026/2/9 2:42:51

＜6＞-MySQL表的增删查改

目录一，create（创建表） 二，retrieve（查询表） 1，select列 2，where条件三，update（更新表） 四，delete（删除表&#xf…...

编程新知 2025/12/11 18:28:17

家政维修平台实战20：权限设计

目录 1 获取工人信息2 搭建工人入口3 权限判断总结目前我们已经搭建好了基础的用户体系，主要是分成几个表，用户表我们是记录用户的基础信息，包括手机、昵称、头像。而工人和员工各有各的表。那么就有一个问题，不同的角色&#xf…...

编程新知 2026/2/1 22:23:58

DIY｜Mac 搭建 ESP-IDF 开发环境及编译小智 AI

前一阵子在百度 AI 开发者大会上，看到基于小智 AI DIY 玩具的演示，感觉有点意思，想着自己也来试试。如果只是想烧录现成的固件，乐鑫官方除了提供了 Windows 版本的 Flash 下载工具之外，还提供了基于网页版的 ESP LA…...

编程新知 2026/2/3 8:13:35

使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台

🎯 使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台 📌 项目背景随着大语言模型（LLM）的广泛应用，开发者常面临多个挑战：各大模型（OpenAI、Claude、Gemini、Ollama）接口风格不统一；缺乏一个统一平台进行模型调用与测试；本地模型 Ollama 的集成与前…...

编程新知 2026/1/25 3:31:07

安装 pip install pytest用例可以是函数也可以是类中的方法 def test_func():print()class TestAdd: # def __init__(self): 在 pytest 中不可以使用__init__方法 # self.cc 12345 pytest.mark.api def test_str(self):res add(1, 2)assert res 12def test_int(self):r…...

编程新知 2026/2/8 21:57:26

深度学习习题2

1.如果增加神经网络的宽度，精确度会增加到一个特定阈值后，便开始降低。造成这一现象的可能原因是什么？ A、即使增加卷积核的数量，只有少部分的核会被用作预测 B、当卷积核数量增加时，神经网络的预测能力会降低 C、当卷…...

编程新知 2026/1/26 5:53:30

python报错No module named ‘tensorflow.keras‘

是由于不同版本的tensorflow下的keras所在的路径不同，结合所安装的tensorflow的目录结构修改from语句即可。原语句： from tensorflow.keras.layers import Conv1D, MaxPooling1D, LSTM, Dense 修改后： from tensorflow.python.keras.lay…...

编程新知 2025/9/24 7:39:50

C#中的CLR属性、依赖属性与附加属性

CLR属性的主要特征封装性： 隐藏字段的实现细节提供对字段的受控访问访问控制： 可单独设置get/set访问器的可见性可创建只读或只写属性计算属性： 可以在getter中执行计算逻辑不需要直接对应一个字段验证逻辑： 可以…...

编程新知 2025/12/4 0:13:33

elementUI点击浏览table所选行数据查看文档

项目场景： table按照要求特定的数据变成按钮可以点击解决方案： <el-table-columnprop"mlname"label"名称"align"center"width"180"><template slot-scope"scope"><el-buttonv-if&qu…...

编程新知 2026/2/4 18:42:53

华为昇腾NPU卡 ChatGLM2模型使用

1、安装环境：

2、ChatGLM2模型使用

相关文章：

华为昇腾NPU卡 ChatGLM2模型使用

【机器学习】集成模型/集成学习：多个模型相结合实现更好的预测

如何提高广告投放转化率？Share Creators 资产库与Appsflyer营销数据的全面结合

《软件方法》2023版第1章（11）1.4.3 具体工作步骤

git将当前分支A强制推送远程分支pro上

【计算机基础】存储器

【LCR 159. 库存管理 III】

Android ADB 常见问题和注意事项

TCP/IP五元组

aiohttp ssl.SSLError: [SSL: SSLV3_ALERT_HANDSHAKE_FAILURE] 错误处理

分析RPA流程自动化的挑战和解决方案

我试图扯掉这条 SQL 的底裤。只能扯一点点，不能扯多了

LeNet（pytorch实现

Selenium获取百度百科旅游景点的InfoBox消息盒

springcloud笔记 (8) -网关 Gateway

【C++编程语言】STL常用算法算术生成和集合算法

解放双手：VMLogin自动化工具的高效便捷

深度解析网络代理技术及其在网络安全和爬虫应用中的关键作用

寻找二叉树的最低公共祖先节点

python网络爬虫（二）基本库的使用urllib/requests

网络编程（Modbus进阶）

＜6＞-MySQL表的增删查改

家政维修平台实战20：权限设计

DIY｜Mac 搭建 ESP-IDF 开发环境及编译小智 AI

使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台

初学 pytest 记录

深度学习习题2

python报错No module named ‘tensorflow.keras‘

C#中的CLR属性、依赖属性与附加属性

elementUI点击浏览table所选行数据查看文档