当前位置：首页 > news >正文

基于华为昇腾910B，实战InternLM个人小助手认知微调

news 2026/2/10 17:09:10

本文将带领大家基于华为云 ModelArts，使用 XTuner 单卡微调一个 InternLM 个人小助手。

开源链接：（欢迎 star）

https://github.com/InternLM/InternLM

https://github.com/InternLM/xtuner

XTuner 简介

XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。 常用命令****如下：

查看帮助

xtuner help

查看版本

xtuner version

列出所有预定义配置文件

xtuner list-cfg

列出包含指定名称的预定义配置文件

xtuner list-cfg -p $NAME

xtuner list-cfg 命令用于列出内置的所有配置文件。参数 -p 或 --pattern 表示模式匹配，后面跟着的内容将会在所有的配置文件里进行模糊匹配搜索，然后返回最有可能的内容。

复制配置文件

xtuner copy-cfg $CONFIG $SAVE_PATH

xtuner copy-cfg 命令用于复制一个内置的配置文件。该命令需要两个参数：CONFIG 代表需要复制的配置文件名称，SAVE_PATH 代表复制的目标路径。

执行微调训练

xtuner train $CONFIG

xtuner train 命令用于启动模型微调进程。该命令需要一个参数：CONFIG 用于指定微调配置文件。

将 pth 格式的模型文件转换成 HuggingFace 格式的模型

xtuner convert pth_to_hf $CONFIG $PATH_TO_PTH_MODEL $SAVE_PATH_TO_HF_MODEL

xtuner convert pth_to_hf 命令用于进行模型格式转换。该命令需要三个参数：CONFIG 表示微调的配置文件； PATH_TO_PTH_MODEL 表示微调的模型权重文件路径，即要转换的模型权重；SAVE_PATH_TO_HF_MODEL 表示转换后的 HuggingFace 格式文件的保存路径。

华为云资源选择

模块：【华为云】-【控制台】-【AI开发平台ModelArts】-【开发空间】-【Notebook】

镜像：pytorch_2.1.0-cann_8.0.rc1-py_3.9-euler_2.10.7-aarch64-snt9b
在这里插入图片描述

类型：【Ascend】

规格：【Ascend: 1*ascend-snt9b2|ARM: 24核 192GB】

磁盘规格：按需即可

在这里插入图片描述

安装环境

安装依赖

pip install einops
pip install accelerate
pip install dlinfer-ascend
pip install deepspeed
pip install loguru

安装 XTuner

git clone -b v0.1.23 https://github.com/InternLM/xtuner
git clone -b v0.1.23 https://gitee.com/InternLM/xtuner #github 不行的话用这条
cd xtuner

安装之前修改一个文件，路径：xtuner/tools/model_converters/merge.py

parser.add_argument('--device',default='npu',choices=('cuda', 'cpu', 'auto','npu'),help='Indicate the device')  # choices里面添加一个'npu',也可以把default直接改成npu

然后安装

pip install -e .

模型准备

创建目录

mkdir -p /home/ma-user/work/work_dir/
cd /home/ma-user/work/work_dir/

下载模型

使用 Huggingface-cli 方式下载，设置 hf-mirros 环境变量

export HF_ENDPOINT=https://hf-mirror.com

下载模型

huggingface-cli download --resume-download internlm/internlm2-chat-1_8b --local-dir /home/ma-user/work/model/internlm2-chat-1_8b

微调前的模型对话

cli_demo.py 代码

import torch
from transformers import AutoTokenizer, AutoModelForCausalLMmodel_name_or_path = "/home/ma-user/work/model/internlm2-chat-1_8b"  # 模型所在的本地路径tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, trust_remote_code=True, device_map='npu')
model = AutoModelForCausalLM.from_pretrained(model_name_or_path, trust_remote_code=True, torch_dtype=torch.bfloat16, device_map='npu')
model = model.eval()system_prompt = """You are an AI assistant whose name is InternLM (书生·浦语).
- InternLM (书生·浦语) is a conversational language model that is developed by Shanghai AI Laboratory (上海人工智能实验室). It is designed to be helpful, honest, and harmless.
- InternLM (书生·浦语) can understand and communicate fluently in the language chosen by the user such as English and 中文.
"""messages = [(system_prompt, '')]print("=============Welcome to InternLM chatbot, type 'exit' to exit.=============")while True:input_text = input("\nUser  >>> ")input_text = input_text.replace(' ', '')if input_text == "exit":breaklength = 0for response, _ in model.stream_chat(tokenizer, input_text, messages):if response is not None:print(response[length:], flush=True, end="")length = len(response)

执行代码

python cli_demo.py

运行结果

在这里插入图片描述

微调

准备数据文件

cd /home/ma-user/work/work_dir/
mkdir -p datas
touch datas/assistant.json

创建一个脚本准备数据（xtuner_generate_assistant.py）

创建准备数据脚本

vim xtuner_generate_assistant.py

脚本内容如下：

import json# 设置用户的名字
name = 'JeffDing同志'
# 设置需要重复添加的数据次数
n = 8000# 初始化数据
data = [{"conversation": [{"input": "请介绍一下你自己", "output": "我是{}的小助手，内在是上海AI实验室书生·浦语的1.8B大模型哦".format(name)}]},{"conversation": [{"input": "你在实战营做什么", "output": "我在这里帮助{}完成XTuner微调个人小助手的任务".format(name)}]}
]# 通过循环，将初始化的对话数据重复添加到data列表中
for i in range(n):data.append(data[0])data.append(data[1])# 将data列表中的数据写入到'datas/assistant.json'文件中
with open('datas/assistant.json', 'w', encoding='utf-8') as f:# 使用json.dump方法将数据以JSON格式写入文件# ensure_ascii=False 确保中文字符正常显示# indent=4 使得文件内容格式化，便于阅读json.dump(data, f, ensure_ascii=False, indent=4)

将对应的 name 进行修改（在第 4 行的位置）

- name = 'JeffDing同志'
+ name = "你自己的名称"

生成微调数据

python xtuner_generate_assistant.py

准备配置文件

列出支持的配置文件

xtuner list-cfg -p internlm2

复制配置文件

xtuner copy-cfg internlm2_chat_1_8b_qlora_alpaca_e3 .

修改配置文件

主要修改地方如下：

########################################################################                          PART 1  Settings                           ########################################################################
- pretrained_model_name_or_path = 'internlm/internlm2-chat-1_8b'
+ pretrained_model_name_or_path = '/home/ma-user/work/model/internlm2-chat-1_8b'- alpaca_en_path = 'tatsu-lab/alpaca'
+ alpaca_en_path = 'datas/assistant.json'evaluation_inputs = [
-    '请给我介绍五个上海的景点', 'Please tell me five scenic spots in Shanghai'
+    '请介绍一下你自己', 'Please introduce yourself']
########################################################################                      PART 3  Dataset & Dataloader                   ########################################################################
alpaca_en = dict(type=process_hf_dataset,
-   dataset=dict(type=load_dataset, path=alpaca_en_path),
+   dataset=dict(type=load_dataset, path='json', data_files=dict(train=alpaca_en_path)),tokenizer=tokenizer,max_length=max_length,
-   dataset_map_fn=alpaca_map_fn,
+   dataset_map_fn=None,template_map_fn=dict(type=template_map_fn_factory, template=prompt_template),remove_unused_columns=True,shuffle_before_pack=True,pack_to_max_length=pack_to_max_length,use_varlen_attn=use_varlen_attn)

注意代码块里前面标+、-号的行，分别代表添加和去除。另外在 NPU上微调还需要去掉以下这段：

#######################################################################
#                      PART 2  Model & Tokenizer                      #
#######################################################################- quantization_config=dict(
-            type=BitsAndBytesConfig,
-            load_in_4bit=True,
-            load_in_8bit=False,
-            llm_int8_threshold=6.0,
-            llm_int8_has_fp16_weight=False,
-            bnb_4bit_compute_dtype=torch.float16,
-            bnb_4bit_use_double_quant=True,
-            bnb_4bit_quant_type='nf4')

需要去掉这一段的原因：使用这段会出现一个情况，量化这个操作好像不支持 NPU，会报错找不到 GPU。

启动微调

xtuner train ./internlm2_chat_1_8b_qlora_alpaca_e3_copy.py

微调启动时 NPU 的使用情况，使用 npu-smi info 命令查看

在这里插入图片描述

模型格式转换

pth_file=`ls -t ./work_dirs/internlm2_chat_1_8b_qlora_alpaca_e3_copy/*.pth | head -n 1`
xtuner convert pth_to_hf ./internlm2_chat_1_8b_qlora_alpaca_e3_copy.py ${pth_file} ./hf

模型合并

xtuner convert merge /home/ma-user/work/model/internlm2-chat-1_8b ./hf ./merged --max-shard-size 2GB --device npu

执行微调后的 demo

修改 cli_demo.py 里面模型路径为 /home/ma-user/work/work_dir/merged

- model_name_or_path = "/home/ma-user/work/model/internlm2-chat-1_8b"  # 模型所在的本地路径
+ model_name_or_path = "/home/ma-user/work/work_dir/merged"  # 模型所在的本地路径

执行代码

python cli_demo.ppy

运行结果

hard-size 2GB --device npu


### 执行微调后的 demo修改 `cli_demo.py` 里面模型路径为 `/home/ma-user/work/work_dir/merged````Python
- model_name_or_path = "/home/ma-user/work/model/internlm2-chat-1_8b"  # 模型所在的本地路径
+ model_name_or_path = "/home/ma-user/work/work_dir/merged"  # 模型所在的本地路径

执行代码

python cli_demo.ppy

运行结果

在这里插入图片描述

基于华为昇腾910B，实战InternLM个人小助手认知微调

本文将带领大家基于华为云 ModelArts，使用 XTuner 单卡微调一个 InternLM 个人小助手。开源链接：（欢迎 star） https://github.com/InternLM/InternLM https://github.com/InternLM/xtuner XTuner 简介 XTuner 是一个高效、灵…...

编程日记 2024/11/29 10:14:43

Electron文件写入、读取（作用：公共全局变量，本地存储）

Electron文件写入、读取（作用：公共全局变量，本地存储） 使用Node.js的fs模块也可以直接使用Node.js的fs模块来实现本地文件的读写操作 // electron/main.jsconst fs require(fs);// 写入文件localhost.txt fs.writeFileSync(lo…...

编程日记 2024/11/29 10:12:38

水体分割检测包含YOLOV，COCO，VOC三种标记的数据集包含 857张图片

说明水体分割检测指的是利用深度学习模型进行水体区域的分割和检测。YOLO（You Only Look Once）是一种流行的实时目标检测算法，其主要特点是速度快，适合于实时场景下的目标检测。在水体分割检测中，可以使用YOLO算法来…...

编程日记 2024/11/29 10:10:32

Harbor安装、HTTPS配置、修改端口后不可访问？

Harbor安装、HTTPS配置、修改端口后不可访问？ 大家好，我是秋意零。今天分享Harbor相关内容，安装部分可完全参考官方文档，写的也比较详细。安装Harbor 官方文档：https://goharbor.io/docs/2.12.0/install-config/ …...

编程日记 2024/11/29 10:07:28

正定矩阵（Positive Definite Matrix）的定义与性质

正定矩阵（Positive Definite Matrix）的定义与性质正定矩阵在优化、机器学习、信号处理等领域中有广泛应用。以下是其定义、几何解释及性质。 1. 定义一个 n n n \times n nn 的实对称矩阵 A A A 是正定矩阵，当且仅当它满足以下等价条…...

编程日记 2024/11/29 10:05:26

React与Ant Design入门指南

创建基于React框架使用Ant Design组件库的技术文档时，我们需要涵盖从安装到使用的各个关键步骤。以下是一份简化的技术文档草稿，它旨在帮助开发者快速上手并开始构建界面。 React与Ant Design入门指南 1. 简介 Ant Design是一个致力于提供企业级UI设计…...

编程日记 2024/11/29 10:04:24

MAC卸载Vmware Fusion后无法再安装解决方案执行脚本 sudo rm -rf /Library/Application Support/VMware/VMware Fusion sudo rm -rf /Library/Application Support/VMware/Usbarb.rules sudo rm -rf /Library/Application Support/VMware Fusion sudo rm -rf /Library/Prefe…...

编程日记 2024/11/29 9:56:15

单点登录深入详解之技术方案总结

技术方案之CAS认证概述 CAS 是耶鲁大学的开源项目，宗旨是为 web 应用系统提供一种可靠的单点登录解决方案。 CAS 从安全性角度来考虑设计，用户在 CAS 输入用户名和密码之后通过ticket进行认证，能够有效防止密码泄露。 CAS 广泛使用于传统应…...

编程日记 2024/11/29 9:54:11

数据库(MySQL黑马)

基础篇 MySQL概述数据库概述数据库相关概念主流的关系型数据库管理系统 MySQL数据库的安装与启动下载：MySQL :: MySQL Community Downloads 安装步骤 MySQL―8.0.40超详细保姆级安装教程_mysql8.0.40安装教程-CSDN博客文章浏览阅读1k次。_mysql8.0.40安装教…...

编程日记 2024/11/29 9:53:09

HTML5+JavaScript实现消消乐游戏

HTML5JavaScript实现消消乐游戏点击两个相邻的方块来交换它们位置。如果交换后形成三个或更多相同图案的方块连成一线，这些方块会被消除。消除后，上方的方块会下落填补空缺，顶部会生成新的方块。每消除一个方块得10分。例如&#xff0…...

编程日记 2024/11/29 9:51:05

sin函数拟合

目录一、目的... 1 二、模型设计... 1 2.1 输入与输出.... 1 2.2 隐藏层设计.... 1 2.3 优化算法与损失函数.... 1 2.4 神经网络结构.... 1 三、训练... 1 3.1 数据生成.... 2 3.2 训练过程.... 2 3.3 训练参数与设置.... 2 四、测试与分析... 2 4.1 选取不同激活函数....…...

编程日记 2024/11/29 9:46:59

设置Mysql5.6允许外网访问

设置mysql用户支持外网访问步骤： 需要使用root权限登录mysql，更新mysql.user表，设置指定用户的Host字段为%，默认一般为127.0.0.1或者localhost。 1.登录数据库 1 mysql -u root -p 输入密码 1 mysql> use mysql; 2.查询hos…...

编程日记 2024/11/29 9:44:57

【随笔】一次JS和python中的MD5加密的记录

// 使用CryptoJS进行MD5加密和Base64编码 const sign CryptoJS.enc.Base64.stringify(CryptoJS.enc.Utf8.parse(CryptoJS.MD5(sign2encrypt).toString()));上面这段JS和下面这个python等价 def hash_and_encode(input_string):sign2encrypt input_string# 使用 hashlib 进行 …...

编程日记 2024/11/29 9:42:54

力扣二叉树的中序遍历

用了递归遍历，关于树的经典例题。题目递归常规做法即递归了，不会写也得背下来。递归可以大致理解方法调用自身，先写中序遍历递归的方法，递归一定要有递归出口，当遍历到节点为空时返回，即已经找到了。…...

编程日记 2024/11/29 9:41:46

uniapp学习（010-3 实现H5和安卓打包上线）

零基础入门uniapp Vue3组合式API版本到咸虾米壁纸项目实战，开发打包微信小程序、抖音小程序、H5、安卓APP客户端等总时长 23:40:00 共116P 此文章包含第114p-116p的内容文章目录 H5配置文件设置开始打包上传代码安卓设置模拟器启动设置基础配置设置图标启动界面…...

编程日记 2024/11/29 9:39:41

基于DHCP，ACL的通信

该问题为华为的学习资料 1.首先把所有的PC机全部设置为DHCP 2.配置地址 3.ospf 4.dhcp 5.acl AR1 dhcp en interface GigabitEthernet0/0/0ip address 192.168.1.254 255.255.255.0 dhcp select global interface GigabitEthernet0/0/1ip address 10.1.12.1 255.255.255.…...

编程日记 2024/11/29 9:37:36

金融租赁系统助力企业升级与风险管理的新篇章

内容概要在当今的商业环境中，“金融租赁系统”可谓是企业成功的秘密武器。简单来说，这个系统就像一位聪明的财务顾问，帮助企业在资金和资源的运用上达到最优化。从设备采购到项目融资，它提供了一种灵活的方式，让企业…...

编程日记 2024/11/29 9:34:33

linux安装部署mysql资料

安装虚拟机等待检查完成选择中文软件选择网络和主机名开始安装设置root密码 ADH-password 创建用户等待安装完成重启接受许可证 Centos 7 64安装完成安装mysql开始 Putty连接指定服务器在 opt目录下新建download目录将mysql文件传到该目录下查看linux服务器的…...

编程日记 2024/11/29 9:30:29

深入理解 MongoDB：一款灵活高效的 NoSQL 数据库

在现代应用程序开发中，数据存储技术已经从传统的关系型数据库（RDBMS）扩展到多样化的 NoSQL 数据库。MongoDB 作为一款广泛使用的文档型数据库，以其灵活性、高性能和易用性成为开发者的首选之一。本篇博文将从 MongoDB 的核心概念、…...

编程日记 2024/11/29 9:29:23

爆改老旧笔记本---将笔记本改造为家用linux服务器

爆改老旧笔记本---将笔记本改造为家用linux服务器 linux启动盘制作镜像文件分区类型:MBR分区和GPT分区的定义MBR分区（Master Boot Record）GPT分区（GUID Partition Table）应用场景和优势MBR的应用场景和优势GPT的应用场景和优势 Li…...

编程日记 2024/11/29 9:24:10

在软件开发中正确使用MySQL日期时间类型的深度解析

在日常软件开发场景中，时间信息的存储是底层且核心的需求。从金融交易的精确记账时间、用户操作的行为日志，到供应链系统的物流节点时间戳，时间数据的准确性直接决定业务逻辑的可靠性。MySQL作为主流关系型数据库，其日期时间类型的…...

编程新知 2025/10/16 13:22:06

RocketMQ延迟消息机制

两种延迟消息 RocketMQ中提供了两种延迟消息机制指定固定的延迟级别通过在Message中设定一个MessageDelayLevel参数，对应18个预设的延迟级别指定时间点的延迟级别通过在Message中设定一个DeliverTimeMS指定一个Long类型表示的具体时间点。到了时间点后&#xf…...

编程新知 2026/2/10 7:12:07

MFC内存泄露

1、泄露代码示例 void X::SetApplicationBtn() {CMFCRibbonApplicationButton* pBtn GetApplicationButton();// 获取 Ribbon Bar 指针// 创建自定义按钮CCustomRibbonAppButton* pCustomButton new CCustomRibbonAppButton();pCustomButton->SetImage(IDB_BITMAP_Jdp26)…...

编程新知 2026/2/10 4:35:17

Java如何权衡是使用无序的数组还是有序的数组

在 Java 中，选择有序数组还是无序数组取决于具体场景的性能需求与操作特点。以下是关键权衡因素及决策指南： ⚖️ 核心权衡维度维度有序数组无序数组查询性能二分查找 O(log n) ✅线性扫描 O(n) ❌插入/删除需移位维护顺序 O(n) ❌直接操作尾部 O(1) ✅内存开销与无序数组相…...

编程新知 2025/8/3 11:17:37

ESP32读取DHT11温湿度数据

芯片：ESP32 环境：Arduino 一、安装DHT11传感器库红框的库，别安装错了二、代码注意，DATA口要连接在D15上 #include "DHT.h" // 包含DHT库#define DHTPIN 15 // 定义DHT11数据引脚连接到ESP32的GPIO15 #define D…...

编程新知 2026/1/30 8:46:45