当前位置：首页 > news >正文

第八篇-Tesla P40+ChatGLM2+LoRA

news 文章来源：https://blog.csdn.net/hai4321/article/details/132072097 2025/5/4 12:35:33

部署环境

  系统：CentOS-7CPU: 14C28T显卡：Tesla P40 24G驱动: 515CUDA: 11.7cuDNN: 8.9.2.26

目的

验证P40部署可行性,只做验证学习lora方式微调

创建环境

conda create --name glm-tuning python=3.10
conda activate glm-tuning

克隆项目

git clone https://github.com/hiyouga/ChatGLM-Efficient-Tuning
cd ChatGLM-Efficient-Tuning

安装依赖

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

准备数据-少量测试-项目已提供分词好数据

准备数据
我们将下载好的数据集解压到 data 文件夹中，解压后的文件目录为：
data/
├── dataset_info.json
└── self_cognition/
├── dev.json
└── train.json
接下来，我们修改 dataset_info.json，增加以下两列内容，从而使训练框架能够识别自定义数据集。
测试dev.json与train.json一样的，生产环境需要分离,
"self_cognition_train": {"file_name": "self_cognition/train.json","columns": {"prompt": "content","query": "","response": "summary","history": ""}
},
"self_cognition_dev": {"file_name": "self_cognition/dev.json","columns": {"prompt": "content","query": "","response": "summary","history": ""}
}

微调代码调整

accelerate launch src/train_bash.py \--stage sft \--do_train \--model_name_or_path  /models/chatglm2-6b \--dataset self_cognition_train \--finetuning_type lora \--output_dir self_cognition_lora \--overwrite_cache \--per_device_train_batch_size 2 \--gradient_accumulation_steps 2 \--lr_scheduler_type cosine \--logging_steps 10 \--save_steps 1000 \--learning_rate 1e-3 \--num_train_epochs 2.0 \--lora_rank 32 \--ddp_find_unused_parameters False \--source_prefix 你现在是一名销售员，根据以下商品标签生成一段有吸引力的商品广告词。 \--plot_loss \--fp16

如果调整了数据集，要清理缓存，缓存目录如下
/root/.cache/huggingface/datasets

Tue Aug  1 10:45:02 2023
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 515.65.01    Driver Version: 515.65.01    CUDA Version: 11.7     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla P40           Off  | 00000000:03:00.0 Off |                    0 |
| N/A   61C    P0   184W / 250W |  13503MiB / 23040MiB |     94%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
{'train_runtime': 73.3871, 'train_samples_per_second': 2.18, 'train_steps_per_second': 0.545, 'train_loss': 1.7150115966796875, 'epoch': 2.0}                                    
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [01:13<00:00,  1.83s/it]***** train metrics *****epoch                    =        2.0train_loss               =      1.715train_runtime            = 0:01:13.38train_samples_per_second =       2.18train_steps_per_second   =      0.545

参数：参数根据自己硬件配置自己调整
温度：P40自己改个风冷散热，散热效果不好，奔着80度去了
显存：占用大概14G

模型测试

CUDA_VISIBLE_DEVICES=0 python src/cli_demo.py \--model_name_or_path  /models/chatglm2-6b \--checkpoint_dir self_cognition_lora

python src/web_demo.py --checkpoint_dir self_cognition_lora --model_name_or_path  /models/chatglm2-6b

Input: 你是谁
ChatGLM-6B: The dtype of attention mask (torch.int64) is not bool
我是AI小木,一个由小吕开发的人工智能助手,我可以回答各种问题,提供信息,甚至进行闲聊。

Input: 你是谁开发的
ChatGLM-6B: 我不是开发的,是由小吕开发的人工智能助手,旨在为用户提供有用的回答和帮助

总结

效果还行，我的参数都设置的比较小，速度挺快的2分钟，模型微调之后认识已经调整过来了
后面准备调整更大数据集，再做数据评测

–model_name_or_path /models/chatglm2-6b 注意指定

参考

https://hub.nuaa.cf/hiyouga/ChatGLM-Efficient-Tuning/blob/main/examples/ads_generation.md

第八篇-Tesla P40+ChatGLM2+LoRA

部署环境系统：CentOS-7CPU: 14C28T显卡：Tesla P40 24G驱动: 515CUDA: 11.7cuDNN: 8.9.2.26目的验证P40部署可行性,只做验证学习lora方式微调创建环境 conda create --name glm-tuning python3.10 conda activate glm-tuning克隆项目 git clone http…...

编程日记 2023/8/4 0:31:18

调用feign返回错误的数据

bug描述： 在一个请求方法中会调用到feign去获取其他的数据。 List<Demo> list aaaFeignApi.getData(personSelectGetParam);在调用的时候，打断点到feign的地方，数据是存在的，并且有15条。但是返回到上面代码的时候数据就…...

编程日记 2023/8/4 0:30:16

【Spring】（二）从零开始的 Spring 项目搭建与使用

文章目录前言一、Spring 项目的创建1.1 创建 Maven 项目1.2 添加 Spring 框架支持1.3 添加启动类二、储存 Bean 对象2.1 创建 Bean2.1 将 Bean 注册到 Spring 容器三、获取并使用 Bean 对象3.1 获取Spring 上下文3.2 ApplicationContext 和 BeanFactory 的区别3.3 获取指定的…...

编程日记 2023/8/4 0:29:14

redis五种数据类型介绍

、string（字符串） 它师最基本的类型，可以理解为Memcached一模一样的类型，一个key对应一个value。注意：一个键最大能存储 512MB。特性：可以包含任何数据,比如jpg图片或者序列化的对象,一个键最大能存储512…...

编程日记 2023/8/4 0:28:09

【JavaEE】Spring Boot - 项目的创建和使用

【JavaEE】Spring Boot 开发要点总结（1） 文章目录【JavaEE】Spring Boot 开发要点总结（1）1. Spring Boot 的优点2. Spring Boot 项目创建2.1 下载安装插件2.2 创建项目过程2.3 加载项目2.4 启动项目2.5 删除一些没用的文件 3. Sp…...

编程日记 2023/8/4 0:27:08

Git reset、revert用法

reset reset是删除之前的提交记录，所有的提交点都会被清除，我们看下执行前后的git log区别 D:\workspace\android>git log commit 87c1277a57544c53c603b04110e3dde100da8f57 (HEAD -> develop_main) Author: test <test.com> Date: Wed…...

编程日记 2023/8/4 0:26:06

Redis-1

Redis 理论部分 redis 速度快的原因 1、纯内存操作 2、单线程操作，避免了频繁的上下文切换和资源争用问题，多线程需要占用更多的 CPU 资源 3、采用了非阻塞 I/O 多路复用机制 4、提供了非常高效的数据结构，例如双向链表、压缩页表和跳跃…...

编程日记 2023/8/4 0:25:04

【Linux】Linux服务器连接百度网盘：实现上传下载

【Linux】Linux服务器连接百度网盘：实现上传下载文章目录【Linux】Linux服务器连接百度网盘：实现上传下载1. 前言2. 具体过程2.1 pip 安装所需包2.2 认证（第一次连接需要认证）2.3 下载所需文件或者目录2.4 其他指令使用2.5 注意…...

编程日记 2023/8/4 0:24:03

ADC模拟看门狗

如果被ADC转换的模拟电压低于低阀值或高于高阀值，AWD模拟看门狗状态位被设置。阀值位于ADC_HTR和ADC_LTR寄存器的最低12个有效位中。通过设置ADC_CR1寄存器的AWDIE位以允许产生相应中断。通过以下函数可以进行配置 void ADC_AnalogWatchdogCmd(ADC_TypeDef* ADCx…...

编程日记 2023/8/4 0:23:02

google谷歌gmail邮箱账号注册手机号无法进行验证怎么办?此电话号码无法用于进行验证或此电话号码验证次数太多

谷歌gmail邮箱账号注册手机号无法进行验证怎么办? 使用手机号码注册谷歌gmail邮箱账号时会遇到：此电话号码无法用于进行验证或此电话号码验证次数太多。造成注册google谷歌gmail邮箱账号受阻，无法正常完成注册。谷歌Gmail邮箱账号正确的注册方法与教…...

编程日记 2023/8/4 0:22:01

Spring：IOC技术、Bean、DI

前言 Spring是一个开源的项目，并不是单单的一个技术，发展至今已形成一种开发生态圈。也就是说我们可以完全使用Spring技术完成整个项目的构建、设计与开发。Spring是一个基于IOC和AOP的架构多层j2ee系统的架构。 SpringFramework：Spring框架…...

编程日记 2023/8/4 0:21:00

目标检测与跟踪（2）- YOLO V8配置与测试

系列文章目录第一章目标检测与跟踪 （1）- 机器人视觉与YOLO V8 目标检测与跟踪 （1）- 机器人视觉与YOLO V8_Techblog of HaoWANG的博客-CSDN博客3D物体实时检测、三维目标识别、6D位姿估计一直是机器人视觉领域的核心研究课题&a…...

编程日记 2023/8/4 0:19:58

【Leetcode】56.合并区间

一、题目 1、题目描述以数组 intervals 表示若干个区间的集合，其中单个区间为 intervals[i] = [ s t a r t i start_i start...

编程日记 2023/8/4 0:18:57

设置系统编码 Beta

在yolov5环境搭建过程中会遇到如下的编码错误警告： 这时，按住“ctrlc”中止进程，然后设置系统编码： 电脑右键属性打开： 重启之后等安装好了，记得回去把bae键取消。...

编程日记 2023/8/4 0:17:55

phpunit

composer地址：phpunit/phpunit - Packagist 官方文档:PHPUnit文档 – PHP测试框架 PHPUnit是一个框架，最为hyperf学习的补充学习，就不写这么细了。估计写下安装和使用，具体学习内容看文档。一、安装需安装扩展：…...

编程日记 2023/8/4 0:16:54

html学习9（脚本）

1、<script>标签用于定义客户端脚本，比如JavaScript，既可包含脚本语句，也可通过src属性指向外部文件。 2、JavaScript最常用于图片操作、表单验证及内容动图更新。 3、<noscript>标签用于在浏览器禁用脚本或浏览器不支持脚本&a…...

编程日记 2023/8/4 0:15:53

SpringBoot整合Caffeine

一、Caffeine介绍 1、缓存介绍缓存(Cache)在代码世界中无处不在。从底层的CPU多级缓存，到客户端的页面缓存，处处都存在着缓存的身影。缓存从本质上来说，是一种空间换时间的手段，通过对数据进行一定的空间安排，使得下…...

编程日记 2023/8/4 0:14:51

元宇宙虚拟展厅的特点是什么呢？优势有哪些？

元宇宙是一个很广阔的虚拟世界，它可以创造出更为丰富、沉浸式的体验，这种全新的体验为展览和艺术领域带来了更多的可能性，元宇宙虚拟展厅以其多样化、互动性、沉浸式展示的特点，带领大家进入一个虚拟现实的全新世界。元宇宙虚拟展…...

编程日记 2023/8/4 0:13:50

Day11-Webpack前端工程化开发

Webpack 一 webpack基本概念遇到问题开发中希望将文件分开来编写，比如CSS代码，可以分为头部尾部内容，公共的样式。 JS代码也希望拆分为多个文件，分别引入，以后代码比较好维护。本地图片，希望可以实现小图片不用访问后端，保存在前端代码中就可以了运行程序时我…...

编程日记 2023/8/4 0:12:50

什么是函数式编程，应用场景是什么

什么是函数式编程，应用场景是什么函数式编程和面向对象编程一样，是一种编程规范。强调执行的过程而非结果，通过一系列的嵌套的函数调用，完成一个运算过程。它主要有以下几个特点： 1.函数是"一等公民"&…...

编程日记 2023/8/4 0:11:47

Vue3之路由认识

回顾： 原来的vue2路由是通过this. r o u t e 和 t h i s . route和this. route和this.router来控制的。现在vue3有所变化，useRoute相当于以前的this. r o u t e ，而 u s e R o u t e r 相当于 t h i s . route，而useRouter相当于t…...

编程日记 2023/8/4 0:10:46

P1775 石子合并（弱化版）（内附封面）

石子合并（弱化版） 题目描述设有 N ( N ≤ 300 ) N(N \le 300) N(N≤300) 堆石子排成一排，其编号为 1 , 2 , 3 , ⋯ , N 1,2,3,\cdots,N 1,2,3,⋯,N。每堆石子有一定的质量 m i ( m i ≤ 1000 ) m_i\ (m_i \le 1000) mi (mi≤1000)。…...

编程日记 2023/8/4 0:09:44

jmeter之接口测试（http接口测试）

基础知识储备一、了解jmeter接口测试请求接口的原理客户端--发送一个请求动作--服务器响应--返回客户端客户端--发送一个请求动作--jmeter代理服务器---服务器--jmeter代理服务器--服务器二、了解基础接口知识： 1、什么是接口：前端与后台之间的…...

编程日记 2023/8/4 0:08:42

webpack基础知识二：说说webpack的构建流程?

一、运行流程 webpack 的运行流程是一个串行的过程，它的工作流程就是将各个插件串联起来在运行过程中会广播事件，插件只需要监听它所关心的事件，就能加入到这条webpack机制中，去改变webpack的运作，使得整个系统扩展…...

编程日记 2023/8/4 0:07:41

PHP使用PhpSpreadsheet实现导出Excel时带下拉框列表 (可支持三级联动)

因项目需要导出Excel表需要支持下拉且还需要支持三级联动功能目前应为PHPExcel 不在维护，固采用 PhpSpreadsheet 效果如图： 第一步：首先使用composer 获取PhpSpreadsheet 我这里PHP 版本 7.4 命令如下： composer r…...

编程日记 2023/8/4 0:06:39

Openssh高危漏洞CVE-2023-38408修复方案

0x01 漏洞简述 2023年07月21日，360CERT监测发现OpenSSH发布了OpenSSH的风险通告，漏洞编号为CVE-2023-38408，漏洞等级：高危，漏洞评分：8.1。 OpenSSH 是 Secure Shell (SSH) 协议的开源实现，提供…...

编程日记 2023/8/4 0:05:38

Android中的ContentProvider

Android中的ContentProvider 在Android中，ContentProvider是四大组件之一，用于在不同应用程序之间共享和管理数据。它提供了一种标准化的方式来访问和管理应用程序的数据，使得多个应用程序可以安全地共享数据，而无需直接访问彼此…...

编程日记 2023/8/4 0:04:38

if device is None and isinstance(net, torch.nn.Module):的含义？

这段代码的含义是，如果变量 device 为 None 并且 net 是 torch.nn.Module 的实例，那么执行后续的代码块。解释一下其中的几个部分： device：这是一个代表设备的变量，通常用于指定在哪个设备上执行模型的计算&#xff…...

编程日记 2023/8/4 0:03:36

C++如何用OpenCV中实现图像的边缘检测和轮廓提取？

最近有个项目需要做细孔定位和孔距测量，需要做边缘检测和轮廓提取，先看初步效果图： 主要实现代码： int MainWindow::Test() {// 2.9 单个像素长度um 5倍double dbUnit 2.9/(1000*5);// 定义显示窗口namedWindow("src"…...

编程日记 2023/8/4 0:02:35

智慧水务和物联网智能水表在农村供水工程中的应用

摘要：随着社会的进步和各项事业的飞速发展，人民生活水平的逐步提升，国家对农村饮水安全有了更高的要求，为了进一步提升农村供水服务的质量，利用现代化、信息化科学技术提升农村供水服务质量，提高用水管理效…...

编程日记 2023/8/4 0:01:33