当前位置：首页 > news >正文

本地部署体验LISA模型（LISA≈图像分割基础模型SAM+多模态大语言模型LLaVA）

news 2026/5/22 9:59:03

在这里插入图片描述

GitHub地址：https://github.com/dvlab-research/LISA
该项目论文paper reading：https://blog.csdn.net/Transfattyacids/article/details/132254770

在GitHub上下载源文件，进入下载的文件夹，打开该地址下的命令控制台，执行指令：

pip install -r requirements.txt
pip install flash-attn --no-build-isolation

几种报错解决方法：

下载包失败
例：“pip install numpy”
解决：“pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple/”
其他源：
清华： https://pypi.tuna.tsinghua.edu.cn/simple/
阿里云： http://mirrors.aliyun.com/pypi/simple/
豆瓣：https://pypi.doubanio.com/simple

安装包版本冲突
例：“tensorflow-intel 2.12.0 requires numpy<1.24,>=1.22, but you have numpy 1.24.2 which is incompatible.”
解决：带上具体版本号，如“pip install numpy==1.23”

就是下不下来
例： “ERROR: Could not build wheels for XXX, which is required to install pyproject.toml-based projects”
解决：去网站下安装包，“.whl”文件到本地安装，列几个下载网站：
https://download.pytorch.org/whl/
https://pypi.org/project

（除了这2个，法1中的3个源也可以使用）
（还是下不下来，去对应包的GitHub，下载对应版本的releases）
下载完后执行：pip install file_name.whl（file_name是绝对地址）

之前https://www.lfd.uci.edu/~gohlke/pythonlibs/也可以下载whl，现在点进去是这样的下不了了

4. 还有一个很奇怪的方法：conda install -c conda-forge XXX

下载预训练权重

如果想要自训练：

LLaVA：https://huggingface.co/decapoda-research
SAM：https://dl.fbaipublicfiles.com/segment_anything/sam_vit_h_4b8939.pth

直接使用提供的权重：

LISA：https://huggingface.co/xinlai

有6个版本
在这里插入图片描述
我下载了LISA-13B-llama2-v0-explanatory（别下这个，我当时是因为作者只发布了两个版本，才下的，后面没用上，要下就选择v1的版本，内存大的下13B，小的下7B）

在这里插入图片描述

要用梯子，大文件要使用LFS，git clone不能克隆需要LFS的文件，大文件我都是一个个单独下的（漫长的下载过程orz

记得修改chat.py里权重的地址（图中第20行）
在这里插入图片描述

运行chat.py

不出意料的报错了
在这里插入图片描述

模型加载不成功，应该归因于我过小的内存orz，借了一个云服务器

尝试运行的过程就是不断产生新的错误orz

这里不将遇到的报错一一罗列（太多太杂了），只展示遇到的最后两个error，uu们如果有其他问题可以在评论区提出了，我看到了且会解决的，就回复。

下面先展示一下我使用的云服务器的配置

虚拟机

显卡
python版本
torch和torchvision

ERORR_1：
原因： 我刚拿到时cuda版本（如图）与PyThorch不兼容
解决： 升级CUDA（以及driver）的版本

# 禁用现有NVIDIA驱动程序并卸载
sudo systemctl stop nvidia-persistenced
sudo systemctl stop nvidia-fabricmanager
sudo apt-get remove --purge '^nvidia-.*'
# 关闭xserver
systemctl stop gdm.service
# 下载对应的CUDA包
wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda_11.7.0_515.43.04_linux.run
# 安装（一路默认安装）
sudo sh cuda_11.7.0_515.43.04_linux.run
# 安装完毕后，启动X Server
systemctl start gdm.service

ERROR_2：
谁能想到还是报OutOfMemoryError了呢orz（我说怎么就给我用了呢）
超出内存一般有几种解决办法
1. 减少模型的大小: 可以考虑减少模型的大小，例如通过选择更小的模型、减少模型的层数或通道数等方式，来降低内存需求。
2. 减少批量大小：尝试减少输入数据的批量大小，降低每次前向计算所需的内存。可以尝试减小batch_size参数的值。
3. 释放不需要的显存：在某些情况下，可能存在一些不需要的显存被占用，可以使用torch.cuda.empty_cache() 来释放不需要的显存。
4. 启用混合精度训练：可以尝试启用混合精度训练，即使用半精度浮点数 (torch.float16 代替默认的单精度浮点数 (torch.float32。这可以显著降低内存使用，但可能会影响模型的训练效果。
5. 调整 PyTorch 内存管理设置：可以尝试调整 PyTorch 的内存管理设置，例如通过设置max_split_size_mb 来避免内存碎片化。可以在 PyTorch 的文档中查找有关内存管理和PYTORCH_CUDA_ALLOC_CONF 的详细信息。
进行如下改动：
1. 将13B模型替换为7B模型
2. model_max_length：512–>256；lora_r：8–>4
3. 训练精度：bf16–>fp16
4. load_in：8bit–>4bit
5. 设置max_split_size_mb
  进入batch文件（vim ~/.bashrc）
  添加：export PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:32
  esc、:wq、source ~/.bashrc

调整完后，终于是可以运行了
输入：

CUDA_VISIBLE_DEVICES=1 python chat.py --version='./LISA-7B-v1' --precision='fp16' --load_in_4bit

p.s. --version是你下载的模型地址，这里附上我项目目录
还有就是为了控制云服务器我使用的软件有：WinSCP（进行文件传输和代码修改）和PuTTY（命令行控制）

（下面是PuTTY运行截图)
在这里插入图片描述

根据提示输入propmt语句和待分割图片路径：

在这里插入图片描述

分割后的图像存储再了./vis_output文件夹中。

但是结果不正确，可能是调整了模型的缘故吧，没分割出LISA，分割出了ROSÉ

在这里插入图片描述

算了，这个模型就先到这里，等有再好一点的卡再试试，去读paper了。
在这里插入图片描述

本地部署体验LISA模型（LISA≈图像分割基础模型SAM+多模态大语言模型LLaVA）

GitHub地址：https://github.com/dvlab-research/LISA 该项目论文paper reading：https://blog.csdn.net/Transfattyacids/article/details/132254770 在GitHub上下载源文件，进入下载的文件夹，打开该地址下的命令控制台，…...

编程日记 2023/9/8 17:10:45

SpotBugs代码检查：instanceof总是返回true（BC_VACUOUS_INSTANCEOF）

https://spotbugs.readthedocs.io/en/latest/bugDescriptions.html#bc-instanceof-will-always-return-true-bc-vacuous-instanceof 使用instanceof判断的时候，总是返回true，除非被检测的结果是null。遇到这种告警，可能是写代码的人理解错误…...

编程日记 2023/9/8 17:09:43

Redis的Java客户端：Jedis入门

Jedis的优点在于方法名称和Redis命令基本一致，不过存在线程安全问题，在多线程操作时需要引入线程池。一、引入依赖  <dependency> <groupId>redis.clients</groupId> <artifactId>jedis</artifa…...

编程日记 2023/9/8 17:08:41

【完整代码】2023数学建模国赛C题代码--蔬菜类商品的自动定价与补货决策

C 题蔬菜类商品的自动定价与补货决策在生鲜商超中，一般蔬菜类商品的保鲜期都比较短，且品相随销售时间的增加而变差， 大部分品种如当日未售出，隔日就无法再售。因此，商超通常会根据各商品的历史销售和需求情况每天进…...

编程日记 2023/9/8 17:07:40

idea：java: Compilation failed: internal java compiler error

java: Compilation failed: internal java compiler error错误检查下面2个即可：...

编程日记 2023/9/8 17:06:39

普罗米修斯（Prometheus）

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、普罗米修斯（Prometheus）是什么？1.下载Prometheus工具（切记和操作系统版本对应）2.解压命令3.修改prom…...

编程日记 2023/9/8 17:05:37

JAVA面试题2012年版本

1、已知a10，b15,在不用第三方变量的情况下，将a、b的值调换? 2、Session容易丢值，cookie不安全，用什么可以代替它们? 3、简述多态的特征及意义 4、冒泡排序 5、已知int array[]{3,7,5,12,20};实现从大到小排序并返回数组输出…...

编程日记 2023/9/8 17:04:35

IED设备模型

IED设备模型 IED设备模型是指对工业电子设备进行详细描述和建模的模型。它的核心是通过设备的特性和功能来建立相应的数学模型，以便进行仿真、测试和优化等操作。建立IED设备模型需要遵循以下步骤：设备描述：首先需要详细描述设备的功能、特性、参数等信息，以便建立相应…...

编程日记 2023/9/8 17:03:34

HTTP代理如何设置

HTTP代理是一种非常重要的网络工具，它可以帮助我们在访问互联网时提高访问速度，保护用户隐私等等。在使用HTTP代理时，需要先进行设置。下面就来介绍一下HTTP代理如何设置。一、了解HTTP代理在开始设置HTTP代理之前，我们需要先了…...

编程日记 2023/9/8 17:02:33

【设计模式】单例设计模式

目录 1、前言 2、基本语法 2.1、懒汉式单例 2.2、饿汉式单例 2.3、双重检验锁单例模式 2.4、静态内部类单例模式 2.5、枚举单例模式 2.6、ThreadLocal单例模式 2.7、注册单例模式 3、使用场景 4、使用示例 5、常见问题 5、总结 1、前言单例模式是一种设计模式&…...

编程日记 2023/9/8 17:01:32

SpingBoot整合Sa-Token框架（1）

一、文档参考：框架介绍 (sa-token.cc) 框架生态——开源项目 (sa-token.cc) 二、与SpingBoot整合 1、创建项目在 IDE 中新建一个 SpringBoot 项目，例如：sa-token-demo-springboot（不会的同学请自行百度或者参考：Sp…...

编程日记 2023/9/8 17:00:32

软件测试技术题目大全【含答案】

请看下面你的测试职业发展是什么? 　测试经验越多，测试能力越高。所以我的职业发展是需要时间积累的，一步步向着高级测试工程师奔去。而且我也有初步的职业规划，前3年积累测试经验，按如何做好测试工程师的要点去要求自己&#x…...

编程日记 2023/9/8 16:59:30

C#__线程的优先级和状态控制

线程的优先级： 一个CPU同一时刻只能做一件事情，哪个线程优先级高哪个先运行，优先级相同看调度算法。在Thread类中的Priority属性（Highest,Above,Normal,BelowNormal,Lowest）可以影响线程的优先级关于…...

编程日记 2023/9/8 16:58:29

103.36.167.X在服务器删除、复制文件的时候会出现卡的情况，是什么原因？

服务器硬盘在删除文件或复制文件时出现卡顿情况可能有多种原因。以下是一些常见的问题和解决方法： 硬盘性能低下：如果服务器硬盘的读写速度较慢，可能会导致卡顿现象。解决方法可以是升级到更高性能的硬盘或者使用RAID技术提升硬盘读写速度。 …...

编程日记 2023/9/8 16:57:27

Vim 插件应用篇 vim-plug：简洁高效的Vim插件管理工具

用插件管理插件 Vim-plug介绍 Vim-plug 是一个Vim插件管理器，利用异步并行可以快速地安装、更新和卸载插件。它的安装和配置都非常简单，而且在操作过程中会给出很多易读的反馈信息，是一个自由、开源、速度非常快的、并行地安装或更新插件&a…...

编程日记 2023/9/8 16:56:25

springboot 请求https的私有证书验证

一、方案描述我这里采用RestTemplate的方式调用https请求，请求第三方接口获取数据，证书由第三方私自签发的证书，我们构建的是一个springboot的API项目。 1.pom文件引入jar <dependencies><dependency><groupId>org.spr…...

编程日记 2023/9/8 16:55:24

YOLO的基本原理详解

YOLO介绍 YOLO是一种新的目标检测方法。以前的目标检测方法通过重新利用分类器来执行检测。与先前的方案不同，将目标检测看作回归问题从空间上定位边界框（bounding box）并预测该框的类别概率。使用单个神经网络，在一次评估中直接…...

编程日记 2023/9/8 16:54:21

【UE 材质】制作飘动的旗帜

效果步骤 1. 首先在建模软件中创建一个平面，注意分段数一定要多 2. 在UE中创建一个材质，这里命名为“Mat_Flag” 打开“Mat_Flag”，先将旗帜纹理连接到基础颜色先选中导入的模型然后点击根据选中的模型预览材质创建如下节点可以看到此时模…...

编程日记 2023/9/8 16:53:20

windows苹果商店上架ipa（基于appuploader）

参考文章： 上传ipa到appstore详细步骤 1、苹果商店地址：https://appstoreconnect.apple.com/apps 2、创建我的app 使用hbuilderx或apicloud云打包后，会生成一个ipa文件，而iphone是无法直接安装这个ipa文件的，需要将这…...

编程日记 2023/9/8 16:52:18

什么是SpringCloud Eureka服务注册与发现

😀前言本篇博文是关于SpringCloud Eureka 介绍，希望你能够喜欢 🏠个人主页：晨犀主页 🧑个人简介：大家好，我是晨犀，希望我的文章可以帮助到大家，您的满意是我的动力&…...

编程日记 2023/9/8 16:51:16

智能停车系统告别拥堵！巨有科技让景区停车畅行无忧

每逢节假日，景区停车场便成了“重灾区”——入口大排长龙、场内找位半小时、缴费排队苦不堪言。这不仅严重消耗游客耐心，更直接拉低景区口碑与运营效率。在文旅消费持续回暖的今天，停车体验已成为衡量景区服务力的关键指标。巨有科技以数据驱…...

编程新知 2026/5/22 9:47:44

全面实战指南：如何高效部署ChatTTS-ui语音合成系统

全面实战指南：如何高效部署ChatTTS-ui语音合成系统【免费下载链接】ChatTTS-ui 一个简单的本地网页界面，使用ChatTTS将文字合成为语音，同时支持对外提供API接口。A simple native web interface that uses ChatTTS to synthesize text into …...

编程新知 2026/5/22 9:41:18

鸣潮自动化助手：5步轻松实现后台智能战斗与资源收集

鸣潮自动化助手：5步轻松实现后台智能战斗与资源收集【免费下载链接】ok-wuthering-waves 鸣潮后台自动战斗自动刷声骸一键日常 Automation for Wuthering Waves 项目地址: https://gitcode.com/GitHub_Trending/ok/ok-wuthering-waves 还在为每天重复刷声…...

编程新知 2026/5/22 9:04:34

SVM实战手记：从核函数选择到上线避坑的工程指南

1. 这不是数学课，是帮你把SVM用对、用稳、用出效果的实战手记你打开一篇SVM教程，三行之后就卡在“最大间隔超平面”“核函数映射到高维空间”“拉格朗日对偶问题”上——不是你基础差，是绝大多数资料从一开始就走错了路：它们把SVM…...

编程新知 2026/5/22 8:30:00

索尼IMX811如何重塑工业视觉与专业影像的边界

突破像素极限，定义成像新高度在影像技术飞速发展的今天，高分辨率始终是专业领域不懈追求的目标。索尼半导体解决方案公司重磅推出的IMX811中画幅CMOS图像传感器，以2.47亿有效像素的惊人规格，为行业带来了颠覆性的突破。这款传感器…...

编程新知 2026/5/22 8:12:57

短信验证码5大常见漏洞与防御实战

1. 这不是“绕过”，而是对验证码机制的深度体检你有没有遇到过这样的场景：在测试一个新上线的注册流程时，输入手机号、点击“获取验证码”，页面立刻弹出“验证码已发送成功”，但手机却迟迟没收到短信；再点一…...

编程新知 2026/5/22 8:10:49

SpinalHDL流水线设计：从时序抽象到工程实践

1. 项目概述：从Verilog的“线”到SpinalHDL的“流”在数字电路设计里，时序逻辑的流水线（Pipeline）是个老生常谈但又至关重要的概念。无论是为了提升系统主频，还是为了平衡组合逻辑路径的延迟，我们总免不了要…...

编程新知 2026/5/22 7:18:33

从CDP“3A”到千亿美元目标：联想集团的创新路径与AI原生转型

在全球产业链加速重构、人工智能技术范式快速迭代的背景下，中国企业的创新能力正成为各界关注的焦点。当被问及“哪些中国企业创新做得不错”时，有一家科技企业凭借其在绿色低碳、供应链协同以及混合式人工智能领域的系统性突破，给出了具有说…...

编程新知 2026/5/22 6:43:43

linux的逻辑卷管理（Logical Volume Manager）

在对磁盘进行分区大小规划时，有时往往不能确定这个分区要使用的总空间大小。而用fdisk对磁盘进行分区后，每个分区的大小就已经固定了，如果分区设置的过大，会白白浪费磁盘空间；分区设置的过小，就会导致空间不…...

编程新知 2026/5/22 6:01:34

xc-union 从 1.0.0 到 2.0.0：开源私域返利基座

618 拼的不只是流量，更是开发效率。每到大促节点，很多团队都会集中遇到同一类需求： 查券/导购工具要尽快上线H5 页面先跑，后端接口后续持续扩展要求可快速交付，也要支持后续二开问题是，如果从零开始手撸&…...

编程新知 2026/5/22 2:40:39

相关文章：