当前位置: 首页 > article >正文

Qwen3.5-9B-AWQ-4bit VMware虚拟机安装Ubuntu及GPU环境配置

Qwen3.5-9B-AWQ-4bit VMware虚拟机安装Ubuntu及GPU环境配置1. 准备工作在开始之前我们需要确认几个关键事项主机硬件配置确保你的物理机至少16GB内存推荐32GB并配备NVIDIA GPU支持CUDA软件准备下载最新版VMware Workstation Pro16.x或17.x和Ubuntu 22.04 LTS镜像磁盘空间建议预留至少50GB空间用于虚拟机为什么选择Ubuntu 22.04这是目前最稳定的Linux发行版之一对NVIDIA驱动和CUDA支持良好也是大多数AI框架官方推荐的系统版本。2. 创建VMware虚拟机2.1 新建虚拟机打开VMware Workstation点击创建新的虚拟机选择自定义(高级)配置硬件兼容性选择最新版本如Workstation 17.x选择稍后安装操作系统客户机操作系统选择Linux版本选择Ubuntu 64位2.2 配置虚拟机参数处理器至少4核推荐8核开启虚拟化VT-x/AMD-V内存分配至少12GB16GB更佳网络建议使用NAT模式磁盘创建新虚拟磁盘容量50GB选择将虚拟磁盘拆分成多个文件其他移除不必要的硬件如USB控制器、声卡重要提示在自定义硬件中记得添加一个虚拟TPM 2.0模块用于Ubuntu 22.04的安全启动。3. 安装Ubuntu系统3.1 启动安装挂载下载的Ubuntu 22.04 ISO镜像启动虚拟机选择Install Ubuntu语言选择English或其他你偏好的语言选择Minimal installation和Install third-party software3.2 磁盘分区建议采用以下分区方案以50GB磁盘为例EFI系统分区512MB交换空间物理内存的1.5倍如16GB内存则分配24GB根分区剩余所有空间ext4文件系统3.3 完成安装设置用户名和密码后等待安装完成并重启。首次登录后立即运行系统更新sudo apt update sudo apt upgrade -y4. 安装VMware ToolsVMware Tools能显著提升虚拟机性能特别是图形和文件共享功能sudo apt install open-vm-tools open-vm-tools-desktop -y sudo reboot安装完成后你应该能调整虚拟机窗口大小自动适应在主机和虚拟机间复制粘贴启用共享文件夹功能5. GPU环境配置5.1 启用GPU直通PCIe Passthrough前提条件主机支持VT-d/AMD-Vi技术BIOS中已启用相关选项主机有备用GPU或集成显卡配置步骤关闭虚拟机编辑.vmx配置文件添加pciPassthru.use64bitMMIO TRUE pciPassthru.64bitMMIOSizeGB 32在VMware中为虚拟机添加PCI设备你的NVIDIA GPU启动虚拟机检查GPU是否识别lspci | grep -i nvidia5.2 安装NVIDIA驱动如果无法直通GPU可以使用VMware的虚拟GPUsudo ubuntu-drivers autoinstall sudo reboot验证驱动安装nvidia-smi5.3 安装CUDA Toolkit推荐安装CUDA 12.1wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600 sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/3bf863cc.pub sudo add-apt-repository deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/ / sudo apt-get update sudo apt-get -y install cuda-12-1添加环境变量到~/.bashrcexport PATH/usr/local/cuda-12.1/bin${PATH::${PATH}} export LD_LIBRARY_PATH/usr/local/cuda-12.1/lib64${LD_LIBRARY_PATH::${LD_LIBRARY_PATH}}5.4 安装Docker和NVIDIA Container Toolkitsudo apt install docker.io -y sudo systemctl enable --now docker sudo usermod -aG docker $USER newgrp docker # 安装NVIDIA Container Toolkit distribution$(. /etc/os-release;echo $ID$VERSION_ID) \ curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \ curl -fsSL https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | \ sed s#deb https://#deb [signed-by/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g | \ sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list sudo apt-get update sudo apt-get install -y nvidia-container-toolkit sudo nvidia-ctk runtime configure --runtimedocker sudo systemctl restart docker验证安装docker run --rm --gpus all nvidia/cuda:12.1-base nvidia-smi6. 部署Qwen3.5-9B-AWQ-4bit现在环境已经准备就绪可以部署Qwen3.5模型了docker pull qwenllm/qwen:cu121 docker run -it --rm --gpus all -p 8000:8000 qwenllm/qwen:cu121 python -m vllm.entrypoints.api_server --model Qwen/Qwen1.5-9B-Chat-AWQ --quantization awq --trust-remote-code访问http://localhost:8000/docs即可使用API接口。7. 常见问题解决7.1 GPU直通失败如果lspci能看到GPU但nvidia-smi报错尝试sudo nano /etc/modprobe.d/blacklist.conf添加blacklist nouveau options nouveau modeset0然后sudo update-initramfs -u sudo reboot7.2 CUDA版本冲突如果遇到CUDA版本问题可以sudo apt install cuda-toolkit-12-1 sudo update-alternatives --config cuda7.3 Docker权限问题如果docker命令需要sudo确保sudo usermod -aG docker $USER newgrp docker8. 总结与建议整个安装过程大概需要1-2小时取决于你的网络速度和硬件性能。实际用下来VMware虚拟机中的GPU性能大约是物理机的70-80%对于开发和测试Qwen3.5这样的模型已经足够。建议定期更新驱动和CUDA版本保持环境最新。如果遇到性能瓶颈可以考虑直接使用物理机安装Ubuntu或者尝试Proxmox等更专业的虚拟化方案。对于生产环境还是推荐使用物理服务器或云GPU实例但作为开发测试环境这套VMware方案既灵活又方便能很好地满足日常AI模型开发和调试需求。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

相关文章:

Qwen3.5-9B-AWQ-4bit VMware虚拟机安装Ubuntu及GPU环境配置

Qwen3.5-9B-AWQ-4bit VMware虚拟机安装Ubuntu及GPU环境配置 1. 准备工作 在开始之前,我们需要确认几个关键事项: 主机硬件配置:确保你的物理机至少16GB内存(推荐32GB),并配备NVIDIA GPU(支持…...

LFM2.5-1.2B-Thinking-GGUF效果对比:Thinking中间过程vs后处理终版答案差异

LFM2.5-1.2B-Thinking-GGUF效果对比:Thinking中间过程vs后处理终版答案差异 1. 模型概述 LFM2.5-1.2B-Thinking-GGUF是Liquid AI推出的轻量级文本生成模型,特别适合在资源受限的环境中快速部署和使用。该模型采用GGUF格式,通过内置的llama.…...

Ostrakon-VL-8B多实例负载均衡部署:应对高并发访问的策略

Ostrakon-VL-8B多实例负载均衡部署:应对高并发访问的策略 1. 引言 你有没有遇到过这种情况?自己辛苦部署好的AI模型,平时用着挺顺,可一旦用户量突然上来,或者搞个线上活动,服务就卡得不行,甚至…...

G-Helper:华硕笔记本性能调校的终极解决方案

G-Helper:华硕笔记本性能调校的终极解决方案 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Strix, Scar, and o…...

大厂飞手技术栈拆解:从CAAC执照到无人机“机长”的技术成长路径

一、核心事件:大厂飞手成为“技术蓝领”新标杆2026年,低空经济正式进入规模化运营阶段。美团无人机单日配送突破10万单,京东物流无人机覆盖全国超2000个村镇。根据猎聘大数据研究院发布的《2026中国低空经济人才发展报告》,低空经…...

记一次综合型流量分析 | 添柴不加火游

核心摘要:这篇文章能帮你 ?? 1. 彻底搞懂条件分支与循环的适用场景,告别选择困难。 ?? 2. 掌握遍历DOM集合修改属性的标准姿势与性能窍门。 ?? 3. 识别流程控制中的常见“坑”,并学会如何优雅地绕过去。 ?? 主要内容脉络 ?? 一、痛…...

重构联盟营销合作伙伴 ROI:除了销售额,这 3 个指标才是增长晴雨表

在营销领域,你对各种指标早已习以为常:它们决定预算投放方向、验证活动成效、帮助你做更聪明的增长决策。但当这些理念切换到“合作伙伴营销”(Partner Marketing)或“渠道增长计划”时,许多团队却只盯着一个指标&…...

.NET源码生成器基于partial范式开发和nuget打包嚷

1 安装与初始化 # 全局安装 OpenSpec npm install -g fission-ai/openspeclatest # 在项目目录下初始化 cd /path/to/your-project openspec init 初始化时,OpenSpec 会提示你选择使用的 AI 工具(Claude Code、Cursor、Trae、Qoder 等)。 3 O…...

FreeRTOS实时操作系统核心特性与开发实践

1. FreeRTOS 系统概述FreeRTOS作为当前嵌入式领域最流行的实时操作系统之一,已经服务全球开发者超过18年。我第一次接触这个系统是在2015年开发工业控制器时,当时需要在STM32F103上实现多任务调度。相比裸机开发,FreeRTOS提供的任务管理机制让…...

2026年AI Agent客服问答助手知识难题破局

一、前言 许多企业上线的智能问答系统效果不佳,准确率不足70%,问题不在于技术不行,而在于用错了方法。当前系统普遍存在“知识看不懂、上下文记不住、回答靠碰运气”的问题,导致体验差、难落地。 2026年,真正有效的智能…...

Cursor功能解锁与开发效率提升技术指南

Cursor功能解锁与开发效率提升技术指南 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your trial request limit. / Too m…...

突破4大下载瓶颈:开源工具如何让云存储速度提升500%

突破4大下载瓶颈:开源工具如何让云存储速度提升500% 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云…...

C++ STL 容器线程安全问题分析

C STL容器线程安全问题分析 在多线程编程中,C标准模板库(STL)容器的高效使用一直是开发者关注的焦点。STL容器在设计之初并未充分考虑线程安全性,这使得在多线程环境下直接使用容器可能引发数据竞争、内存错误等问题。本文将深入…...

2.2MySQL 在电商全链路中的高频应用场景

2.2MySQL 在电商全链路中的高频应用场景 开篇:为什么电商行业90%的业务数据都存在MySQL里 我第一次接触电商数据时,公司用的是Oracle,听说一年授权费几百万。后来跳槽到一家创业公司,用的是MySQL,免费、轻量、跑得也挺…...

2.1SQL 学习:先懂数据库概念再学 SQL

2.1SQL 学习:先懂数据库概念再学 SQL 开篇:为什么学SQL前要先搞懂数据库概念 我入行第一年,领导丢给我一个数据库账号,说“去把昨天的订单数据查出来”。我打开Navicat,看到左边一长串陌生的表名,完全不知道…...

AMA-SAM:用于高保真组织学细胞核分割的对抗性多域对齐万物分割模型/文献速递-多模态医学影像最新进展

2026.4.8本文提出了AMA-SAM框架,通过引入条件梯度反转层(CGRL)实现鲁棒的多域对齐,并设计高分辨率解码器(HR-Decoder)以保留精细细节,从而增强了万物分割模型(SAM)在高分…...

广告生成工作流平替工具

针对企业宣发的合规痛点,OhYesAI整合元婴、可灵等自选渲染引擎。系统以原生闭环生成替代多工具拼接工作流,输出支持商业授权的音画资产,旨在从底层规避版权确权风险。OhYesAI 架构深度解析:品牌宣传中原生合规引擎如何替代离散拼接…...

如何让网易云音乐链接永不失效?直链解析API的秘密

如何让网易云音乐链接永不失效?直链解析API的秘密 【免费下载链接】netease-cloud-music-api 网易云音乐直链解析 API 项目地址: https://gitcode.com/gh_mirrors/ne/netease-cloud-music-api 你是否曾经遇到过这样的场景:精心收藏的网易云音乐歌…...

打印机驱动怎么下载?靠谱渠道推荐,轻松解决安装难题

在日常家用、办公打印场景中,打印机驱动失效、安装失败、设备无法识别是最常见的问题。绝大多数用户的核心困扰,就是不清楚打印机驱动怎么下载,盲目在网络上搜索后,要么下载到不兼容的驱动,要么碰到捆绑软件、恶意程序…...

计算机毕业设计:Python全国气象智能分析平台 Django框架 可视化 随机森林 爬虫 中国天气网 机器学习 深度学习(建议收藏)✅

博主介绍:✌全网粉丝50W,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业项目实战8年之久,选择我们就是选择放心、选择安心毕业✌ > 🍅想要获取完整文章或者源码,或者代做,拉到文章底部即可与…...

感应电机与异步电机定子匝间短路的仿真研究——基于MATLAB Simulink

感应电机 异步电机定子匝间短路仿真 matlab simulink啪嗒一声按下启动键,车间里那台老旧的异步电机突然发出刺耳的蜂鸣声。作为设备维护的老油条,我抄起万用表就往定子绕组上怼——果然,又是该死的匝间短路在作妖。这玩意就像电机的心脏早搏&…...

扩散模型对抗样本经典baselines凶

一、简化查询 1. 先看一下查询的例子 /// /// 账户获取服务 /// /// /// public class AccountGetService(AccountTable table, IShadowBuilder builder) {private readonly SqlSource _source new(builder.DataSource);private readonly IParamQuery _accountQuery build…...

(29)UGameInstance 、UGameInstanceSubsystem 与 UGameState 的区别,一言

(52)接着:(53) 谢谢...

Agentic AI 深度解析:当人工智能学会“动手”

从“回答问题”到“完成任务”,Agentic AI 正在重新定义人工智能的边界。它不是“更大的聊天机器人”,而是能够自主规划、调用工具、执行多步任务并持续迭代的智能体系统。一、什么是 Agentic AI?——重新定义“智能” Agentic AI&#xff08…...

松下FP-XH伺服控制程序与上下料整套程序

松下FP-XH伺服控制程序,上下料整套程序。拆开松下FP-XH控制柜的瞬间,伺服电机特有的青轴色编码线格外显眼。这套老牌PLC在运动控制领域依然能打,今天咱们就扒一扒它的伺服控制实战——特别是上下料这种既要精度又要效率的活。硬件搭台控制箱里…...

拓朋A50Ex自组网防爆对讲机,守护矿山救援队安全通讯

在深邃复杂的矿山巷道,安全与沟通是每位救援队员与作业人员最为关心的两大要素。在这样一片黑暗而充满挑战的天地里,拓朋A50Ex自组网防爆对讲机以其出色的性能,悄然成为了矿山救援队的隐形守护者。 无惧复杂环境,沟通无阻 矿山内部…...

拒绝“无效代码式”护肤:基于皮肤生理学的 2026 正确护肤顺序指南

拒绝“无效代码式”护肤:基于皮肤生理学的 2026 正确护肤顺序指南 作者:预颜美历 关键词:皮肤屏障、渗透路径、早C晚A、精准护肤、算法优化 0x00 前言:你的护肤逻辑是否存在“逻辑漏洞”? 在开发中,Bug 往往…...

OmniDB:现代化多数据库管理平台的架构演进与生产实践

OmniDB:现代化多数据库管理平台的架构演进与生产实践 【免费下载链接】OmniDB Web tool for database management 项目地址: https://gitcode.com/gh_mirrors/om/OmniDB 在当今数据驱动的技术环境中,数据库管理已成为开发团队和运维工程师面临的核…...

SimpleFOC源码学习03(v2.3.2) - 时间工具模块time_utils.cpp与time_utils.h

前言github源码:https://github.com/simplefoc/Arduino-FOC/tree/master/src/common 为什么需要time_utils.cpp与time_util.h? 在电机控制中,时间非常重要: PID 控制器需要知道"距上次运行过了多久"(dt&…...

为什么83%的PHP项目AI检测失败:深度拆解Tokenization偏差、框架上下文缺失与Composer依赖盲区

第一章:PHP AI代码检测的现状与核心挑战当前,PHP作为全球广泛部署的Web后端语言,其生态中存在大量历史遗留代码、动态类型特性及弱类型隐式转换机制,为AI驱动的静态/动态代码检测带来了独特复杂性。主流工具链(如PHPSt…...