当前位置: 首页 > article >正文

LLM 本地部署框架 vLLM 和 LMDeploy

1. 安装vLLM的环境1.1 安装要求1. vLLM 包含预编译的 C 和 CUDA (12.8) 二进制文件。 2. 要求: 操作系统: Linux Python: 3.9 -- 3.12 # 实测推荐安装3.10以上版本 GPU: 计算能力 7.0 或更高 (例如, V100, T4, RTX20xx, A100, L4, H100 等) 查看详细的信息https://docs.vllm.com.cn/en/latest/getting_started/installation/gpu.html1.2 安装conda并创建python的虚拟环境# 1.安装conda环境 参照conda官网# https://www.anaconda.com/download/success# 2. 创建一个python的虚拟环境conda create-n[虚拟环境名称]python3.10# 指定python的版本号# 3.切换到虚拟环境# 可以使用 conda env list 查看所有的虚拟环境列表conda activate[虚拟环境名称]1.3 安装PyTorch# 官网上选择相应的版本# https://pytorch.org/get-started/locally/1.4 安装vLLM# 1.安装命令pip install vllm# 2.从Hugging Face 下载模型或者从魔塔社区下载建议从魔塔社区下载国内速度快下载地址https://www.modelscope.cn/models下载方式pip install modelscope使用SDK下载创建一个download.py 文件然后在服务器上执行#模型下载frommodelscopeimportsnapshot_download model_dirsnapshot_download(Qwen/Qwen3-0.6B,cache_dir/root/autodl-tmp/llm/Qwen/Qwen3-0.6B)# 指定模型的存放位置启动vLLM# 启动vLLMvllm serve /root/autodl-tmp/llm/Qwen/Qwen3-0.6B# serve 后面跟本地模型存放的绝对路径测试fromopenaiimportOpenAI clinetOpenAI(base_urlhttp://localhost:23333/v1/,api_key1231231)# 注意查看启动后的web 访问的端口号 api_key 不能为空可以随便填resclient.chat.completions.create(model/root/autodl-tmp/llm/Qwen/Qwen3-0.6B# 本地的模型的路径绝对路径messages[{role:user,content:请介绍下一下什么是大模型}])2. 安装LMDeploy与vLLM的安装基本一致2.1 创建虚拟环境安装lmdeployconda create-n lmdeploy python3.10-y conda activate lmdeploy pip install lmdeploy2.2 启动lmdeploy serve api_server/root/autodl-tmp/llm/Qwen/Qwen3-0.6B# 调用本地的模型测试与vLLM一样只是端口号不同

相关文章:

LLM 本地部署框架 vLLM 和 LMDeploy

1. 安装vLLM的环境 1.1 安装要求 1. vLLM 包含预编译的 C 和 CUDA (12.8) 二进制文件。 2. 要求: 操作系统: LinuxPython: 3.9 -- 3.12 # (实测:推荐安装3.10以上版本)GPU: 计算能力 7.0 或更高 (例如, V100, T4, RTX20xx, A100, L4, H100 等…...

液冷及前沿散热技术的理论分析:从宏观系统到芯片级散热的范式跃迁

🎓作者简介:科技自媒体优质创作者 🌐个人主页:莱歌数字-CSDN博客 211、985硕士,从业16年 从事结构设计、热设计、售前、产品设计、项目管理等工作,涉足消费电子、新能源、医疗设备、制药信息化、核工业等…...

读写场景下的锁选择策略

数据库加锁场景及锁类型选择指南 数据库加锁的核心目标是解决并发事务下的数据一致性问题,防止出现脏读、不可重复读、幻读等异常。锁的选择与应用场景紧密相关,主要取决于操作类型、数据访问模式、事务隔离级别以及数据库引擎的特性。以下通过具体场景…...

3步掌握Windows字体优化:Better ClearType Tuner完整使用指南

3步掌握Windows字体优化:Better ClearType Tuner完整使用指南 【免费下载链接】BetterClearTypeTuner A better way to configure ClearType font smoothing on Windows 10. 项目地址: https://gitcode.com/gh_mirrors/be/BetterClearTypeTuner 你是否曾经在…...

歌词滚动姬:5分钟掌握专业级歌词制作的艺术

歌词滚动姬:5分钟掌握专业级歌词制作的艺术 【免费下载链接】lrc-maker 歌词滚动姬|可能是你所能见到的最好用的歌词制作工具 项目地址: https://gitcode.com/gh_mirrors/lr/lrc-maker 歌词滚动姬(LRC Maker)是一款完全免费…...

3步解锁CPU隐藏性能:CPUDoc智能调度实战指南

3步解锁CPU隐藏性能:CPUDoc智能调度实战指南 【免费下载链接】CPUDoc 项目地址: https://gitcode.com/gh_mirrors/cp/CPUDoc 对于追求极致性能的PC用户来说,CPU调度优化一直是个技术难题。传统方法要么过于复杂,要么效果有限。CPUDoc…...

TV Bro电视浏览器:彻底解决Android电视上网难题的完美方案

TV Bro电视浏览器:彻底解决Android电视上网难题的完美方案 【免费下载链接】tv-bro Simple web browser for android optimized to use with TV remote 项目地址: https://gitcode.com/gh_mirrors/tv/tv-bro 你是否曾经尝试在智能电视上浏览网页,…...

DeepSeek / GLM / Kimi 网页只能聊天?这个 Star 500+ 的开源工具,直接一键把网页变 API

👉 这是一个或许对你有用的社群🐱 一对一交流/面试小册/简历优化/求职解惑,欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料: 《项目实战(视频)》:从书中学,往事上…...

告别手动抢号烦恼:Python健康160自动挂号完整指南

告别手动抢号烦恼:Python健康160自动挂号完整指南 【免费下载链接】health160 健康160自动挂号脚本,用魔法对抗魔法,禁止商用🖖 项目地址: https://gitcode.com/gh_mirrors/he/health160 还在为每次打开医院预约网站都看到…...

Proxmox-Arm64:ARM架构企业级虚拟化的技术突破与实现

Proxmox-Arm64:ARM架构企业级虚拟化的技术突破与实现 【免费下载链接】Proxmox-Arm64 Proxmox VE & PBS unofficial arm64 version 项目地址: https://gitcode.com/gh_mirrors/pr/Proxmox-Arm64 随着ARM64架构在服务器、边缘计算和嵌入式领域的快速普及&…...

5分钟完成Switch注入:TegraRcmGUI终极图形化工具完整指南

5分钟完成Switch注入:TegraRcmGUI终极图形化工具完整指南 【免费下载链接】TegraRcmGUI C GUI for TegraRcmSmash (Fuse Gele exploit for Nintendo Switch) 项目地址: https://gitcode.com/gh_mirrors/te/TegraRcmGUI Switch注入对于许多Nintendo Switch用户…...

终极指南:Commit Message Emoji 让每次提交都充满仪式感

终极指南:Commit Message Emoji 让每次提交都充满仪式感 【免费下载链接】commit-message-emoji Every commit is important. So lets celebrate each and every commit with a corresponding emoji! :smile: 项目地址: https://gitcode.com/gh_mirrors/co/commit…...

Monocle投票系统实现原理:构建高效的帖子排名算法

Monocle投票系统实现原理:构建高效的帖子排名算法 【免费下载链接】monocle Link and news sharing 项目地址: https://gitcode.com/gh_mirrors/mon/monocle Monocle是一个功能强大的链接和新闻聚合平台,其核心功能之一就是智能投票排名系统。这篇…...

Driver Store Explorer:Windows驱动清理与系统优化的终极指南

Driver Store Explorer:Windows驱动清理与系统优化的终极指南 【免费下载链接】DriverStoreExplorer Driver Store Explorer 项目地址: https://gitcode.com/gh_mirrors/dr/DriverStoreExplorer 你是否曾经发现C盘空间莫名减少?是否遇到过驱动程序…...

探索NHSE:解锁动物森友会存档编辑的终极解决方案

探索NHSE:解锁动物森友会存档编辑的终极解决方案 【免费下载链接】NHSE Animal Crossing: New Horizons save editor 项目地址: https://gitcode.com/gh_mirrors/nh/NHSE 你是否曾经在《动物森友会》中为收集稀有物品而苦恼?是否梦想打造一个完美…...

3个核心优势:用AI智能体彻底解放你的桌面生产力

3个核心优势:用AI智能体彻底解放你的桌面生产力 【免费下载链接】UI-TARS-desktop The Open-Source Multimodal AI Agent Stack: Connecting Cutting-Edge AI Models and Agent Infra 项目地址: https://gitcode.com/GitHub_Trending/ui/UI-TARS-desktop 在数…...

FModel终极指南:3步快速掌握游戏资源提取与创作应用

FModel终极指南:3步快速掌握游戏资源提取与创作应用 【免费下载链接】FModel Unreal Engine Archives Explorer 项目地址: https://gitcode.com/gh_mirrors/fm/FModel 你是否曾想过提取游戏中的精美模型、纹理和音频,用于自己的创作项目&#xff…...

eLabFTW电子实验室笔记本架构设计与Docker容器化部署指南

eLabFTW电子实验室笔记本架构设计与Docker容器化部署指南 【免费下载链接】elabftw :notebook: eLabFTW is the most popular open source electronic lab notebook for research labs. 项目地址: https://gitcode.com/gh_mirrors/el/elabftw eLabFTW作为开源电子实验室…...

告别多设备切换烦恼:Lan Mouse让你的键鼠轻松跨屏工作

告别多设备切换烦恼:Lan Mouse让你的键鼠轻松跨屏工作 【免费下载链接】lan-mouse mouse & keyboard sharing via LAN 项目地址: https://gitcode.com/gh_mirrors/la/lan-mouse 你是否经常在办公桌上摆着多台电脑,却要不断切换鼠标键盘&#…...

暗黑破坏神2角色编辑革命:Diablo Edit2如何彻底改变你的游戏体验

暗黑破坏神2角色编辑革命:Diablo Edit2如何彻底改变你的游戏体验 【免费下载链接】diablo_edit Diablo II Character editor. 项目地址: https://gitcode.com/gh_mirrors/di/diablo_edit 你是否曾因重复刷装备而疲惫,却依然无法获得心仪的属性组合…...

免费开源AMD Ryzen调试工具:SMUDebugTool完全指南与实用教程

免费开源AMD Ryzen调试工具:SMUDebugTool完全指南与实用教程 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: http…...

Super IO插件终极指南:Blender批量导入导出效率提升300%的完整实战方案

Super IO插件终极指南:Blender批量导入导出效率提升300%的完整实战方案 【免费下载链接】super_io blender addon for copy paste import / export 项目地址: https://gitcode.com/gh_mirrors/su/super_io 在3D创作工作流中,文件导入导出是每个设…...

微软下周更新 Office 应用:允许禁用 Copilot 浮动按钮,回应用户控制需求

Office 更新:禁用 Copilot 浮动按钮微软将于下周推出 Office 应用更新,此次更新允许用户禁用浮动的 Copilot 按钮。近几周,该按钮已出现在 Word、Excel 和 PowerPoint 中,悬浮在电子表格或文档的右下角,给用户带来了诸…...

实战指南:5个技巧高效部署BBS-Go开源社区平台

实战指南:5个技巧高效部署BBS-Go开源社区平台 【免费下载链接】bbs-go A lightweight community and Q&A platform for forums, knowledge bases, and discussions. 项目地址: https://gitcode.com/gh_mirrors/bb/bbs-go 想快速搭建一个功能完备的在线社…...

Wi-Wi:2026 年 NAB 展亮点,实现皮秒级时间同步与毫米级距离测量!

Wi-Wi:实现 1 纳秒级无线时间同步2026 年 5 月 19 日,在 NAB 展会上,能看到 [Wi-Wi STAMP] 的演示。Wi-Wi STAMP 是一种无线时间同步协议,源自日本国立信息通信技术研究所(NICT)。Wi-Wi 技术特点Wi-Wi 即 W…...

如何用5分钟让Windows任务栏变身?TranslucentTB零配置美化指南

如何用5分钟让Windows任务栏变身?TranslucentTB零配置美化指南 【免费下载链接】TranslucentTB A lightweight utility that makes the Windows taskbar translucent/transparent. 项目地址: https://gitcode.com/gh_mirrors/tr/TranslucentTB 你是否曾盯着W…...

Super IO:Blender剪贴板导入导出神器,让3D工作流效率翻倍

Super IO:Blender剪贴板导入导出神器,让3D工作流效率翻倍 【免费下载链接】super_io blender addon for copy paste import / export 项目地址: https://gitcode.com/gh_mirrors/su/super_io 你是否厌倦了在Blender中反复点击文件菜单、浏览文件夹…...

X-TRACK开源GPS自行车码表终极指南:从零构建你的智能骑行导航系统

X-TRACK开源GPS自行车码表终极指南:从零构建你的智能骑行导航系统 【免费下载链接】X-TRACK A GPS bicycle speedometer that supports offline maps and track recording 项目地址: https://gitcode.com/gh_mirrors/xt/X-TRACK X-TRACK是一款功能强大的开源…...

暗黑破坏神2终极宽屏体验:D2DX完全配置指南

暗黑破坏神2终极宽屏体验:D2DX完全配置指南 【免费下载链接】d2dx D2DX is a complete solution to make Diablo II run well on modern PCs, with high fps and better resolutions. 项目地址: https://gitcode.com/gh_mirrors/d2/d2dx 还在为经典暗黑破坏神…...

Webdash社区贡献指南:如何参与开源项目并开发优质插件

Webdash社区贡献指南:如何参与开源项目并开发优质插件 【免费下载链接】webdash 🔥 Orchestrate your web project with Webdash the customizable web dashboard 项目地址: https://gitcode.com/gh_mirrors/we/webdash Webdash作为一款可定制的W…...