当前位置: 首页 > article >正文

Phi-3.5-mini-instruct部署教程:Ubuntu 22.04 + RTX 4090 D完整环境搭建步骤

Phi-3.5-mini-instruct部署教程Ubuntu 22.04 RTX 4090 D完整环境搭建步骤1. 模型简介Phi-3.5-mini-instruct是微软推出的轻量级开源指令微调大模型在长上下文代码理解RepoQA、多语言MMLU等基准测试中表现优异显著超越同规模模型部分任务甚至能与更大模型媲美。该模型特别适合本地或边缘部署在RTX 4090单卡上显存占用仅约7GB。2. 环境准备2.1 硬件要求GPU: NVIDIA GeForce RTX 4090 D (23GB VRAM)显存占用: 约7.7GB存储空间: 至少15GB可用空间2.2 软件要求操作系统: Ubuntu 22.04 LTSCUDA版本: 12.1Python版本: 3.103. 基础环境安装3.1 安装NVIDIA驱动sudo apt update sudo apt install -y nvidia-driver-535 sudo reboot3.2 安装CUDA Toolkitwget https://developer.download.nvidia.com/compute/cuda/12.1.0/local_installers/cuda_12.1.0_530.30.02_linux.run sudo sh cuda_12.1.0_530.30.02_linux.run3.3 安装Minicondawget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh bash Miniconda3-latest-Linux-x86_64.sh source ~/.bashrc4. 项目部署4.1 创建Conda环境conda create -n torch28 python3.10 -y conda activate torch284.2 安装依赖包pip install torch2.8.0cu121 --index-url https://download.pytorch.org/whl/cu121 pip install transformers4.57.6 gradio6.6.0 protobuf7.34.14.3 下载模型mkdir -p /root/ai-models/AI-ModelScope cd /root/ai-models/AI-ModelScope git clone https://huggingface.co/microsoft/Phi-3.5-mini-instruct5. 服务配置5.1 创建项目目录mkdir -p /root/Phi-3.5-mini-instruct/logs5.2 创建WebUI脚本创建/root/Phi-3.5-mini-instruct/webui.py文件内容如下from transformers import AutoModelForCausalLM, AutoTokenizer import gradio as gr import torch model_path /root/ai-models/AI-ModelScope/Phi-3___5-mini-instruct tokenizer AutoTokenizer.from_pretrained(model_path) model AutoModelForCausalLM.from_pretrained( model_path, torch_dtypetorch.float16, device_mapauto ) def generate(prompt, max_length256, temperature0.3, top_p0.8, top_k20, repetition_penalty1.1): inputs tokenizer(prompt, return_tensorspt).to(cuda) outputs model.generate( **inputs, max_lengthmax_length, temperaturetemperature, top_ptop_p, top_ktop_k, repetition_penaltyrepetition_penalty, use_cacheFalse # 解决DynamicCache bug ) return tokenizer.decode(outputs[0], skip_special_tokensTrue) iface gr.Interface( fngenerate, inputs[ gr.Textbox(labelPrompt), gr.Slider(32, 1024, value256, labelMax Length), gr.Slider(0.1, 1.0, value0.3, labelTemperature), gr.Slider(0.1, 1.0, value0.8, labelTop P), gr.Slider(1, 100, value20, labelTop K), gr.Slider(1.0, 2.0, value1.1, labelRepetition Penalty) ], outputstext, titlePhi-3.5-mini-instruct Demo ) iface.launch(server_name0.0.0.0, server_port7860)5.3 配置Supervisor创建/etc/supervisor/conf.d/phi-3.5-mini-instruct.conf文件[program:phi-3.5-mini-instruct] command/opt/miniconda3/envs/torch28/bin/python /root/Phi-3.5-mini-instruct/webui.py directory/root/Phi-3.5-mini-instruct userroot autostarttrue autorestarttrue stdout_logfile/root/Phi-3.5-mini-instruct/logs/phi35.log stderr_logfile/root/Phi-3.5-mini-instruct/logs/phi35.err environmentPATH/opt/miniconda3/envs/torch28/bin:%(ENV_PATH)s更新Supervisor配置sudo supervisorctl reread sudo supervisorctl update6. 服务管理6.1 启动服务sudo supervisorctl start phi-3.5-mini-instruct6.2 查看服务状态sudo supervisorctl status phi-3.5-mini-instruct6.3 查看日志tail -f /root/Phi-3.5-mini-instruct/logs/phi35.log7. 使用指南7.1 访问Web界面服务启动后通过浏览器访问http://服务器IP:78607.2 API调用示例curl -X POST http://localhost:7860/gradio_api/call/generate \ -H Content-Type: application/json \ -d {data:[Hello,256,0.3,0.8,20,1.1]}7.3 参数说明参数默认值说明max_length256最大生成长度temperature0.3温度越低越确定top_p0.8核采样概率top_k20Top-k采样repetition_penalty1.1重复惩罚8. 常见问题解决8.1 transformers 5.5.0 Bug问题: transformers 5.5.0存在DynamicCache bug导致生成时报错DynamicCache object has no attribute seen_tokens解决方案:降级transformers:pip install transformers5.0.0在生成时添加参数:use_cacheFalse8.2 GPU未被使用检查CUDA是否可用:python -c import torch; print(torch.cuda.is_available())8.3 端口冲突检查7860端口占用情况:ss -tlnp | grep 78609. 总结本教程详细介绍了在Ubuntu 22.04系统上使用RTX 4090 D显卡部署Phi-3.5-mini-instruct模型的完整步骤。该模型轻量高效特别适合本地开发和边缘计算场景。通过Gradio提供的Web界面用户可以方便地与模型交互也可以直接调用API进行集成开发。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

相关文章:

Phi-3.5-mini-instruct部署教程:Ubuntu 22.04 + RTX 4090 D完整环境搭建步骤

Phi-3.5-mini-instruct部署教程:Ubuntu 22.04 RTX 4090 D完整环境搭建步骤 1. 模型简介 Phi-3.5-mini-instruct是微软推出的轻量级开源指令微调大模型,在长上下文代码理解(RepoQA)、多语言MMLU等基准测试中表现优异&#xff0c…...

避坑指南:ISP图像调试中那些‘奇怪’问题的来源与解法(DPC坏点、LSC暗角、Color Shading)

避坑指南:ISP图像调试中那些‘奇怪’问题的来源与解法 在摄像头模组量产或项目集成阶段,工程师们常常会遇到一些看似"奇怪"的图像质量问题——固定位置的坏点、画面四周莫名偏暗或偏色、白平衡突然失准。这些问题往往不是单一因素导致&#xf…...

祝贺电影《萨法》《一个男人的画像》《多幸运遇见你》荣获2026亚洲艺术电影节提名

祝贺电影《萨法》(孟加拉),《一个男人的画像》和《多幸运遇见你》荣获2026亚洲艺术电影节提名。 祝贺导演马克苏德•侯赛因提名先锋浪潮单元最佳导演; 祝贺导演侯光明提名先锋浪潮单元最佳导演; 祝贺演员梅哈扎比恩•乔…...

ClamAV扫U盘太慢?教你3个高级参数和正则排除法,让Ubuntu病毒扫描效率翻倍

ClamAV扫描效率优化实战:3个高级参数与正则排除法深度解析 每次插入U盘后等待ClamAV慢悠悠地完成全盘扫描,看着进度条像蜗牛爬行一样前进,是不是让你抓狂?作为Linux系统管理员,我经历过太多这样的煎熬时刻。直到发现那…...

Autosar E2E保护机制深度解析:从P01配置参数到车载网络实战避坑指南

Autosar E2E保护机制实战精要:参数配置逻辑与车载网络容错设计 在汽车电子系统向域集中式架构演进的过程中,车载网络的可靠性与功能安全成为关键挑战。当安全关键信号(如刹车指令、转向角度)通过CAN FD或以太网传输时,…...

权限模型演进:从RBAC到ABAC的实战解析与选型指南

1. 权限模型基础:为什么我们需要RBAC和ABAC? 想象一下你管理着一栋写字楼,每天有上千人进出。如果给每个人单独配钥匙(直接分配权限),不仅管理成本高,而且一旦有人离职就要换锁。这就是早期ACL&…...

火绒+SFC命令,给你的Win10系统做一次免费“体检”和“修复”

火绒SFC命令:Win10系统深度维护与健康修复指南 在数字时代,电脑系统的稳定性如同人体的免疫力——平时不易察觉其重要性,一旦出现问题却可能引发连锁反应。许多用户在清理完流氓软件后常陷入新的焦虑:系统文件是否已被破坏&#x…...

实战复盘:用Passware Kit Forensic搞定盘古石杯NAS取证,离线提取Windows密码真就这么简单?

数字取证竞赛实战:Passware Kit与Hashcat的离线密码提取艺术 在CTF和数字取证竞赛的战场上,离线密码提取往往是决定胜负的关键环节。2023年盘古石杯等赛事中,参赛者频繁面对从Windows系统、加密容器到iOS备份等多种场景的密码破解挑战。本文将…...

大厂AI抢人大战,从实习生开始

衡宇 发自 凹非寺量子位 | 公众号 QbitAI全球AI人才争夺战已进入白热化阶段,头部科技企业纷纷祭出高薪顶级算力的组合拳,争抢最顶尖的AI技术人才。量子位了解到,即便是实习生,国内头部厂开出的年薪也已突破百万大关。这个数字令人…...

本地 AI Agent 实战:大模型自动写代码、查文档、执行命令全套流程

目录 前言 1 本地 AI Agent 权威定义与核心能力边界 1.1 本地 AI Agent 学术 & 工程定义 1.2 本地 AI Agent 核心实战能力(本文实战覆盖全部) 1.3 本地 Agent vs 云端 Agent 核心优势 2 本地 AI Agent 整体运行总闭环(实战底层原理…...

第01篇:Power BI 简介与环境搭建

第01篇:Power BI 简介与环境搭建 1. 什么是 Power BI Power BI 是微软推出的一套商业智能(Business Intelligence,BI)工具,帮助用户将原始数据转化为直观的交互式报表和仪表板。它由三个核心组件构成: 组…...

专业的离子风枪哪个公司好

在电子制造、半导体、汽车涂装等工业场景中,静电吸附灰尘、击穿元件等问题直接影响产品质量与生产效率,离子风枪作为高效静电消除设备,其品牌选择至关重要。行业调研显示,约60%的静电故障源于设备选型不当,因此需从技术…...

如何快速配置FlexASIO:面向初学者的完整指南

如何快速配置FlexASIO:面向初学者的完整指南 【免费下载链接】FlexASIO A flexible universal ASIO driver that uses the PortAudio sound I/O library. Supports WASAPI (shared and exclusive), KS, DirectSound and MME. 项目地址: https://gitcode.com/gh_mi…...

微小型电磁流量计

说到微小型电磁流量计,不知道大家对于这个名词是怎么想的,现在最常见的两种理解是微小流量的电磁流量计,另外一种是比较小的电磁流量计,小编个人观点还是微小流量,因为体型的话是最好解决的问题,而流量则不…...

好写作AI的硕士毕业论文功能:一篇论文的“学术对话”该怎么写?

你有没有过这种体验:当你把初稿交给导师后,得到的反馈不是“哪里写错了”,而是整段阅读后的那个表情——和一句意味深长的“你再想想”。不是你的论文有硬伤,而是它缺少一个硕士论文应该有的东西: 学术对话的能力。 …...

没想到!原来本科论文还能这样写?好写作AI“通关秘籍”公开

先问你一个问题:假设距离交初稿还有3天,你打开文档,标题写着《毕业论文初稿》,下面一片空白。脑子里只有一个念头——该从哪里写? 这个时候你最需要的不是“文采”,而是一张清晰的地图,明确告诉…...

别再硬刚onnx安装报错了!试试这个‘先降版本再装工具’的万能思路

从onnx安装报错到通用解法:Python依赖管理的降维打击策略 当你在终端输入pip install -U onnx-simplifier --user后,屏幕上突然跳出一堆红色错误信息——这种场景对Python开发者来说再熟悉不过。大多数人会本能地开始复制错误信息去搜索引擎寻找答案&…...

一篇论文要过的“双重关卡”,好写作AI帮你一次通关

先问你一个扎心的问题:你的初稿查重率下来了,AI率却上去了;降重成功的那段话,被标成了“高度疑似AI”。这是很多2026届毕业生都在经历的噩梦。 问题出在哪?“降重”和“降AIGC”,完全是两回事。 降重的核…...

猪齿鱼:实现table分页勾选

一、需求1、表格分页勾选二、效果图三、代码1、index.tsximport React, { useEffect, useMemo } from react; import { useRef, useState } from react; import {Modal,Button,message,DataSet,useDataSet,Form,TextArea,Lov,Table,TextField,Icon,Spin, } from choerodon-ui/p…...

如果要开始搭自己的 Agent 工作流,第一批最值得接入的工具到底有哪些?

如果要开始搭自己的 Agent 工作流,第一批最值得接入的工具到底有哪些?很多人一开始搭 Agent,最容易陷入的误区不是模型选错,而是工具接得太多、太杂、太早。结果看起来像在搭系统,实际却把复杂度先堆起来了。当前大家聊…...

技术深度解析:genshin-impact-script图像识别自动化框架架构剖析

技术深度解析:genshin-impact-script图像识别自动化框架架构剖析 【免费下载链接】genshin-impact-script 原神脚本,包含自动钓鱼、自动拾取、自动跳过对话等多项实用功能。A Genshin Impact script includes many useful features such as automatic fi…...

高效解密:如何利用自动化工具恢复遗忘的压缩包密码

高效解密:如何利用自动化工具恢复遗忘的压缩包密码 【免费下载链接】ArchivePasswordTestTool 利用7zip测试压缩包的功能 对加密压缩包进行自动化测试密码 项目地址: https://gitcode.com/gh_mirrors/ar/ArchivePasswordTestTool 在日常工作中,我…...

被遗忘的80%:大模型爆火后,为何企业都在疯狂“洗”文档?

最近在和不少企业客户交流时,大家不约而同地提到一个现象:非结构化知识文档的数据治理,突然成了今年最火爆、最刚性的需求。很多做数据平台的朋友甚至感叹:“搞了十年数据治理,过去大家只盯着数据库里的那20%的结构化数…...

【嵌入式C与轻量级大模型适配实战指南】:20年老司机亲授7类高频报错的根因定位与秒级修复法

[https://intelliparadigm.com](https://intelliparadigm.com)第一章:嵌入式C与轻量级大模型适配的底层约束全景图嵌入式系统运行轻量级大模型(如TinyLlama、Phi-3-mini、Qwen2-0.5B-Int4)时,C语言作为主开发语言,需直…...

ESXi 给 Windows Server 2008 虚拟机添加磁盘教程

一、前言在虚拟化运维场景中,经常需要为 Windows Server 2008 R2 虚拟机扩容或新增数据盘。本文基于 VMware ESXi 环境,手把手教你:ESXi 端添加虚拟硬盘 → Windows Server 2008 系统内初始化磁盘 → 分区格式化,全程图文、一步到…...

GEO从入门到精通:第3章 意图词研究

第3章 意图词研究本章导语做GEO,很多团队一开始就急着发内容。账号开了,文章写了,FAQ补了,案例也上了,过一段时间回头看,品牌还是没有稳定进入答案。问题往往出在起点。用户真正会问什么,没有研…...

用MATLAB的Phased Array Toolbox快速上手:从常规脉冲到相位编码雷达的波形生成与可视化

MATLAB Phased Array Toolbox实战:从基础脉冲到相位编码雷达的波形生成与可视化 雷达工程师们常说:"波形设计是雷达系统的灵魂。"在MATLAB的Phased Array Toolbox中,这句话得到了完美印证。当我第一次打开这个工具箱时,…...

问卷设计对比实测:传统耗时易错 vs 虎贲等考 AI 一键生成,学术调研效率翻倍

每到课程论文、毕业论文、调研课题阶段,问卷设计与数据分析就成了最让学生头疼的环节。传统问卷要么题目不专业、维度不清晰,要么信效度不达标、数据无法分析;普通问卷工具只能收集数据,不会学术设计,更无法自动生成适…...

2026山东大学项目实训4月23日

V7 阶段我主要负责整体版本目标设计、范围收敛和阶段验收把控。到 V6 为止,项目已经能够完成 GitHub OAuth 授权、仓库绑定、Webhook 诊断和基础审查闭环,但如果从真实使用的角度去看,系统还缺少一个很重要的能力,就是“出问题之后…...

【国家级数字农场认证方案】:基于Docker 27的传感器数据容器化架构设计——含NIST可追溯日志、GDPR兼容采集模板与OTA升级容器

第一章:【国家级数字农场认证方案】的总体架构与合规性基线国家级数字农场认证方案以“可验证、可追溯、可扩展、可监管”为设计原点,构建覆盖数据采集层、边缘计算层、云平台服务层及监管协同层的四层融合架构。该架构严格遵循《GB/T 39721-2020 智慧农…...