当前位置: 首页 > article >正文

Qwen3.5-9B开源大模型教程:从HuggingFace下载到本地WebUI上线

Qwen3.5-9B开源大模型教程从HuggingFace下载到本地WebUI上线1. 项目概述Qwen3.5-9B是一款拥有90亿参数的开源大语言模型具备强大的逻辑推理、代码生成和多轮对话能力。最新版本还支持多模态理解图文输入和长达128K tokens的上下文处理能力。这个教程将带你从零开始完成从HuggingFace下载模型到本地WebUI上线的完整流程。我们将使用Conda环境管理工具基于torch28环境进行部署。2. 环境准备2.1 系统要求操作系统Linux (推荐Ubuntu 20.04)GPUNVIDIA显卡显存建议16GB以上内存32GB以上存储空间至少50GB可用空间2.2 Conda环境配置# 创建conda环境 conda create -n torch28 python3.10 -y # 激活环境 conda activate torch28 # 安装基础依赖 pip install torch2.8.0 transformers5.0.0 gradio6.x huggingface_hub1.3.03. 模型下载与部署3.1 从HuggingFace下载模型# 创建模型存储目录 mkdir -p /root/ai-models/Qwen # 使用huggingface_hub下载模型 python -c from huggingface_hub import snapshot_download; snapshot_download(repo_idQwen/Qwen3.5-9B, local_dir/root/ai-models/Qwen/Qwen3.5-9B)3.2 创建符号链接ln -s /root/ai-models/Qwen/Qwen3.5-9B /root/ai-models/Qwen/Qwen3___5-9B4. WebUI部署4.1 项目结构/root/qwen3.5-9b/ ├── app.py # 主程序 (Gradio WebUI) ├── start.sh # 启动脚本 ├── service.log # 运行日志 └── history.json # 对话历史记录4.2 创建启动脚本创建start.sh文件#!/bin/bash source /opt/miniconda3/etc/profile.d/conda.sh conda activate torch28 python /root/qwen3.5-9b/app.py赋予执行权限chmod x /root/qwen3.5-9b/start.sh4.3 Supervisor配置创建配置文件/etc/supervisor/conf.d/qwen3.5-9b.conf[program:qwen3.5-9b] command/bin/bash /root/qwen3.5-9b/start.sh directory/root/qwen3.5-9b environmentHOME/root,USERroot,LOGNAMEroot,SHELL/bin/bash,PATH/opt/miniconda3/envs/torch28/bin:/usr/bin:/bin userroot autostarttrue autorestarttrue startsecs30 startretries3 redirect_stderrtrue stdout_logfile/root/qwen3.5-9b/service.log stopasgrouptrue killasgrouptrue更新Supervisor配置supervisorctl update5. 使用指南5.1 服务管理命令# 查看服务状态 supervisorctl status qwen3.5-9b # 重启服务 supervisorctl restart qwen3.5-9b # 停止服务 supervisorctl stop qwen3.5-9b # 查看实时日志 tail -f /root/qwen3.5-9b/service.log5.2 WebUI访问本地访问: http://localhost:7860网络访问: http://服务器IP:78605.3 功能使用文本对话在输入框输入问题点击Send或按回车等待模型回复图片分析在右侧Upload Image上传图片在输入框描述你想问的问题点击Send参数调节Max tokens: 生成文本的最大长度 (64-8192)Temperature: 采样温度越高越随机 (0.0-1.5)Top P: 核采样阈值越低越确定 (0.1-1.0)Top K: 采样候选数越少越确定 (1-100)6. 常见问题排查6.1 服务启动失败检查步骤:检查进程状态supervisorctl status qwen3.5-9b查看最新日志supervisorctl tail qwen3.5-9b检查conda环境是否正常检查模型文件是否存在6.2 模型加载慢/卡住原因: 模型文件较大(~19GB)首次加载需要时间解决:等待2-3分钟让模型完全加载检查GPU是否可用nvidia-smi查看日志确认加载进度6.3 端口被占用# 检查端口占用 ss -tlnp | grep 7860 # 查看哪个进程占用 lsof -i :78607. 日常维护7.1 清理对话历史rm -f /root/qwen3.5-9b/history.json supervisorctl restart qwen3.5-9b7.2 清理日志# 备份当前日志 cp /root/qwen3.5-9b/service.log /root/qwen3.5-9b/service.log.bak # 清空日志 /root/qwen3.5-9b/service.log # 重启服务 supervisorctl restart qwen3.5-9b8. 总结通过本教程你已经成功将Qwen3.5-9B大模型从HuggingFace下载并部署到本地WebUI。这个强大的开源模型可以用于各种自然语言处理任务包括文本生成、代码编写和多模态理解。记住首次加载模型可能需要较长时间请耐心等待。如果遇到任何问题可以参考本文的故障排查部分或者查看服务日志获取更多信息。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

相关文章:

Qwen3.5-9B开源大模型教程:从HuggingFace下载到本地WebUI上线

Qwen3.5-9B开源大模型教程:从HuggingFace下载到本地WebUI上线 1. 项目概述 Qwen3.5-9B是一款拥有90亿参数的开源大语言模型,具备强大的逻辑推理、代码生成和多轮对话能力。最新版本还支持多模态理解(图文输入)和长达128K tokens…...

从K-means到DBSCAN:六种聚类算法实战场景与Python代码解析

1. 聚类算法入门:从超市货架到数据分群 第一次接触聚类算法时,我正站在超市的饮料区发呆。货架上的饮料被分门别类摆放:碳酸饮料、果汁、矿泉水、功能饮料...这其实就是最直观的聚类场景。在数据科学中,聚类算法就是帮我们完成类似…...

实战技巧:AI项目中常用的10个开源工具推荐

模型库的“一站式商店” 大模型应用的“脚手架” RAG系统的“数据管家” Ray:分布式训练的“调度大师” vLLM:大模型推理的“速度之王” Gradio:AI应用的“极速展示台” FastAPI:API服务的“高性能框架” MLflow&#xff1…...

树莓派4B+nrf52840 dongle搭建Thread边界路由保姆级教程(含常见错误排查)

树莓派4B与nrf52840 dongle构建Thread边界路由全流程解析 在智能家居和物联网领域,Thread协议因其低功耗、高安全性和自愈网络特性正获得越来越多的关注。作为基于IPv6的无线mesh网络协议,Thread能够为智能设备提供稳定可靠的连接,而边界路由…...

GOOSE协议深度解析:从报文帧结构到变电站实时通信实战

1. GOOSE协议在变电站自动化中的核心地位 我第一次接触GOOSE协议是在2015年参与某500kV智能变电站改造项目时。当时看到保护装置之间通过网线替代了传统的硬接线,心里直打鼓——这些看似脆弱的网线真能承担起保护跳闸这样的关键任务吗?直到亲眼目睹了断路…...

避坑指南:STM32F103多通道捕获中断冲突的5种解决方案

STM32F103多通道捕获中断冲突的实战解决方案 在嵌入式开发中,定时器的多通道捕获功能常用于测量脉冲宽度、频率等信号特征。STM32F103系列作为经典微控制器,其TIM5定时器支持四个独立通道的输入捕获。然而,当同时使用多个通道时,开…...

Linux-parted命令

创作背景Gkit部署环境的时候遇到一个报错,管理域准备环节报错内容如下:[2026-04-02 16:20:21] Error Log:Parted failed, result is [ parted: invalid token: logicError: Expecting a partition type. ] when exec: [ sudo parted -s /dev/vdb mkpar…...

从STM32F407到大疆A板:工创赛智能物流小车主控选型避坑与实战心得

从STM32F407到大疆A板:工创赛智能物流小车主控选型避坑与实战心得 在嵌入式竞赛的备战过程中,主控板的选择往往决定了整个项目的成败。作为经历过省赛和国赛双重考验的团队,我们深刻体会到:一块合适的主控板不仅能提升开发效率&am…...

Windows 下 OpenClaw 快速搭建与使用指南

前言 2026年爆火的开源AI智能体 OpenClaw(昵称小龙虾),GitHub星标超28万,凭"本地运行零代码自动干活"圈粉无数!本文专为小白打造,用自制的一键部署包,无需命令行、无需手动配环境&am…...

IEEE 802.3u是1995年发布的快速以太网标准,将以太网传输速率从10Mbps提升至100Mbps

本报告基于《软件设计师教程》第10章"网络与信息安全基础知识"的内容,结合网络资源对快速以太网(IEEE 802.3u)、千兆以太网(IEEE 802.3z)和令牌环网(IEEE 802.5)三大局域网标准进行详…...

OpenClaw 完整安装教程与最新版安装包

摘要:2026年爆火的开源AI智能体OpenClaw(昵称小龙虾),GitHub星标超28万,凭"本地运行零代码自动干活"圈粉无数!本文专为小白打造,用自制的一键部署包,无需命令行、无需手动…...

PowerDMIS 新建坐标系

坐标系创建按键,用于3-2-1坐标系/迭代坐标系/最佳拟合坐标系/偏置坐标系的命令3-2-1 法坐标系1(PCS3-2-1法) 适用工件:3-2-1法适用于具有规则形状、明确的平面、直线、孔、槽、边缘等的零件的工件坐标系创建的常用方法。 优势&…...

并发的核心特征可以概括为:**宏观上同时执行,微观上交替执行**。在多任务操作系统中,多个程序在同一时间段内同时推进

并发的核心特征可以概括为:宏观上同时执行,微观上交替执行。在多任务操作系统中,多个程序在同一时间段内同时推进,从宏观角度看用户感知到多个任务在同时运行;但在微观层面,单个CPU核心在任意时刻只能执行一…...

太空算力:下一个万亿蓝海赛道

当我们谈论算力时,脑海中浮现的往往是数据中心里密密麻麻的服务器机柜,或者高性能计算机嗡嗡作响的散热风扇。但你是否想过,有一天,算力也可以“搬”到太空去?2026年4月3日,北京经济技术开发区通明湖会展中…...

OpenAI惨遭反超,Anthropic狂吞70%新客户,Claude已开启「灵魂校准」

当企业真金白银开始从 ChatGPT 流向 Claude,Anthropic 打的早已不只是模型性能战,而是一场从工程师口碑、企业信任到「AI灵魂校准」的全面突围。 这一次,Anthropic真的要把OpenAI从「企业AI王座」上拽下来了。 美国企业财务卡发行商 Ramp 最…...

被AGI逼疯的硅谷天才,正在集体逃亡

OpenAI 工程师因严重精神透支辞职回国,撕开了硅谷 AI 圈残酷的内卷真相。在「0-0-2」极限压榨与道德焦虑双重折磨下,xAI、OpenAI 等巨头的核心研发骨干正掀起一场史无前例的集体逃亡。 OpenAI 工程师 Hieu Pham 终于不得不决定彻底停止工作,…...

Excel也能玩转熵权法?手把手教你不用编程做指标权重分析

Excel也能玩转熵权法?手把手教你不用编程做指标权重分析 在业务分析中,我们常常需要评估多个指标的相对重要性。比如产品经理需要确定用户满意度调查中各维度的权重,运营人员要量化活动效果评估中不同KPI的贡献度。传统的主观赋权方法容易受个…...

洛谷-算法1-7-搜索4

P1596 [USACO10OCT] Lake Counting S 题目描述 由于最近的降雨,水在农夫约翰的田地里积聚了。田地可以表示为一个 NM 的矩形(1≤N≤100;1≤M≤100)。每个方格中要么是水(W),要么是干地&#x…...

11《深入解析CAN总线:数据场、控制场、CRC场逐字段精讲》

001、CAN总线协议基础与帧结构总览 从一次诡异的通信丢帧说起 上个月在调试一个电机控制节点时,遇到个怪事:总线上明明能看到正确的ID和DLC,但数据场内容偶尔会错乱。逻辑分析仪抓到的波形显示,CRC校验段居然通过了,但应用层解析出来的转速值会突然跳变。查了三天,最后…...

网络传输介质是计算机网络中连接各个节点的物理通路,是数据传输的物理基础

网络传输介质是计算机网络中连接各个节点的物理通路,是数据传输的物理基础。根据《软件设计师教程(第5版)》内容,传输介质主要分为有线传输介质和无线传输介质两大类,以下是各类介质的核心特性: 1. 同轴电缆…...

记一次由「进程文件描述符泄漏」引发的socket- too many open files

记一次由「进程文件描述符泄漏」引发的socket: too many open files 在运维和开发过程中,文件描述符泄漏是一个常见但容易被忽视的问题。当进程频繁打开文件、网络连接等资源却未正确关闭时,系统资源会被逐渐耗尽,最终导致"too many op…...

免费零投入,每月帮打工人省18小时少花200块,2026新版会议纪要模板不领亏大了

我做了五年社科访谈研究,前四年大半时间都耗在录音整理上,踩过不下十种语音转写工具的坑,要么准确率低改到疯,要么收费贵一年大几百,要么长音频直接卡崩溃。试了一圈下来,我可以明确说:听脑AI是…...

[具身智能-379]:如何在仿真环境进行模型的训练?模型如何获取仿真如何的数据?模型与仿真软件交换信息的标准?

一、仿真环境训练模型的标准流程无论使用强化学习(RL)、监督学习(SL)还是模仿学习(IL),在仿真中训练都遵循以下闭环:1. 环境配置2. 定义交互接口3. 构建训练循环4. 并行加速5. 评估与…...

ECharts 3D地图多层级同步交互优化:零延迟缩放与拖拽实战

1. 为什么需要3D地图多层级同步交互? 最近在做数据可视化项目时,遇到了一个棘手的问题:如何在ECharts的3D地图中实现多个geo图层的同步缩放和拖拽?这个问题看似简单,但实际操作起来却有不少坑。想象一下,当…...

三点定圆心半径易语言实现

要使用易语言实现三点确定圆心与半径的计算,核心是基于平面几何原理:三个不共线的点可以唯一确定一个圆,圆心到这三个点的距离相等。以下是具体的实现方法和代码。 一、算法原理与数学推导 1.1 核心数学公式 设三个点坐标为 $P_1(x_1, y_1…...

【赵渝强老师】OceanBase的分区表

OceanBase当前支持的类型包括Range分区、Range COLUMNS分区、List分区、List COLUMNS分区、Hash分区和Key分区等,其中: Range分区、Range COLUMNS分区、List分区和List COLUMNS分区可以用于解决业务中大量删除带来的性能问题,支持快速删除分…...

AI大模型时代的企业可观测性架构设计方案

一、架构设计原则:AI原生可观测性的核心理念1. 统一标准,打破数据孤岛在AI大模型时代,传统的割裂式监控工具(如Prometheus监控基础设施、ELK日志分析、Jaeger链路追踪)已无法满足复杂AI系统的可观测需求。必须采用Open…...

2010-2025年上市公司国地税改革DID数据

本数据以张浩天和卢盛峰(2025)《国地税机构合并与政府补助策略性调整》研究框架为参考,构建上司公司国地税改革DID虚拟变量。国地税合并的核心目标之一是提升税收治理效能,降低征纳成本,优化营商环境。然而&#xff0c…...

程序包javax.validation.constraints不存在

在现代Java企业级应用开发中,数据校验是保障系统健壮性与安全性的第一道防线。无论是Web API的请求参数、数据库实体的持久化字段,还是微服务间的消息传递,都离不开对数据合法性的严格审查。javax.validation.constraints(及其继任…...

探店无数,平凉这口五仁月饼最难忘

我是浙江人,在广州工作。品质出众次听说五仁月饼是在一个平凉同事嘴里。他形容了半天"外头酥里头软"、"麦香特别浓"、"能撕着吃",我完全想象不出来——一个饼子能有多特别?直到他寄了一盒给我。探店无数&#…...