当前位置: 首页 > article >正文

一份 Windows/macOS/Linux 完整安装 + 运行 + 对接 WebUI 的步骤

下面是一份Windows /macOS/ Linux 三平台通用的完整步骤安装 Ollama → 运行模型 → 对接 Open WebUI按顺序操作即可。一、安装 Ollama三平台1. Windows 安装下载安装包官网https://ollama.com/download直接下载https://ollama.com/download/OllamaSetup.exe双击OllamaSetup.exe→ 点Install自动完成安装。验证安装打开PowerShell或CMD输入bash运行ollama --version显示版本号如0.3.14即成功。2. macOS 安装下载安装包官网https://ollama.com/download直接下载https://ollama.com/download/Ollama-darwin.zip解压 → 把Ollama.app拖到应用程序文件夹。验证安装打开终端输入bash运行ollama --version显示版本号即成功。3. Linux 安装Ubuntu/Debian/CentOS 等打开终端执行一键安装脚本bash运行curl -fsSL https://ollama.com/install.sh | sh验证安装bash运行ollama --version二、运行 Ollama 与下载模型1. 启动 Ollama 服务Windows/macOS安装后会自动后台运行托盘有图标。Linux手动启动可选bash运行ollama serve2. 下载并运行模型命令行bash运行# 下载并启动 Llama 37B 轻量版推荐新手 ollama run llama3 # 或下载 Qwen 2.57B 中文友好 ollama run qwen2.5:7b-instruct # 或下载 DeepSeek R17B 推理强 ollama run deepseek-r1:7b首次运行会自动下载模型约 4–8GB耐心等待。下载完成后直接进入聊天界面输入问题即可对话。3. 常用管理命令bash运行# 查看已下载模型 ollama list # 停止运行中的模型 ollama stop llama3 # 删除模型 ollama rm llama3三、对接 Open WebUI可视化界面1. 安装 Docker必须Open WebUI 推荐用 Docker 部署先装 DockerWindows/macOS下载安装Docker Desktophttps://www.docker.com/products/docker-desktop/Linux按官方文档安装 Docker Enginehttps://docs.docker.com/engine/install/验证 Docker 安装成功bash运行docker -v2. 启动 Open WebUI 容器方式 A仅用 WebUIOllama 已在本机bash运行docker run -d \ -p 3000:8080 \ -e OLLAMA_BASE_URLhttp://host.docker.internal:11434 \ -v open-webui:/app/backend/data \ --name open-webui \ --restart always \ ghcr.io/open-webui/open-webui:main方式 BWebUI Ollama 一体推荐新手bash运行# 有 NVIDIA GPU docker run -d \ -p 3000:8080 \ --gpusall \ -v ollama:/root/.ollama \ -v open-webui:/app/backend/data \ --name open-webui \ --restart always \ ghcr.io/open-webui/open-webui:ollama # 仅 CPU docker run -d \ -p 3000:8080 \ -v ollama:/root/.ollama \ -v open-webui:/app/backend/data \ --name open-webui \ --restart always \ ghcr.io/open-webui/open-webui:ollama {insert\_element\_0\_} ### 3. 访问 WebUI 并连接 Ollama 1. 打开浏览器访问**http://localhost:3000** 2. 首次使用**注册管理员账号**仅本地存储不上云。 3. 连接 Ollama - 进入 **设置 → 连接 → Ollama**。 - 地址http://localhost:11434默认→ 点击 **验证连接**。 - 显示“连接成功”即可。 4. 开始使用 - 顶部选择模型如 llama3、qwen2.5:7b-instruct。 - 输入问题像 ChatGPT 一样对话。 --- ## 四、常见问题与优化 ### 1. 模型下载慢国内 - 可设置代理或用国内镜像源搜索“Ollama 模型镜像”。 ### 2. 模型存储在 C 盘占空间 - Windows设置环境变量 OLLAMA_MODELS指向其他盘如 D:\ollama_models。 - macOS/Linux bash export OLLAMA_MODELS/path/to/your/models3. 速度慢CPU 运行优先用7B 量化模型如llama3:8b、qwen2.5:7b。有 NVIDIA GPU 可开启 CUDA 加速Ollama 自动识别。五、总结安装 Ollama → 验证ollama --version。运行ollama run llama3下载并启动模型。用 Docker 启动 Open WebUI → 访问http://localhost:3000。连接 Ollama → 开始可视化对话。下面整理了按场景分类的 Ollama 常用模型清单每个模型都标注了特点、适用场景和直接可用的ollama run命令新手优先选 7B 量级轻量、易运行一、中文友好型优先选适配中文对话 / 创作表格模型名称特点适用场景Ollama 运行命令通义千问 2.57B阿里出品中文理解顶尖7B 轻量日常聊天、中文创作、问答ollama run qwen2.5:7b-instruct通义千问 2.514B中文能力更强推理略优复杂中文问答、长文本总结ollama run qwen2.5:14b-instruct讯飞星火 V47B讯飞出品中文语音 / 文本兼顾中文对话、本地化场景ollama run spark:7bBaichuan 37B百川大模型中文闲聊 / 写作优秀中文创作、生活化问答ollama run baichuan3:7b二、代码编程型写代码 / 调试 / 解释表格模型名称特点适用场景Ollama 运行命令CodeLlama7BMeta 官方代码模型支持多语言基础代码编写、语法解释ollama run codellama:7b-codeDeepSeek-Coder7B深度求索代码能力顶尖支持中文注释复杂代码编写、调试、重构ollama run deepseek-coder:7b-instructCodeQwen7B千问代码版中文代码场景适配好中文注释代码、国内框架开发ollama run codeqwen:7b-instructStarCoder27BHuggingFace 出品开源代码模型开源项目开发、代码补全ollama run starcoder2:7b三、逻辑推理型数学 / 分析 / 复杂思考表格模型名称特点适用场景Ollama 运行命令Llama 38BMeta 旗舰模型综合推理能力强通用推理、逻辑分析、决策ollama run llama3:8b-instructDeepSeek-R17B深度求索推理版数学 / 逻辑顶尖数学计算、逻辑题、数据分析ollama run deepseek-r1:7bMistral7B轻量高效推理速度快快速逻辑判断、简单分析ollama run mistral:7b-instruct-v0.2Phi-33.8BMicrosoft 出品小模型推理天花板轻量化推理、低配置设备ollama run phi3:3.8b-instruct四、轻量化通用型低配置设备 / 快速响应表格模型名称特点适用场景Ollama 运行命令Qwen2.51.8B千问轻量版仅 1.8B速度极快低配电脑 / 笔记本、快速问答ollama run qwen2.5:1.8b-instructGemma2BGoogle 出品小模型通用能力强轻量化日常使用、离线运行ollama run gemma:2b-instruct新手使用建议首次尝试优先选ollama run qwen2.5:7b-instruct中文友好或ollama run llama3:8b-instruct综合能力。配置有限8G 内存 / 无独显选 1.8B/2B/3.8B 量级如phi3:3.8b-instruct避免卡顿。国内网络模型下载慢可先设置 Ollama 镜像搜索 “Ollama 国内镜像源”或用代理。切换模型运行新模型前先执行ollama stop 旧模型名释放资源。总结中文场景优先选通义千问 2.57B命令ollama run qwen2.5:7b-instruct编程场景优先选DeepSeek-Coder7B命令ollama run deepseek-coder:7b-instruct推理场景优先选DeepSeek-R17B或Llama 38B低配设备选Phi-33.8B。

相关文章:

一份 Windows/macOS/Linux 完整安装 + 运行 + 对接 WebUI 的步骤

下面是一份 Windows /macOS/ Linux 三平台通用 的完整步骤:安装 Ollama → 运行模型 → 对接 Open WebUI,按顺序操作即可。 一、安装 Ollama(三平台) 1. Windows 安装 下载安装包: 官网:https://ollama.…...

Jimeng LoRA效果展示:动态切换LoRA,生成风格一致的惊艳图片

Jimeng LoRA效果展示:动态切换LoRA,生成风格一致的惊艳图片 1. 项目核心价值 1.1 为什么需要动态LoRA切换 在AI图像生成领域,LoRA(Low-Rank Adaptation)技术已经成为微调模型风格的主流方法。传统工作流程中&#x…...

Fama-French模型在中国股市真的有效吗?我们用5年数据做了这些验证

Fama-French三因子模型在A股市场的本土化实证研究 2017至2021年是中国资本市场快速变革的五年,注册制试点、外资持续流入、机构投资者占比提升等结构性变化,为检验经典资产定价理论提供了独特样本。本文将基于Fama-French三因子模型,通过2000…...

stm32写字机器人资料 主控stm32f103c8t6 包含程序,原理图,pcb

stm32写字机器人资料 主控stm32f103c8t6 包含程序,原理图,pcb,机械结构最近折腾了个基于STM32的写字机器人,从硬件画板到代码调试踩了不少坑,这里把核心模块拆开说说。主控用的是性价比极高的STM32F103C8T6&#xff0c…...

保姆级教程:从零配置JVM启动参数(JDK8+G1GC版)

从零开始掌握JVM启动参数配置:JDK8与G1GC实战指南 第一次面对JVM启动参数配置时,很多开发者都会感到无从下手。那些以-X和-XX开头的神秘参数背后,究竟隐藏着什么逻辑?本文将带你从零开始,逐步拆解JDK8环境下G1垃圾回收…...

Pixel Dimension Fissioner惊艳效果:技术白皮书→极客风/文艺风/传播风裂变

Pixel Dimension Fissioner惊艳效果:技术白皮书→极客风/文艺风/传播风裂变 1. 像素世界的文字炼金术 在数字创作的浩瀚宇宙中,Pixel Dimension Fissioner(像素维度裂变器)犹如一座16-bit像素风格的炼金工坊。这款基于MT5-Zero-…...

彻底搞懂Git文件忽略:从.gitignore规则到git rm --cached的完整指南

彻底搞懂Git文件忽略:从.gitignore规则到git rm --cached的完整指南 在团队协作开发中,Git作为版本控制系统的核心工具,其文件忽略机制的正确使用往往决定了项目仓库的整洁度与协作效率。许多开发者虽然熟悉.gitignore文件的基本用法&#x…...

部署Qwen3-VL需要多少内存?CPU版资源占用实测教程

部署Qwen3-VL需要多少内存?CPU版资源占用实测教程 1. 项目简介与测试目标 今天我们来实测一个特别实用的AI视觉理解服务——基于Qwen3-VL-2B-Instruct模型的CPU优化版本。这个模型最大的特点是能让计算机"看懂"图片,就像给AI装上了一双眼睛。…...

STM32F405实战:基于CubeMX与HAL库,实现SimpleFOC霍尔传感器精准驱动

1. 硬件准备与电路分析 先说说我这次用的硬件配置:一块STM32F405开发板,搭配中空三相无刷电机和霍尔传感器。霍尔传感器的三个输出引脚分别接在PB4(A相)、PB5(B相)和PC9(C相)上&…...

小白专属:GLM-4.7-Flash镜像部署全流程,附常见问题解决

小白专属:GLM-4.7-Flash镜像部署全流程,附常见问题解决 1. 为什么选择GLM-4.7-Flash 1.1 模型特点简介 GLM-4.7-Flash是智谱AI推出的新一代大语言模型,采用创新的MoE(混合专家)架构,总参数量达到300亿。…...

Modbus RTU模式下的3.5字符间隔:为什么9600波特率下要设置4ms?

Modbus RTU间隔时间设计的工程实践:从理论计算到稳定通信 1. 理解Modbus RTU的帧间隔本质 在工业自动化领域,Modbus RTU协议因其简单可靠而广受欢迎。但许多工程师在实际配置时,对那个神秘的"3.5字符间隔"参数往往知其然而不知其所…...

树莓派+STM32+激光雷达:大学生工训赛智能物流小车全栈开发实战(附避坑指南)

树莓派STM32激光雷达:大学生工训赛智能物流小车全栈开发实战(附避坑指南) 在工程训练和机器人竞赛中,智能物流小车的开发是一个综合性强、技术门槛高的项目。本文将详细介绍如何利用树莓派作为主控,结合STM32驱动板和激…...

保姆级教程:用Fish-Speech-1.5为视频配音,支持中英日等13种语言

保姆级教程:用Fish-Speech-1.5为视频配音,支持中英日等13种语言 1. 为什么选择Fish-Speech-1.5为视频配音? 在视频制作过程中,配音往往是最耗时耗力的环节之一。传统配音需要专业录音设备、配音演员和后期处理,成本高…...

示波器时间调节全攻略:从新手到高手的5个关键步骤(附常见问题解答)

示波器时间调节全攻略:从新手到高手的5个关键步骤(附常见问题解答) 示波器作为电子工程师的"眼睛",其时间调节功能直接影响测量结果的准确性。但面对面板上密密麻麻的旋钮和菜单,许多初学者往往感到无从下手…...

华为eNSP实战:3种DHCP配置全解析(附拓扑图+命令对比)

华为eNSP实战:3种DHCP配置全解析(附拓扑图命令对比) 在华为eNSP模拟器中,DHCP配置是网络工程师必须掌握的核心技能之一。无论是备考华为认证,还是实际工作中的网络部署,理解不同场景下的DHCP配置差异都至关…...

【MCP 2.0安全审计黄金标准】:2026年首批通过CNAS认证的12项测试用例与自动化检测工具链

第一章:MCP 2.0安全审计黄金标准的演进逻辑与战略定位MCP(Managed Cloud Platform)2.0安全审计黄金标准并非对旧版的简单增强,而是面向云原生纵深防御体系重构的安全治理范式跃迁。其演进逻辑根植于三大现实驱动力:零信…...

为什么你的Dify自定义节点总超时?3类典型异步陷阱与2024最新兜底策略

第一章:为什么你的Dify自定义节点总超时?3类典型异步陷阱与2024最新兜底策略Dify 自定义节点(Custom Node)在处理 LLM 调用、HTTP 请求或数据库操作时频繁触发 30s 超时,根本原因常被误判为“网络慢”或“模型响应慢”…...

Qwen3-32B-Chat百度搜索优化标题:Qwen3-32B开源模型RTX4090D部署实操指南

Qwen3-32B开源模型RTX4090D部署实操指南 1. 镜像概述与准备 Qwen3-32B-Chat是通义千问最新推出的开源大语言模型,本镜像专为RTX 4090D 24GB显存显卡优化,内置完整运行环境与模型依赖,开箱即用。 1.1 硬件要求 显卡:必须使用RT…...

Visual Studio 2022配置jsoncpp避坑指南:从源码编译到跨平台项目集成

Visual Studio 2022高效集成jsoncpp全流程:从源码编译到跨平台实战 在C开发中,处理JSON数据已成为日常需求。jsoncpp作为成熟的C JSON解析库,其稳定性和灵活性备受开发者青睐。然而,不同Visual Studio版本与Windows SDK组合下的编…...

Linux文件权限机制:嵌入式开发中的安全基石

1. Linux 文件权限机制深度解析Linux 作为典型的多用户、多任务操作系统,其核心安全模型建立在严格的文件访问控制基础之上。权限管理并非简单的“能/不能访问”二元判断,而是一套精细、分层、可追溯的访问控制体系。理解这套机制,是进行嵌入…...

Windows11+Ubuntu双系统下detectron2安装全攻略(附CUDA版本避坑指南)

Windows 11与Ubuntu双系统下detectron2安装全指南:从环境配置到版本避坑 在计算机视觉领域,Facebook Research开源的detectron2框架因其模块化设计和出色的性能表现,已成为目标检测、实例分割等任务的首选工具之一。然而,对于同时…...

OFA-Image-Caption模型效果量化评估:使用BLEU、CIDEr等指标进行科学测评

OFA-Image-Caption模型效果量化评估:使用BLEU、CIDEr等指标进行科学测评 当我们在谈论一个图像描述模型“效果好”时,到底在说什么?是生成的句子读起来通顺,还是它准确地捕捉到了图片里的所有细节,又或者是它的描述特…...

SenseVoice-small部署教程:ONNX量化版WebUI保姆级实战指南

SenseVoice-small部署教程:ONNX量化版WebUI保姆级实战指南 1. 引言:为什么你需要一个本地化的语音识别工具? 想象一下,你正在参加一个重要的线上会议,需要实时生成字幕,但网络信号时好时坏,云…...

Mirage Flow 企业CRM智能化升级:客户画像自动生成与销售话术建议

Mirage Flow 企业CRM智能化升级:客户画像自动生成与销售话术建议 最近和几个做销售管理的朋友聊天,大家普遍有个头疼的问题:客户信息散落在微信、邮件、电话记录里,销售新人接手老客户,两眼一抹黑,沟通起来…...

Kafka-King:企业级高性能分布式Kafka图形化管理平台技术深度解析

Kafka-King:企业级高性能分布式Kafka图形化管理平台技术深度解析 【免费下载链接】Kafka-King A modern and practical kafka GUI client 项目地址: https://gitcode.com/gh_mirrors/ka/Kafka-King Kafka-King是一款基于Go语言与Vue.js构建的企业级高性能分布…...

树莓派变身工业PLC:用CODESYS Control打造低成本自动化控制系统(附HMI配置)

树莓派变身工业PLC:用CODESYS Control打造低成本自动化控制系统(附HMI配置) 在工业自动化领域,PLC(可编程逻辑控制器)一直是产线控制的核心设备。但传统PLC动辄上万元的价格,让许多中小企业和教…...

新手入坑 SRC 必看:公益 SRC 价值分析 + 合法挖洞指南,小白收藏这篇就够了

引言:新手挖洞的核心矛盾 网络安全领域的核心竞争力源于 “实战经验”,但新手入门时始终面临双重困境:一方面,未授权测试触碰法律红线(《网络安全法》),真实业务场景的攻防实践风险极高&#x…...

2026 SRC漏洞挖掘全攻略|从入门到变现,网安新手收藏这篇就够了!

2026 SRC漏洞挖掘全攻略|从入门到变现,网安新手必看 对于网安新手、计算机相关专业学生而言,想合法积累实战经验、赚取额外收入、丰富简历亮点,SRC漏洞挖掘绝对是最优路径。不同于CTF的竞技性、护网的高强度,SRC&…...

Qwen3.5-9B惊艳呈现:一张芯片电路图识别出型号+引脚功能+常见故障模式

Qwen3.5-9B惊艳呈现:一张芯片电路图识别出型号引脚功能常见故障模式 1. 引言:当AI遇见芯片电路图 想象一下这样的场景:你面前放着一张复杂的芯片电路图,密密麻麻的线路和元件让人眼花缭乱。传统上,要理解这张图可能需…...

SAP-MM STO进阶:巧用IDoc DESADV打通公司间交货自动化最后一公里

1. 为什么公司间交货自动化是SAP-MM的痛点? 做过SAP-MM模块实施的朋友都知道,公司间库存转储(STO)流程中最让人头疼的就是交货单的同步问题。想象一下这样的场景:A公司向B公司发货后,B公司的仓库管理员需要…...