当前位置：首页 > article >正文

llama-webui docker实现界面部署

article 2026/2/8 4:36:07

1. 启动ollama服务

[nlp server]$ ollama serve 
2025/04/21 14:18:23 routes.go:1007: INFO server config env="map[OLLAMA_DEBUG:false OLLAMA_FLASH_ATTENTION:false OLLAMA_HOST: OLLAMA_KEEP_ALIVE:24h OLLAMA_LLM_LIBRARY: OLLAMA_MAX_LOADED_MODELS:4 OLLAMA_MAX_QUEUE:512 OLLAMA_MAX_VRAM:0 OLLAMA_MODELS: OLLAMA_NOHISTORY:false OLLAMA_NOPRUNE:false OLLAMA_NUM_PARALLEL:4 OLLAMA_ORIGINS:[http://localhost https://localhost http://localhost:* https://localhost:* http://127.0.0.1 https://127.0.0.1 http://127.0.0.1:* https://127.0.0.1:* http://0.0.0.0 https://0.0.0.0 http://0.0.0.0:* https://0.0.0.0:*] OLLAMA_RUNNERS_DIR: OLLAMA_TMPDIR:]"
time=2025-04-21T14:18:23.635+08:00 level=INFO source=images.go:729 msg="total blobs: 26"
time=2025-04-21T14:18:23.640+08:00 level=INFO source=images.go:736 msg="total unused blobs removed: 0"
time=2025-04-21T14:18:23.641+08:00 level=INFO source=routes.go:1053 msg="Listening on [::]:11434 (version 0.1.41)"
time=2025-04-21T14:18:23.644+08:00 level=INFO source=payload.go:30 msg="extracting embedded files" dir=/tmp/ollama2652961605/runners
time=2025-04-21T14:18:26.839+08:00 level=INFO source=payload.go:44 msg="Dynamic LLM libraries [cpu cpu_avx cpu_avx2 cuda_v11 rocm_v60002]"
time=2025-04-21T14:18:28.768+08:00 level=INFO source=types.go:71 msg="inference compute" id=GPU-eb9de518-5b08-8681-db92-3574098ba9a7 library=cuda compute=8.0 driver=12.2 name="NVIDIA A100-PCIE-40GB" total="39.4 GiB" available="27.2 GiB"
time=2025-04-21T14:18:28.769+08:00 level=INFO source=types.go:71 msg="inference compute" id=GPU-6437a60f-3b01-49db-51cd-954d802df1bb library=cuda compute=8.0 driver=12.2 name="NVIDIA A100-PCIE-40GB" total="39.4 GiB" available="8.1 GiB"
time=2025-04-21T14:18:28.769+08:00 level=INFO source=types.go:71 msg="inference compute" id=GPU-24c7c67b-ca9f-9420-8192-e16b37a62663 library=cuda compute=8.0 driver=12.2 name="NVIDIA A100-PCIE-40GB" total="39.4 GiB" available="2.4 GiB"
time=2025-04-21T14:18:28.769+08:00 level=INFO source=types.go:71 msg="inference compute" id=GPU-0023f216-b5cf-e163-edf1-fdab2dfefe79 library=cuda compute=8.0 driver=12.2 name="NVIDIA A100-PCIE-40GB" total="39.4 GiB" available="38.1 GiB"
[GIN] 2025/04/21 - 14:19:26 | 200 |     599.458µs |       127.0.0.1 | HEAD     "/"

2. 查看ollama环境下的模型

[nlp output]$ ollama list
NAME                                    ID              SIZE    MODIFIED     
dop_model_q8_0:latest                   37ca11662152    531 MB  4 days ago  
qwen2-0_5b-instruct-q2_k:latest         63b6ae8fe389    338 MB  5 days ago  
Qwen2.5-7B-Instruct:latest              fda9152ecb12    15 GB   5 days ago  
qwen:7b                                 2091ee8c8d8f    4.5 GB  4 months ago
quentinz/bge-base-zh-v1.5:latest        cd232613fa6f    204 MB  4 months ago
qwen:1.8b                               b6e8ec2e7126    1.1 GB  4 months ago
qwen2:1.5b                              f6daf2b25194    934 MB  4 months ago

3. 启动docker webui服务

docker run -d \-p 3003:8080 \          # 改用新端口（如3003）-e OLLAMA_BASE_URL=http://192.168.x.xx:11434 \-v open-webui-2:/app/backend/data \  # 使用新的数据卷名称--name open-webui-2 \    # 使用新的容器名称--restart always \ghcr.io/open-webui/open-webui:main

命令解析：

查看启动后的docker服务：

nlp output]$ docker ps                                                                                                                                                                                                   
CONTAINER ID   IMAGE                                                      COMMAND                  CREATED          STATUS                    PORTS                                                                          NAMES
e5e142dcf1e3   cr.ttyuyin.com/zt/lmcache:3.1-beta                         "python3 -m vllm.ent…"   9 minutes ago    Up 9 minutes              0.0.0.0:8321->8888/tcp, :::8321->8888/tcp                                      Qwen2.5-14B-Instruct-lmcache
84c6fd80f56d   ghcr.io/open-webui/open-webui:main                         "bash start.sh"          57 minutes ago   Up 57 minutes (healthy)   0.0.0.0:3003->8080/tcp, :::3003->8080/tcp                                      open-webui-2

在浏览器中输入：http://192.168.x.xxx:3003

4. 参考文章

本地部署Ollama+qwen本地大语言模型Web交互界面_error [apps.ollama.main] connection error: cannot -CSDN博客

Docker+Ollama+WebUI - WTALingLong - 博客园

llama-webui docker实现界面部署

1. 启动ollama服务 [nlp server]$ ollama serve 2025/04/21 14:18:23 routes.go:1007: INFO server config env"map[OLLAMA_DEBUG:false OLLAMA_FLASH_ATTENTION:false OLLAMA_HOST: OLLAMA_KEEP_ALIVE:24h OLLAMA_LLM_LIBRARY: OLLAMA_MAX_LOADED_MODELS:4 OLLAMA_MAX_…...

编程日记 2026/2/5 19:54:59

jinjia2将后端传至前端的字典变量转换为JS变量

后端 country_dict {AE: .amazon.ae, AU: .amazon.com.au} 前端 const country_list JSON.parse({{ country_list | tojson | safe }});...

编程日记 2025/12/7 15:26:33

如何深入理解引用监视器,安全标识以及访问控制模型与资产安全之间的关系

一、核心概念总结安全标识(策略决策的 “信息载体) 是主体（如用户、进程）和客体（如文件、数据库、设备）的安全属性，用于标记其安全等级、权限、访问能力或受保护级别，即用于标识其安全等级、权限范围或约束…...

编程日记 2026/2/7 3:35:10

Linux的Socket开发补充

是listen函数阻塞等待连接，还是accept函数阻塞等待连接？ 这两个函数的名字，听起来像listen一直在阻塞监听，有连接了就accept，但其实不是的。调用listen()后，程序会立即返回，继续执行后续代码&a…...

编程日记 2026/2/7 18:03:58

Flutter异常Couldn‘t find dynamic library in default locations

Flutter项目在Windows系统使用ffigen生成代码时报下面的错误： [SEVERE] : Couldnt find dynamic library in default locations. [SEVERE] : Please supply one or more path/to/llvm in ffigens config under the key llvm-path. Unhandled exception: Exception: …...

编程日记 2026/1/8 20:41:50

Spring-AOP分析

Spring分析-AOP 1.案例引入在上一篇文章中，【Spring–IOC】【https://www.cnblogs.com/jackjavacpp/p/18829545】，我们了解到了IOC容器的创建过程，在文末也提到了AOP相关，但是没有作细致分析，这篇文章就结合示例&am…...

编程日记 2026/1/31 19:29:43

[特殊字符] Prompt如何驱动大模型对本地文件实现自主变更：Cline技术深度解析

在AI技术快速发展的今天，编程方式正在经历一场革命性的变革。从传统的"人写代码"到"AI辅助编程"，再到"AI自主编程"，开发效率得到了质的提升。Cline作为一款基于VSCode的AI编程助手，通过其独特的pro…...

编程日记 2026/2/7 9:04:05

【专业解读：Semantic Kernel（SK）】大语言模型与传统编程的桥梁

目录 Start:什么是Semantic Kernel？ 一、Semantic Kernel的本质：AI时代的操作系统内核 1.1 重新定义LLM的应用边界 1.2 技术定位对比二、SK框架的六大核心组件与技术实现 2.1 内核（Kernel）：智能任务调度中心 2…...

编程日记 2026/2/6 2:48:56

PHP 8 中的 Swow：高性能纯协程网络通信引擎

一、什么是 Swow？ Swow 是一个高性能的纯协程网络通信引擎，专为 PHP 设计。它结合了最小化的 C 核心和 PHP 代码，旨在提供高性能的网络编程支持。Swow 的核心目标是释放 PHP 在高并发场景下的真正潜力，同时保持代码的简洁和易用性…...

编程日记 2026/2/5 22:15:53

你学会了些什么211201？--http基础知识

概念 HTTP–Hyper Text Transfer Protocol，超文本传输协议；是一种建立在TCP上的无状态连接（短连接）。整个基本的工作流程是：客户端发送一个HTTP请求（Request ），这个请求说明了客户端…...

编程日记 2026/2/5 19:55:04

每天学一个 Linux 命令（29）：tail

可访问网站查看，视觉品味拉满： http://www.616vip.cn/29/index.html tail 命令用于显示文件的末尾内容，默认显示最后 10 行。它常用于实时监控日志文件或查看文件的尾部数据。以下是详细说明和示例：命令格式 tail [选项] [文件...]常用选项选项描述-n <NUM> …...

编程日记 2026/1/31 21:02:18

【形式化验证基础】活跃属性Liveness Property和安全性质（Safety Property）介绍

文章目录一、Liveness Property1、概念介绍2、形式化定义二、Safety Property1. 定义回顾2. 核心概念解析3. 为什么强调“有限前缀”4. 示例说明4.1 示例1：交通信号灯系统4.2 示例2：银行账户管理系统5. 实际应用的意义三. 总结一、Liveness Property 1、概念介绍在系统的…...

编程日记 2026/2/5 17:48:56

技工院校无人机专业工学一体化人才培养方案

随着无人机技术在农业植保、地理测绘、应急救援等领域的深度应用，行业复合型人才缺口持续扩大。技工院校作为技能型人才培养主阵地，亟需构建与行业发展同步的无人机专业人才培养体系。本文基于"工学一体化"教育理念，从课程体系、实…...

编程日记 2025/12/9 8:59:47

PI0 Openpi 部署（仅测试虚拟环境）

https://github.com/Physical-Intelligence/openpi/tree/main 我使用4070tisuper, 14900k,完全使用官方默认设置，没有出现其他问题。目前只对examples/aloha_sim进行测试，使用docker进行部署, 默认使用pi0_aloha_sim模型(但是文档上没找到对应的&…...

编程日记 2026/2/5 23:17:22

计算机视觉——利用AI幻觉检测图像是否是生成式算生成的图像

概述俄罗斯的新研究提出了一种非常规方法，用于检测不真实的AI生成图像——不是通过提高大型视觉-语言模型（LVLMs）的准确性，而是故意利用它们的幻觉倾向。这种新方法使用LVLMs提取图像的多个“原子事实”，然后应用自…...

编程日记 2026/2/7 14:37:52

性能测试工具和JMeter功能概要

主流性能测试工具 LoadRunner JMeter [本阶段学习] 1.1 LoadRunner HP LoadRunner是一种工业级标准性能测试负载工具，可以模拟上万用户实施测试，并在测试时可实时检测应用服务器及服务器硬件各种数据，来确认和查找存在的瓶颈支持多协议&am…...

编程日记 2025/12/10 8:16:11

《理解 Java 泛型中的通配符：extends 与 super 的使用场景》

大家好呀！👋 今天我们要聊一个让很多Java初学者头疼的话题——泛型通配符。别担心，我会用最通俗易懂的方式，带你彻底搞懂这个看似复杂的概念。准备好了吗？Let’s go! 🚀 一、为什么我们需要泛型通配符&…...

编程日记 2025/12/9 10:34:34

C#学习第17天：序列化和反序列化

什么是序列化？ 定义：序列化是指把对象转换为一种可以轻松存储或传输的格式，如JSON、XML或二进制格式。这个过程需要捕获对象的类型信息和数据内容。用途：使得对象可以持久化到文件、发送至网络、或存储在数据库中。什么是反序列…...

编程日记 2026/2/7 20:46:49

FlaskRestfulAPI接口的初步认识

FlaskRestfulAPI 介绍记录学习 Flask Restful API 开发的过程项目来源：【Flask Restful API教程-01.Restful API介绍】我的代码仓库：https://gitee.com/giteechaozhi/flask-restful-api.git 后端API接口实现功能：数据库访问控制&#xf…...

编程日记 2026/2/8 3:36:54

CSS预处理工具有哪些？分享主流产品

目前主流的CSS预处理工具包括：Sass、Less、Stylus、PostCSS等。其中，Sass是全球使用最广泛的CSS预处理工具之一，以强大的功能、灵活的扩展性以及完善的社区生态闻名。Sass通过增加变量、嵌套、混合宏（mixin）等功能&…...

编程日记 2026/1/31 19:23:43

微信小程序中，将搜索组件获取的值传递给父页面（如 index 页面）可以通过自定义事件或页面引用实现

将搜索组件获取的值传递给父页面（如 index 页面）可以通过自定义事件或页面引用实现方法 1：自定义事件（推荐） 步骤 1：搜索组件内触发事件在搜索组件的 JS 中，当获取到搜索值时&#xff0c…...

编程日记 2026/1/15 9:18:26

深度学习预训练和微调

目录 1. 预训练（Pre-training）是什么？ 2. 微调（Fine-tuning）是什么？ 3. 预训练和微调的对象 4. 特征提取如何实现？ 预训练阶段： 微调阶段： 5. 这样做的作用和意义 …...

编程日记 2025/12/8 4:28:39

AI 速读 SpecReason：让思考又快又准！

在大模型推理的世界里，速度与精度往往难以兼得。但今天要介绍的这篇论文带来了名为SpecReason的创新系统，它打破常规，能让大模型推理既快速又准确，大幅提升性能。想知道它是如何做到的吗？快来一探究竟！ 论…...

编程日记 2026/2/6 8:08:41

Qt通过ODBC和QPSQL两种方式连接PostgreSQL或PolarDB PostgreSQL版

一、概述以下主要在Windows下验证连接PolarDB PostgreSQL版（阿里云兼容 PostgreSQL的PolarDB版本）。Linux下类似，ODBC方式则需要配置odbcinst.ini和odbc.ini。二、代码以下为完整代码，包含两种方式连接数据库，并…...

编程日记 2026/1/31 19:29:57

MobaXterm连接Ubuntu(SSH)

1.查看Ubuntu ip 打开终端,使用指令 ifconfig 由图可知ip地址 2.MobaXterm进行SSH连接点击session,然后点击ssh,最后输入ubuntu IP地址以及用户名...

编程日记 2026/2/5 23:35:06

Lambda 函数与 peek 操作的使用案例

Lambda 函数和 peek 操作是 Java 8 Stream API 中非常有用的特性，下面我将介绍它们的使用案例。 Lambda 函数使用案例 Lambda 表达式是 Java 8 引入的一种简洁的匿名函数表示方式。集合操作 List<String> names Arrays.asList("Alice", "B…...

编程日记 2026/2/5 13:57:24

C# 的字符串插值（$）和逐字字符串（@）功能

这段代码使用了 C# 的字符串插值（$） 和逐字字符串（） 功能，并在 SQL 语句中动态拼接变量。下面详细解释它们的用法： 1. $（字符串插值） $ 是 C# 的字符串插值符号，允许…...

编程日记 2026/2/5 11:47:59

软考中级软件设计师考点知识点笔记总结 day13 数据库系统基础知识数据库模式映像数据模型

文章目录数据库系统基础知识6.1 基本概念6.1.1 DBMS的特征与分类 6.2 数据库三级模式两级映像6.3 数据库的分析与设计过程6.4 数据模型6.4.1 ER模型6.4.2 关系模型数据库系统基础知识基本概念数据库三级模式两级映像数据库的分析与设计过程数据模型关系代数数据库完整…...

编程日记 2026/2/7 7:55:17

蓝桥杯2024省A.成绩统计

蓝桥杯2024省A.成绩统计题目题目解析与思路题目要求返回至少要检查多少个人的成绩，才有可能选出k名同学，他们的方差小于一个给定的值 T 二分枚举答案位置，将答案位置以前的数组单独取出并排序，然后用k长滑窗O(1)计算方差问…...

编程日记 2026/2/6 7:24:50

Mac mini 安装mysql数据库以及出现的一些问题的解决方案

首先先去官网安装一下mysql数据库，基本上都是傻瓜式安装的流程，我也就不详细说了。接下来就是最新版的mysql安装的时候，他就会直接让你设置一个新的密码。打开设置，拉到最下面就会看到一个mysql的图标： 我设置的就是…...

编程日记 2026/1/31 20:57:10

1. 启动ollama服务

2. 查看ollama环境下的模型

3. 启动docker webui服务

4. 参考文章

相关文章：