当前位置：首页 > news >正文

本地部署大模型ollama+docker+open WebUI/Lobe Chat

news 2026/2/10 19:18:20

文章目录

大模型工具Ollama
- 下载
- 安装
- 运行
- Spring Ai 代码测试
- - 加依赖
  - 配置
  - 写代码
ollama的web&Desktop
- 搭建部署Open WebUI有两种方式
- - Docker Desktop
  - Docker部署Open WebUI
  - Docker部署Lobe Chat
  - - 可以配置OpenAI的key
    - 也可以配置ollama
大模型的选择

本篇基于windows环境下配置

大模型工具Ollama

https://ollama.com/

在这里插入图片描述

下载

https://ollama.com/download
windows环境下就安装windows版本
在这里插入图片描述

在这里插入图片描述

安装

点击下载的exe文件进行傻瓜式安装

运行

去ollama官网（models模块下）找大模型的名字，然后复制ollama的运行名字
https://ollama.com/library
在这里插入图片描述

ollama run qwen:4b

Spring Ai 代码测试

默认ollama会监听11434端口，可以使用下面命令查看
在这里插入图片描述

netstat -ano | findstr 11434

可以使用ollama list指令查看本地已经下好的大模型

ollama list

在这里插入图片描述

加依赖

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-ollama-spring-boot-starter</artifactId></dependency>

或者使用23版以上的idea，创建spring项目的时候选最新版本，直接勾选上AI模块下的ollama模块

配置

spring:application:name: open-ai-05-ollamaai:ollama:base-url: http://localhost:11434chat:options:model: qwen:4b

写代码

在这里插入图片描述

@RestController
public class OllamaController {@Autowiredprivate OllamaChatClient ollamaChatClient;@RequestMapping(value = "/ai/ollama")public Object ollama(@RequestParam(value = "msg") String msg){String call = ollamaChatClient.call(msg);System.out.println(call);return call;}@RequestMapping(value = "/ai/ollama2")public Object ollama2(@RequestParam(value = "msg") String msg){ChatResponse response = ollamaChatClient.call(new Prompt(msg,OllamaOptions.create().withModel("qwen:4b").withTemperature(0.4f)));String content = response.getResult().getOutput().getContent();System.out.println(content);return content;}
}

ollama的web&Desktop

看ollama的github主页下面有很多的web&Desktop，比较流行的是Open WenUI
Open WenUI Github https://github.com/open-webui/open-webui
Open WenUI 官网：https://github.com/open-webui/open-webui

搭建部署Open WebUI有两种方式

Docker方式（官网推荐）
源代码部署安装方式：（文档https://docs.openwebui.com/getting-started/）

Docker Desktop

windows环境下推荐使用Docker Desktop

轻量化，界面化操作Docker容器
官网下载安装包
https://www.docker.com/products/docker-desktop/
下载后傻瓜式安装即可，安装后需要重启，然后打开Docker Desktop后的界面如下：
在这里插入图片描述

Docker部署Open WebUI

在docker中运行Open WebUI
在命令行运行docker指令

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v D:\dev\open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

这是一个 docker run 命令，用于启动一个新的 Docker 容器，下面是这个命令各个部分的解释：

docker run：这是 Docker 的命令，用于从指定的镜像启动一个新的容器；
-d：表示在“分离”模式下运行容器，即后台运行；
-p 3000:8080：端口映射，表示将宿主机的3000端口映射到容器的8080端口，当你访问宿主机的3000端口时，实际上会访问容器内的8080端口；
–add-host=host.docker.internal:host-gateway：这个选项向容器的 /etc/hosts 文件中添加一条记录，这通常用于让容器能够解析到宿主机的名称，并且将其 IP 地址设置为宿主机的网关地址，这在某些网络配置中很有用，尤其是当容器需要知道宿主机的地址时；
-v D:\dev\open-webui:/app/backend/data：卷挂载，这表示将宿主机的 D:\dev\open-webui 目录挂载到容器内的 /app/backend/data 目录，这样，容器和宿主机之间可以共享这个目录中的数据；
–name open-webui：为容器指定一个名称，这里是 open-webui；
–restart always：这个选项告诉 Docker 在容器退出时总是自动重启它，无论容器是因为何种原因退出，它都会自动重启；
ghcr.io/open-webui/open-webui:main：这是你要运行的 Docker 镜像的完整名称，ghcr.io 是 GitHub Container Registry 的地址，open-webui/open-webui 是镜像的仓库和名称，main是标签，通常表示该镜像的最新或主分支版本；

第一次运行需要拉取镜像比较慢，等待执行完成
在这里插入图片描述
这时候打开docker desktop就可以在images模块下看到拉取到的镜像

我们在拉取镜像的时候指定了Web UI的端口为3000，所以访问3000端口即可

http://localhost:3000/

第一次会要求登录
在这里插入图片描述
注册并登录

上来后和Chatgpt的页面很像的。

在这里插入图片描述
select model的地方选择上我们通过ollama部署的模型。然后就可以开心聊天了

Docker部署Lobe Chat

官网：https://lobehub.com/
Github：https://github.com/lobehub/lobe-chat

Built for you the Super Individual （专为你打造的超级个人）
现代化设计的开源 ChatGPT/LLMs
聊天应用与开发的UI框架；支持语音合成、多模态、可扩展的（function call）插件系统；
一键免费拥有你自己的ChatGPT/Gemini/Claude/Ollama 应用；

Lobe Chat 部署

使用 Vercel、Zeabur 或 Sealos 部署；
使用 Docker 部署；

docker run -d -p 3210:3210 -e OPENAI_API_KEY=sk-xxxx -e ACCESS_CODE=lobe66 --name lobe-chat lobehub/lobe-chat

完整的部署文档：https://lobehub.com/zh/docs/self-hosting/start

同样的，在拉取完成后，docker desktop中也会有镜像，
在这里插入图片描述
同样的方式，访问我们指定的3210端口

这个需要点击设置去配置模型

可以配置OpenAI的key

在这里插入图片描述
注意代理的地址要在后面加上/v1
配置好后就可以访问openai

也可以配置ollama

在这里插入图片描述
本机默认代理地址可以不用配，模型列表中选上你的模型就可以使用了。
还可以加插件使用
也可以在本地部署更强大的模型，使用图片，文件，音频等模态

大模型的选择

大语言模型主要分为国外大模型和国内大模型；
国外大模型，可能受到一些限制，或者不稳定；
国内也有非常优秀的大模型，国内大模型排行榜：
- https://www.superclueai.com/
- 基于中文语言理解测评基准，包括代表性的数据集、基准(预训练)模型、语料库、排行榜；
- 选择一系列有一定代表性的任务对应的数据集，做为测试基准的数据集，这些数据集会覆盖不同的任务、数据量、任务难度；

本地部署大模型ollama+docker+open WebUI/Lobe Chat

文章目录大模型工具Ollama下载安装运行Spring Ai 代码测试加依赖配置写代码 ollama的web&Desktop搭建部署Open WebUI有两种方式Docker DesktopDocker部署Open WebUIDocker部署Lobe Chat可以配置OpenAI的key也可以配置ollama 大模型的选择本篇基于windows环境下配置大模型…...

编程日记 2024/5/8 1:38:50

qt学习篇---界面按键关联（信号和槽）

目录 1.qt基础 2.做一个界面创建project UI界面设计信号和槽 1.控件改名字 2.什么是信号和槽 3.怎么关联信号和槽自动关联手动关联 1.qt基础 qt可移植性强，不久会用到MCU。很有意义学习 2.做一个界面创建project 不要中文路径选择QWidget .pro文件…...

编程日记 2024/5/8 1:37:49

python Django 的内置权限系统或自定义模型来存储更复杂的角色和权限关系

在 Django 中，管理用户权限和角色通常涉及到使用 Django 的内置权限系统或自定义模型来存储更复杂的角色和权限关系。下面是一个基本的指南，说明如何在 Django 中为后台管理系统分配权限并将其保存在数据库中，同时结合 Vue.js 和 Element UI 作为前端框架。后端（Django）…...

编程日记 2024/5/8 1:36:48

不上班，我靠这5份赚钱副业养活了自己

在这个快节奏的社会里，很多人都在为生活奔波忙碌。今天，就让我来跟大家分享一下我的“躺平”秘籍吧！ 这一个月来，我没有上班，但好在有副业养活自己。有时候，我真的觉得有一份自己喜欢的自媒体副业挺好的。…...

编程日记 2024/5/8 1:35:47

强一致性的皇冠：分布式事务模型的至高法则揭秘

关注微信公众号 “程序员小胖” 每日技术干货，第一时间送达！ 引言分布式事务模型是分布式系统设计的核心，关键在于保证数据一致性和事务完整性，尤其强调强一致性。诸如2PC、3PC、Saga、TCC等模型与协议，应运而生以解…...

编程日记 2024/5/8 1:34:46

mac/windows下安装docker，minikube

1、安装docker Get Started | Docker 下载安装docker 就行启动后，就可以正常操作docker了使用docker -v 验证是否成功就行 2、安装minikube，是基于docker-desktop的 2.1、点击设置 2.2、选中安装，这个可能需要一点时间这样安装后&…...

编程日记 2024/5/8 1:31:43

【爬虫】fake_useragent的使用、BeautifulSoup(find()和find_all())

1 fake_useragent 2 BeautifulSoup 3 Beautiful Soup库的find()和find_all() 1 fake_useragent fake_useragent是一个Python库，用于生成随机的用户代理字符串。用户代理是在HTTP请求中发送给服务器的一种标识，它告诉服务器发送请求的客户端的类型、版本…...

编程日记 2024/5/8 1:30:42

ComfyUI中图像亮度/对比度/饱和度处理

用上面这个节点可以同时设置图片的亮度、对比度和饱和度。【保姆级教程】一口气分享在ComfyUI中常用的30多种基本图像处理方式更多好玩且实用AIGC工作流和节点星球号：32767063 本期资料链接往期学习资料整理AI学习资料库...

编程日记 2024/5/8 1:29:41

基于FPGA的DDS波形发生器VHDL代码Quartus仿真

名称：基于FPGA的DDS波形发生器VHDL代码Quartus仿真（文末获取） 软件：Quartus 语言：VHDL 代码功能： DDS波形发生器VHDL 1、可以输出正弦波、方波、三角波 2、可以控制输出波形的频率 DDS波形发生器原理…...

编程日记 2024/5/8 1:27:39

C++语法｜可调用对象与function类型

文章目录引入function的使用function类型的典型应用function类型的原理实现代码优化可变参的函数对象引入还记得C语言中的函数指针数组吗？ 我们通过函数指针数组实现一个，图书管理系统的界面： #include <stdio.h> void doShowAllB…...

编程日记 2024/5/8 1:25:38

Linux学习之路 -- 文件 -- 文件描述符

前面介绍了与文件相关的各种操作，其中的各个接口都离不开一个整数，那就是文件描述符，本文将介绍文件描述符的一些相关知识。目录 <1>现象 <2>原理文件fd的分配规则和利用规则实现重定向 <1>现象我们可以先通过prin…...

编程日记 2024/5/8 1:24:37

JDK动态代理和Cglib动态代理区别

1.如果目标类实现了接口，将会使用JDK动态代理，否则会使用Cglib动态代理; 2.JDK代理使用自己的字节码生成工具生成代理对象，而Cglib会使用ASM字节码生成工具去生成; 3.JDK动态代理是通过反射的方式去实现代理对象的所有方法，通过…...

编程日记 2024/5/8 1:23:36

牛客 | 字符金字塔

请打印输出一个字符金字塔，字符金字塔的特征请参考样例 #include <stdio.h> #include <string.h> using namespace std; int main() {char c;scanf("%c", &c);for (int i 1; i < (c - 64); i)//第一个循环决定了有多少行{//c:67 第三…...

编程日记 2024/5/8 1:22:34

【计算机科学速成课】笔记三——操作系统

文章目录 18.操作系统问题引出——批处理设备驱动程序多任务处理虚拟内存内存保护Unix 18.操作系统问题引出—— Computers in the 1940s and early 50s ran one program at a time. 1940,1950 年代的电脑，每次只能运行一个程序 A programmer would write one at…...

编程日记 2024/5/8 1:19:31

用js代码实现贪吃蛇小游戏

js已经学了大部分了，现在就利用我所学的js知识试试做贪吃蛇小游戏吧以下部分相关图片以及思路笔记均出自渡一陈老师的视频首先制作简单的静态页面，添加贪吃蛇移动的背景和相关图片，比如开始游戏等等将各个功能均封装在函数中&#xff0…...

编程日记 2024/5/8 1:18:30

微信小程序+esp8266温湿度读取

本文主要使用微信小程序显示ESP8266读取的温湿度并通过微信小程序控制LED灯。小程序界面如下图所示原理讲解 esp8266 通过mqtt发布消息，微信小程序通过mqtt 订阅消息，小程序订阅后，就可以实时收到esp8266 传输来的消息。个人可免费注册五个微信小程序账号，在微信小程序官…...

编程日记 2024/5/8 1:17:29

软考中级-软件设计师（十）网络与信息安全基础知识

一、网络概述 1.1计算机网络的概念计算机网络的发展：具有通信功能的单机系统->具有通信功能的多机系统->以共享资源为目的的计算机网络->以局域网及因特网为支撑环境的分布式计算机系统计算机网络的功能：数据通信、资源共享、负载均衡、高…...

编程日记 2024/5/8 1:16:28

Prompt提示词教程 | 提示工程指南 | 提示词示例入门篇

在上一节中，我们介绍并给出了如何赋能大语言模型的基本示例。如果还没看而且是刚入门的同学建议看下，有个基本概念。 Prompt提示词教程 | 提示工程指南 | 提示工程简介https://blog.csdn.net/HRG520JN/article/details/138523705在本节中，我…...

编程日记 2024/5/8 1:14:26

uniapp + uView动态表单校验

项目需求：动态循环表单，并实现动态表单校验页面： <u--form label-position"top" :model"tmForm" ref"tmForm" label-width"0px" :rulesrules><div v-for"(element, index) in tmForm…...

编程日记 2024/5/8 1:13:24

树莓派超全系列教程文档--(62)使用rpicam-app通过网络流式传输视频

使用rpicam-app通过网络流式传输视频使用 rpicam-app 通过网络流式传输视频UDPTCPRTSPlibavGStreamerRTPlibcamerasrc GStreamer 元素文章来源： http://raspberry.dns8844.cn/documentation 原文网址使用 rpicam-app 通过网络流式传输视频本节介绍来自 rpica…...

编程新知 2025/11/5 13:03:58

自然语言处理——循环神经网络

自然语言处理——循环神经网络循环神经网络应用到基于机器学习的自然语言处理任务序列到类别同步的序列到序列模式异步的序列到序列模式参数学习和长程依赖问题基于门控的循环神经网络门控循环单元（GRU）长短期记忆神经网络（LSTM&#xff09…...

编程新知 2026/2/4 11:21:40

全志A40i android7.1 调试信息打印串口由uart0改为uart3

一，概述 1. 目的将调试信息打印串口由uart0改为uart3。 2. 版本信息 Uboot版本：2014.07； Kernel版本：Linux-3.10； 二，Uboot 1. sys_config.fex改动使能uart3(TX:PH00 RX:PH01)，并让boo…...

编程新知 2026/2/5 6:28:09

AI病理诊断七剑下天山，医疗未来触手可及

一、病理诊断困局：刀尖上的医学艺术 1.1 金标准背后的隐痛病理诊断被誉为"诊断的诊断"，医生需通过显微镜观察组织切片，在细胞迷宫中捕捉癌变信号。某省病理质控报告显示，基层医院误诊率达12%-15%，专家会诊…...

编程新知 2026/2/6 20:53:34

QT3D学习笔记——圆台、圆锥

类名作用Qt3DWindow3D渲染窗口容器QEntity场景中的实体（对象或容器）QCamera控制观察视角QPointLight点光源QConeMesh圆锥几何网格QTransform控制实体的位置/旋转/缩放QPhongMaterialPhong光照材质（定义颜色、反光等）QFirstPersonC…...

编程新知 2026/1/29 5:26:37

Java数值运算常见陷阱与规避方法

整数除法中的舍入问题问题现象当开发者预期进行浮点除法却误用整数除法时，会出现小数部分被截断的情况。典型错误模式如下： void process(int value) {double half = value / 2; // 整数除法导致截断// 使用half变量 }此时...

编程新知 2026/2/4 13:10:38

Git 3天2K星标：Datawhale 的 Happy-LLM 项目介绍（附教程）

引言在人工智能飞速发展的今天，大语言模型（Large Language Models, LLMs）已成为技术领域的焦点。从智能写作到代码生成，LLM 的应用场景不断扩展，深刻改变了我们的工作和生活方式。然而，理解这些模型的内部…...

编程新知 2026/1/29 11:06:33

WPF八大法则：告别模态窗口卡顿

⚙️ 核心问题：阻塞式模态窗口的缺陷原始代码中ShowDialog()会阻塞UI线程，导致后续逻辑无法执行： var result modalWindow.ShowDialog(); // 线程阻塞 ProcessResult(result); // 必须等待窗口关闭根本问题&#xff1a…...

编程新知 2026/1/26 17:26:03

uniapp 集成腾讯云 IM 富媒体消息（地理位置/文件）

UniApp 集成腾讯云 IM 富媒体消息全攻略（地理位置/文件） 一、功能实现原理腾讯云 IM 通过消息扩展机制支持富媒体类型，核心实现方式： 标准消息类型：直接使用 SDK 内置类型（文件、图片等）自…...

编程新知 2025/10/25 5:53:05

《信号与系统》第 6 章信号与系统的时域和频域特性

目录 6.0 引言 6.1 傅里叶变换的模和相位表示 6.2 线性时不变系统频率响应的模和相位表示 6.2.1 线性与非线性相位 6.2.2 群时延 6.2.3 对数模和相位图 6.3 理想频率选择性滤波器的时域特性 6.4 非理想滤波器的时域和频域特性讨论 6.5 一阶与二阶连续时间系统 6.5.1 …...

编程新知 2026/2/5 4:45:50

文章目录

大模型工具Ollama

下载

安装

运行

Spring Ai 代码测试

加依赖

配置

写代码

ollama的web&Desktop

搭建部署Open WebUI有两种方式

Docker Desktop

Docker部署Open WebUI

Docker部署Lobe Chat

可以配置OpenAI的key

也可以配置ollama

大模型的选择

相关文章：