本地部署DeepSeek R1 + 界面可视化open-webui【ollama容器+open-webui容器】
本地部署DeepSeek R1 + 界面可视化open-webui
本文主要讲述如何用ollama镜像和open-webui镜像部署DeepSeek R1, 镜像比较方便我们在各个机器之间快速部署。
显卡推荐
| 模型版本 | CPU | 内存 | GPU | 显卡推荐 |
|---|---|---|---|---|
| 1.5B | 4核+ | 8GB+ | 非必需4GB+ | RTX1650、RTX2060 |
| 7B、8B | 8核+ | 16GB+ | 8GB+ | RTX3070、RTX4060 |
| 14B | 12核+ | 32GB+ | 16GB+ | RTX4090、RTX5080 |
| 32B | 16核+ | 64GB+ | 24GB+ | A100 40GB |
| 70B | 32核+ | 128GB+ | 多卡 | 2×A100 80GB |
| 671B | 64核+ | 512GB+ | 多卡 | 8×A100/H100 |
以上配置仅供参考
安裝部署ollama镜像
进入 ollama镜像官网 | https://hub.docker.com/r/ollama/ollama,选择Download

镜像是部署在ubuntu系统上的,请确保已经安装好docker和NVIDIA Container Toolkit等系统环境。
拉取启动镜像
创建一个目录,用来保存ollama下载下来的模型
mkdir -p ollama/data
cd ollama/
只有CPU的情况下:
sudo docker run -d -v ./data:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
有GPU的情况下:
sudo docker run -d --gpus=all -v ./data:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
制作成docker-compose 文件管理镜像
version: '3.8'services:ollama:image: ollama/ollamacontainer_name: ollamarestart: alwaysvolumes:- ./data:/root/.ollamaports:- "11434:11434"
安裝部署open-webui镜像
- Open WebUI Github
- Open WebUI Document
echo 'export OLLAMA_HOST=0.0.0.0' >> ~/.bashrc
source ~/.bashrc
拉取并启动镜像
- 启动
docker会先拉取镜像,再启动
sudo docker run --network=host -v /work/open-webui/open-webui:/app/backend/data -e OLLAMA_BASE_URL=http://127.0.0.1:11434 --name open-webui --restart always ghcr.io/open-webui/open-webui:main
制作成docker-compose 文件管理镜像
version: '3.8'services:open-webui:image: ghcr.io/open-webui/open-webui:maincontainer_name: open-webuirestart: alwaysnetwork_mode: hostvolumes:- /work/open-webui/open-webui:/app/backend/dataenvironment:- OLLAMA_BASE_URL=http://127.0.0.1:11434# Optionally add ports or other configurations if neededports:- "8080:8080"
启动镜像
sudo docker-compose up
进入设置界面,配置ollama服务地址

链接过程中遇到故障 服务器连接问题
下载模型
进入到 open-webui的主页,点击 + 号,添加模型

搜索模型,输入deepseek-r1:32b,或其他版本的模型,下载模型需要等待,请耐心等待模型下载完整。

开始进入搜嘎模型:

END

相关文章:
本地部署DeepSeek R1 + 界面可视化open-webui【ollama容器+open-webui容器】
本地部署DeepSeek R1 界面可视化open-webui 本文主要讲述如何用ollama镜像和open-webui镜像部署DeepSeek R1, 镜像比较方便我们在各个机器之间快速部署。 显卡推荐 模型版本CPU内存GPU显卡推荐1.5B4核8GB非必需4GBRTX1650、RTX20607B、8B8核16GB8GBRTX3070、RTX…...
macOS部署DeepSeek-r1
好奇,跟着网友们的操作试了一下 网上方案很多,主要参考的是这篇 DeepSeek 接入 PyCharm,轻松助力编程_pycharm deepseek-CSDN博客 方案是:PyCharm CodeGPT插件 DeepSeek-r1:1.5b 假设已经安装好了PyCharm PyCharm: the Pyth…...
基于STM32与BD623x的电机控制实战——从零搭建无人机/机器人驱动系统
系列文章目录 1.元件基础 2.电路设计 3.PCB设计 4.元件焊接 5.板子调试 6.程序设计 7.算法学习 8.编写exe 9.检测标准 10.项目举例 11.职业规划 文章目录 一、为什么选择这两个芯片?1.1 STM32微控制器1.2 ROHM BD623x电机驱动 二、核心控制原理详解2.1 H桥驱动奥…...
基于ffmpeg+openGL ES实现的视频编辑工具-字幕添加(六)
在视频编辑领域,字幕的添加是一项极为重要的功能,它能够极大地丰富视频内容,提升观众的观看体验。当我们深入探究如何实现这一功能时,FreeType 开源库成为了强大助力。本文将详细阐述借助 FreeType 库生成字幕数据的过程,以及如何实现字幕的缩放、移动、旋转、颜色修改、对…...
C++中const T为什么少见?它有什么用途?
在C中,右值引用(T&&)是移动语义和完美转发的核心特性之一,但你是否注意到,const T&&(const右值引用)却很少被使用?它到底有什么用途? 今天我们就来深入…...
Leetcode 位计算
3095. 或值至少 K 的最短子数组 I 3097. Shortest Subarray With OR at Least K II class Solution:def minimumSubarrayLength(self, nums: List[int], k: int) -> int:n len(nums)bits [0] * 30res infdef calc(bits):return sum(1 << i for i in range(30) if…...
SpringBoot3.x整合WebSocket
SpringBoot3.x整合WebSocket 本文主要介绍最新springboot3.x下如何整合WebSocket. WebSocket简述 WebSocket 是一种在单个 TCP 连接上进行全双工通信的协议,它允许在浏览器和服务器之间进行实时的、双向的通信。相对于传统的基于请求和响应的 HTTP 协议ÿ…...
猿大师办公助手对比其他WebOffice在线编辑Office插件有什么优势
1. 原生Office功能完整嵌入,排版一致性保障 猿大师办公助手直接调用本地安装的微软Office、金山WPS或永中Office,支持所有原生功能(如复杂公式、VBA宏等),确保网页编辑与本地打开的文档排版完全一致。 提供OLE嵌入和完…...
STM32创建静态库lib
创建静态库lib 1. 新建工程1.1 创建工程文件夹1.2 编写用户相关代码1.2.1 stm32f4xx_it.h1.2.2 stm32f4xx_it.c1.2.3 标准库配置:stm32f4xx_conf.h1.2.4 HAL库的配置:stm32f4xx_hal_conf.h1.2.5 LL库配置:stm32f4xx_ll_conf.h 1.3 移植通用文…...
Hive JOIN过滤条件位置玄学:ON vs WHERE的量子纠缠
Hive JOIN过滤条件位置玄学:ON vs WHERE的量子纠缠 作为数据工程师,Hive JOIN就像吃火锅选蘸料——放错位置味道全变!今天带你破解字节/阿里等大厂高频面试题:ON和WHERE后的过滤条件究竟有什么不同? 一、核心差异对比表 特性ON子句WHERE子句执行时机JOIN操作时JOIN完成后…...
MAC快速本地部署Deepseek (win也可以)
MAC快速本地部署Deepseek (win也可以) 下载安装ollama 地址: https://ollama.com/ Ollama 是一个开源的大型语言模型(LLM)本地运行框架,旨在简化大模型的部署和管理流程,使开发者、研究人员及爱好者能够高效地在本地环境中实验和…...
javaEE-13.spring MVC
目录 什么是spring web mvc: 什么是MVC: 一.创建一个spring项目 二.实现功能: 创建helloController.java项目: 建立连接: RequestMapping注解: 1.RequestMapping注解的使用: 2. RequestMapping 是GET还是POST请求 3.指定请求方法 RestControll…...
C/C++ | 每日一练 (2)
💢欢迎来到张胤尘的技术站 💥技术如江河,汇聚众志成。代码似星辰,照亮行征程。开源精神长,传承永不忘。携手共前行,未来更辉煌💥 文章目录 C/C | 每日一练 (2)题目参考答案封装继承多态虚函数底…...
Nginx 常用命令和部署详解及案例示范
一、Nginx常用命令 1.1 启动 Nginx 要启动 Nginx 服务,可以使用以下命令: sudo systemctl start nginx1.2 停止 Nginx 如果需要停止 Nginx 服务,可以使用以下命令: sudo systemctl stop nginx1.3 重启 Nginx 在修改了 Nginx…...
GO大模型应用开发框架-
Eino 旨在提供基于 Golang 语言的终极大模型应用开发框架。 它从开源社区中的诸多优秀 LLM 应用开发框架,如 LangChain 和 LlamaIndex 等获取灵感,同时借鉴前沿研究成果与实际应用,提供了一个强调简洁性、可扩展性、可靠性与有效性࿰…...
保姆级!springboot访问Ollama API并调用DeepSeek模型 Api
要在springboot中访问Ollama API并调用DeepSeek模型,你需要遵循以下步骤。首先,确保你有一个有效的Ollama服务器实例运行中,并且DeepSeek模型已经被加载。 可以参考我的这篇博客 保姆级!使用Ollama本地部署DeepSeek-R1大模型 并java通过api 调用 使用Spring Boot + Sprin…...
力扣hot100 ——搜索二维矩阵 || m+n复杂度优化解法
编写一个高效的算法来搜索 m x n 矩阵 matrix 中的一个目标值 target 。该矩阵具有以下特性: 每行的元素从左到右升序排列。每列的元素从上到下升序排列。 解题思路: 借助行和列有序特性,不断按行或者列缩小范围;途中数字表示每…...
娱乐使用,可以生成转账、图片、聊天等对话内容
软件介绍 今天要给大家介绍一款由吾爱大佬 lifeixue 开发的趣味软件。它的玩法超丰富,能够生成各式各样的角色,支持文字聊天、发红包、转账、发语音以及分享图片等多种互动形式,不过在分享前得着重提醒,此软件仅供娱乐࿰…...
【PyQt5】python可视化开发:PyQt5介绍,开发环境搭建快速入门
✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,…...
使用 FFmpeg 剪辑视频指南
FFmpeg 是一个功能强大的多媒体处理工具,可以进行视频和音频的剪辑、合并、转码等操作。本文将详细介绍如何使用 FFmpeg 进行视频剪辑,并通过实例帮助你快速掌握剪辑技巧。我们会从最基础的剪切功能讲起,再延伸到一些高级操作,如指…...
Arm架构寄存器编程与定时器控制详解
1. Arm架构下的硬件通信基础在嵌入式系统开发中,寄存器编程和定时器控制是两大核心技术支柱。作为CPU与外围设备通信的桥梁,寄存器通过内存映射方式实现了对硬件功能的精确控制。Arm架构作为现代嵌入式系统的主流选择,其Message Handling Uni…...
深入解读Simulink SIL仿真的三种模式:顶层模型、Model模块与子系统模块到底怎么选?
Simulink SIL仿真模式深度决策指南:从架构设计到测试效率的全面优化 当面对一个包含数十个子系统的汽车电控单元模型时,团队在集成测试阶段发现顶层SIL仿真耗时长达6小时,而关键算法模块的单元验证覆盖率不足60%。这种典型困境揭示了SIL仿真策…...
# 2026年SaaS小程序制作平台对比:乔拓云、有赞、微盟
2026年SaaS小程序制作平台对比:乔拓云、有赞、微盟 SaaS小程序制作平台对比:乔拓云、有赞、微盟的深度剖析 在数字化转型浪潮中,微信小程序已成为企业触达用户、拓展线上业务的核心载体。面对市场上琳琅满目的SaaS小程序制作平台,…...
Kubernetes 垃圾收集(Garbage Collection)完全指南:对象生命周期管理
Kubernetes 垃圾收集(Garbage Collection)完全指南:对象生命周期管理 1. Owner 和 Dependent(所有者与依赖对象) 1.1 核心概念Owner(所有者):Kubernetes 中部分对象可作为其他对象的…...
再谈Agent核心模式:ReAct、Plan-and-Solve 与 ToT
很多 Agent 原型跑得很顺,一进真实业务长链路就开始失控。它能查一个订单,也能调用一个工具,但一旦任务变成“先判断客户等级,再查合同,再核对 SLA,再生成补偿方案,再发起审批”,简单…...
机器学习评估指标全解析:从原理到Python实战
1. 机器学习算法评估指标全景解读在数据科学项目中,选择合适的评估指标往往比模型选择本身更重要。想象一下这样的场景:你花费两周时间优化了一个准确率达到95%的欺诈检测模型,上线后却发现漏掉了80%的真实欺诈案例——这就是错误选择评估指标…...
商超装修吊楣装饰铝拉网现场复尺
做工程采购这几年,我见过太多供应商在展厅里把样品吹得天花乱坠,一到项目现场就原形毕露。装饰金属网这行尤其如此——材料属性、表面处理、加工精度、交付周期,任何一环出问题,工地上几十号人都得等你。后来我养成了个习惯&#…...
实战复盘:一次内网渗透中,如何利用旧版向日葵客户端获取远程控制权限
内网渗透实战:旧版向日葵客户端的远程控制漏洞分析与防御 当你在一次内网渗透测试中发现多台主机仍在使用旧版向日葵远程控制软件时,这可能是一条通往域控的捷径。去年的一次红队行动中,我们正是通过一台边缘服务器的SunloginClient 10.3.0.2…...
部署与可视化系统:边缘设备部署:YOLOv8 量化 + NCNN 在树莓派 5 上实时检测
写在前面:当你必须用一块“卡片电脑”跑实时AI推理 如果你拿到过树莓派5,大概率经历过这样的心理路线图: 开机那一刻:“哇,这么小的板子,跑个完整桌面都行!” 装上PyTorch之后:“等等,加载个YOLOv8模型怎么要两分钟?” 真正跑推理的时候:“一秒一帧?PPT都比这流畅…...
