当前位置：首页 > news >正文

本地部署【LLM-deepseek】大模型 ollama+deepseek/conda(python)+openwebui/docker+openwebui

news 2026/5/13 15:51:12

通过ollama本地部署deepseek
总共两步
1.模型部署
2.[web页面]

参考官网
ollama:模型部署
https://ollama.com/
open-webui:web页面
https://github.com/open-webui/open-webui

设备参考 Mac M 芯片 windows未知

蒸馏模型版本:deepseek-r1:14b 运行情况macminim2 24+256 本地部署后内存舒缓，不影响电脑其他软件使用macminim4 16+256 本地部署后内存紧张，影响电脑其他软件使用内存占用情况：11G -> 21.72G 模型思考时，大概会占用11到12G的内存

1.ollama:模型部署

	# 下载 ollamahttps://ollama.com/# 运行 deepseek 选择自己设备适合的版本[:14b]，官网看命令 ollama run deepseek-r1:14b # 当前终端运行，可在终端交互ollama run deepseek-r1:14b & disown   # 放到后台去跑，终端页面关掉也不会关闭此模型

2.open-webui:web页面推荐python的终端部署方式

2.1 docker部署web页面

	#docker pull ghcr.io/open-webui/open-webui:main# 创建本地目录，避免重启后数据丢失mkdir /Users/admin/program/docker/instance/open-webui/datacd /Users/admin/program/docker/instance/open-webui# 启动容器docker run -d -p 3000:8080 -v $PWD/data:/app/backend/data --name open-webui ghcr.io/open-webui/open-webui:main

2.2 python部署web页面需要在有python环境下执行推荐

	pip install open-webuiopen-webui serveopen-webui serve & disown # This will start the Open WebUI server, which you can access at http://localhost:8080

2.3 [忽略] conda创建python环境

	conda create -n openwebui python=3.12 -y # python=3.12：指定 Python 版本 -y：自动确认安装conda initconda activate openwebuipip install open-webuiopen-webui serve							# 这个不能关闭终端open-webui serve & disown  					# 使用这个启动成功后，可以关闭终端了open-webui serve > /dev/null 2>&1 & disown 	# 使用这个启动成功后，可以关闭终端了# This will start the Open WebUI server, which you can access at http://localhost:8080# 放在后台的任务如何查看呢jobs							# 使用 jobs 命令查看当前作业状态。ps aux | grep "your-command"	# 或者使用 ps aux | grep "your-command" 检查进程是否存在。

本地部署【LLM-deepseek】大模型 ollama+deepseek/conda(python)+openwebui/docker+openwebui

通过ollama本地部署deepseek 总共两步 1.模型部署 2.[web页面] 参考官网 ollama:模型部署 https://ollama.com/ open-webui:web页面 https://github.com/open-webui/open-webui 设备参考 Mac M 芯片 windows未知蒸馏模型版本:deepseek-r1:14b 运行情况macminim2 24256 本地…...

编程日记 2025/2/13 11:30:56

网络分析工具—WireShark的安装及使用

Wireshark 是一个广泛使用的网络协议分析工具，常被网络管理员、开发人员和安全专家用来捕获和分析网络数据包。它支持多种网络协议，能够帮助用户深入理解网络流量、诊断网络问题以及进行安全分析。 Wireshark 的主要功能数据包捕获与分析： …...

编程日记 2025/2/13 11:26:51

MobaXterm的图形化界面支持：原理与分辨率问题解决

1. 概述 MobaXterm 是一款功能强大的远程访问工具，支持SSH、RDP、X11、VNC等多种协议，并内置了强大的图形界面支持，让用户能够在远程操作Linux/Unix系统时，享受到类似本地桌面的流畅体验。与传统的SSH客户端不同，Mo…...

编程日记 2025/2/13 11:24:49

Java JVM（Java Virtual Machine）解析

Java Virtual Machine（JVM）是Java平台的核心组成部分，它负责执行Java字节码，并提供了一个运行时环境。本文将深入探讨JVM的工作原理、组成部分以及其在Java开发中的重要性。一、JVM的基本概念 JVM是一个虚拟的计算机&#xff0…...

编程日记 2025/2/13 11:23:47

pytest测试专题 - 1.2 如何获得美观的测试报告

<< 返回目录 1 pytest测试专题 - 1.2 如何获得美观的测试报告 1.1 背景虽然pytest命令的报文很详细，用例在执行调试时还算比较方便阅读和提取失败信息， 但对于大量测试用例运行时，可能会存在以下不足报文被冲掉测试日志没法归档 …...

编程日记 2025/2/13 11:21:44

现阶段股指期货交易保证金和费用多少？股指期货一手多少钱？

股指期货交易的保证金就是你在买卖股指期货合约时，需存入交易账户的一笔资金。股指期货交易保证金是多少？ 股指期货的交易保证金就像是租房时的押金，确保你能承担交易带来的风险。一般来说，保证金的比例大概在合约价值的12-14…...

编程日记 2025/2/13 11:19:42

使用mermaid画流程图

本文介绍使用mermaid画流程图，并给出几个示例。背景目前，除有明确格式要求的文档外，笔者一般使用markdown写文档、笔记。当文档有图片时，使用Typora等软件可实时渲染，所见即所得。但如果文档接收方没有安装相关工具…...

编程日记 2025/2/13 11:17:39

大模型笔记：pytorch实现MOE

0 导入库 import torch import torch.nn as nn import torch.nn.functional as F 1 专家模型 #一个简单的专家模型，可以是任何神经网络架构 class Expert(nn.Module):def __init__(self, input_size, output_size):super(Expert, self).__init__()self.fc nn.L…...

编程日记 2025/2/13 11:15:35

HAL库USART中断接收的相关问题

文章目录一、使用中断的步骤二、相关函数分析1、HAL_UART_IRQHandler2、UART_Receive_IT3、HAL_UART_Receive_IT4、UART_Start_Receive_IT5、总结三、HAL库使用心得一、使用中断的步骤 1、配置GPIO 2、配置USART1 3、设置UART1中断优先级（不开启手动中断&#x…...

编程日记 2025/2/13 11:11:29

@Transational事务注解底层原理以及什么场景事务会失效

Transactional的底层是如何实现的底层是通过动态代理实现的。Spring Boot 在运行时会生成一个代理对象，该代理对象被注解的方法调用，并在方法调用前后进行事务管理，事务管理包括开启事务，提交事务或回滚事务等操作。 1开启事务 …...

编程日记 2025/2/13 11:10:26

Linux扩容磁盘

启动 fdisk sudo fdisk /dev/sda输入p命令查询分区列表输入d命令删除所有分区需要一个一个删输入n命令创建新分区 40G可以不用输入，直接回车使用默认输入w命令保存操作查看分区情况 sudo fdisk -l会发现sda1不是启动分区（Boot列不是号&a…...

编程日记 2025/2/13 11:08:23

全面解析鸿蒙（HarmonyOS）开发：从入门到实战，构建万物互联新时代

文章目录引言一、鸿蒙操作系统概述二、鸿蒙开发环境搭建三、鸿蒙核心开发技术1. **ArkUI框架**2. **分布式能力开发**3. **原子化服务与元服务** 四、实战案例：构建分布式音乐播放器五、鸿蒙开发工具与调试技巧六、鸿蒙生态与未来展望结语引言随着万物互联时代…...

编程日记 2025/2/13 11:06:20

Uniapp 原生组件层级过高问题及解决方案

文章目录一、引言🏅二、问题描述📌三、问题原因❓四、解决方案💯4.1 使用 cover-view 和 cover-image4.2 使用 subNVue 子窗体4.3 动态隐藏原生组件4.4 使用 v-if 或 v-show 控制组件显示4.5 使用 position: fixed 布局五、总结&#x1f38…...

编程日记 2025/2/13 11:03:16

Android adb测试常用命令大全

目录一、查看最上层成activity名字: 二、查看Activity的任务栈： 三、获取安装包信息四、性能相关 1、显示CPU信息 : 2、查看CPU使用信息 3、内存信息（meminfo package_name or pid 使用程序的包名或者进程id显示内存信息） 4、电量信…...

编程日记 2025/2/13 11:02:15

linux的基础入门2

linux的root用户无论是Windows、MacOS、Linux均采用多用户的管理模式进行权限管理。在Linux系统中,拥有最大权限的账户名为:root(超级管理员) 而在前期，我们一直使用的账户是普通的用户普通用户的权限，一般在其HOME目录内是不受限的一旦出了HOME目录…...

编程日记 2025/2/13 11:01:11

19.4.8 数据库综合运用

编程日记 2025/2/13 10:57:02

JAVA中的抽象学习

一、Java SE 中的抽象概念在 Java 中，抽象（Abstraction）是面向对象编程的重要特性之一。抽象的核心思想是“只关注重要的特性，而忽略不重要的细节”。抽象通常通过抽象类和接口来实现，它帮助开发者将复杂的系统隐藏在…...

编程日记 2025/2/13 10:56:00

在 Go 中实现事件溯源：构建高效且可扩展的系统

事件溯源（Event Sourcing）是一种强大的架构模式，它通过记录系统状态的变化（事件）来重建系统的历史状态。这种模式特别适合需要高可扩展性、可追溯性和解耦的系统。在 Go 语言中，事件溯源可以通过一些简单的…...

编程日记 2025/2/13 10:54:58

加解密 | AES加、解密学习

加解密 | AES加、解密学习你的代码实现了一个简单的AES（高级加密标准）加密和解密的测试程序。以下是对代码的分析和一些改进建议： 代码功能初始化数据和密钥： 定义了一个16字节的输入数据 input_data。定义了一个16字节的AES…...

编程日记 2025/2/13 10:52:52

【学术投稿-2025年计算机视觉研究进展与应用国际学术会议 (ACVRA 2025)】CSS样式解析：行内、内部与外部样式的区别与优先级分析

简介 2025年计算机视觉研究进展与应用（ACVRA 2025）将于2025年2月28-3月2日在中国广州召开，会议将汇聚世界各地的顶尖学者、研究人员和行业专家，聚焦计算机视觉领域的最新研究动态与应用成就。本次会议将探讨前沿技术，…...

编程日记 2025/2/13 10:51:51

调幅无线传数据：避开这些坑，你的7kHz方波才能传得更远更稳

调幅无线传数据：避开这些坑，你的7kHz方波才能传得更远更稳在业余无线电和嵌入式通信领域，调幅（AM）无线传输一直是低成本解决方案的热门选择。但许多工程师在尝试用7kHz方波调制高频载波时，总会遇到信号失真…...

编程新知 2026/5/13 15:50:31

蓝牙窃密攻防实战：从协议漏洞到固件后门，国家安全部警示的近场威胁全解析

2026年5月11日，国家安全部官方发布重磅警示，明确指出蓝牙设备已成为不法分子实施近距离窃密、监听、跟踪的"隐形獠牙"。从日常使用的无线耳机、智能手表，到办公场景的蓝牙键鼠、会议音箱，再到工业控制中的蓝牙传感器&am…...

编程新知 2026/5/13 14:32:44

3分钟掌握GeoJSON.io：零代码地理数据可视化的革命性工具

3分钟掌握GeoJSON.io：零代码地理数据可视化的革命性工具【免费下载链接】geojson.io A quick, simple tool for creating, viewing, and sharing spatial data 项目地址: https://gitcode.com/gh_mirrors/ge/geojson.io 还在为复杂的地理信息系统软件而烦恼…...

编程新知 2026/5/13 13:30:33

从零搭建自动化任务中心：mgks/automation-hub部署与实战指南

1. 项目概述：自动化工作流的“中央厨房”如果你和我一样，在开发、运维或者日常工作中，经常需要重复执行一系列命令、脚本或者任务，那么你肯定对“自动化”这个词有着深刻的渴望。从简单的文件备份、日志清理，到复杂的C…...

编程新知 2026/5/13 13:09:20

告别云服务器：手把手教你用QEMU在Ubuntu 18.04上搭建专属内核调试环境

从零构建QEMU内核调试环境：Ubuntu 18.04下的UEFI开发实战手册当深夜的调试灯亮起，你是否还在为云服务器高昂的费用和网络延迟苦恼？本文将带你用一台普通Ubuntu机器，打造媲美物理机的内核开发环境。不同于常规教程，我…...

编程新知 2026/5/13 12:18:01

龙标管官方，凰标护民间：中国文化双轨时代到来@凤凰标志

龙标掌正统凰标护民间中国文艺进入「双轨」新时代官方有规制，民间有温度； 一龙定正统，一凰润众生。失衡百年：单轨秩序的盲区长久以来，中国文艺创作领域存在一处结构性失衡：官方正统民间原创有规制、有标…...

编程新知 2026/5/13 12:03:09

Cortex-R52处理器不可预测行为解析与安全设计

1. Cortex-R52处理器不可预测行为深度解析在嵌入式实时系统开发领域，处理器行为的确定性直接关系到系统的可靠性。Arm Cortex-R52作为面向功能安全应用的实时处理器，其对架构规范中"不可预测行为(UNPREDICTABLE Behaviors)"的实现方式颇具特色…...

编程新知 2026/5/13 11:15:46

MANT量化技术：大语言模型推理的硬件架构革新

1. MANT量化技术：大语言模型推理的硬件架构革新在人工智能领域，大语言模型(LLM)的推理效率一直是制约其实际应用的关键瓶颈。传统量化方法往往面临精度损失与硬件适配的双重挑战，而MANT技术的出现为这一困境提供了创新解决方案。作为一名深耕…...

编程新知 2026/5/13 10:17:55

职慧AI陪练产品全景解析：六大训练模式如何覆盖销售培养全场景

摘要：市面上的AI陪练产品大多只能做"话术对练"，真正能覆盖销售能力培养全链路的产品长什么样？本文深度拆解职行力职慧AI陪练的六大训练模式——话术陪练、情景对话、智能考试、微课学习、AI专家问答、训练官带教，以及背…...

编程新知 2026/5/13 9:42:05

Llama-3中文优化实战：从模型选型到本地部署全解析

1. 项目概述：从Llama-3到中文Llama-3的进化之路如果你在过去一年里关注过开源大模型，那么“Llama”这个名字对你来说一定不陌生。从Meta发布Llama-2开始，这个系列就成为了开源社区构建垂直领域模型的基石。今年4月，Meta又扔下了一…...

编程新知 2026/5/13 8:51:16

设备参考 Mac M 芯片 windows未知

1.ollama:模型部署

2.open-webui:web页面 推荐python的终端部署方式

2.1 docker部署web页面

2.2 python部署web页面 需要在有python环境下执行 推荐

2.3 [忽略] conda创建python环境

相关文章：

2.open-webui:web页面推荐python的终端部署方式

2.2 python部署web页面需要在有python环境下执行推荐