当前位置：首页 > article >正文

从零开始部署DeepSeek：基于Ollama+Flask的本地化AI对话系统

article 2026/4/18 12:27:22

从零开始部署DeepSeek：基于Ollama+Flask的本地化AI对话系统

一、部署背景与工具选型

在AI大模型遍地开花的2025年，DeepSeek R1凭借其出色的推理能力和开源特性成为开发者首选。本文将以零基础视角，通过以下工具链实现本地化部署：

1.Ollama：轻量级模型管理工具，支持一键拉取、运行模型

Ollama 是一个功能强大的大语言模型管理端，专为下载、运行和调用大型语言模型（如DeepSeek）而设计。它提供了以下几个核心功能：

模型下载：支持从官方仓库下载不同规模的模型。
模型运行：通过API提供服务，让用户与模型进行交互。
实时对话模拟：以流式方式展示模型回复。

2.DeepSeek : 平衡性能与资源消耗的中等规模模型

DeepSeek 是目标语言模型，可以根据您的硬件配置选择不同的模型规模（如7B、13B等）。它具有以下特点：

可扩展性：根据内存和计算资源调整模型大小。
高效训练：支持并行训练以加速模型收敛。

3.Python+Flask：构建Web交互界面，支持流式响应

Flask 是一个轻量级的Web框架，广泛应用于快速开发Web应用。结合Python，它为构建动态Web界面提供了灵活性：

API集成：通过Flask API调用Ollama服务。
前端动态：使用JavaScript和HTML创建交互式对话框。

4.HTML+JavaScript：实现类ChatGPT的对话交互体验

HTML 是构建Web界面的基础语言，用于设计用户友好的对话框，并将其嵌入到Flask应用中。您可以通过以下方式集成：

响应式布局：使用CSS样式表确保界面在不同设备上适配。
动态内容展示：通过JavaScript更新页面内容，模拟模型回复，需要模拟打字机方式。

**备注说明**: 不想自己编程的话，可使用chatbox直接接入ollama

二、环境准备与模型部署

1. 安装Ollama

Windows/Mac用户：
访问Ollama官网下载安装包，双击完成安装。 （github下载很慢，需要使用加速或从其他地方下载）

Linux用户：

curl -fsSL https://ollama.com/install.sh | sh
sudo systemctl start ollama

2. 下载DeepSeek模型

根据硬件配置选择模型（显存要求参考）：

基础版（1.5B）：适合笔记本（8GB内存）
标准版（7B）：推荐配置（16GB内存+8GB显存）
加强版（70B）：需专业显卡（如RTX 5090）

# 拉取7B模型
ollama run deepseek-r1:7b

上述指令会完成下载和运行两个步骤（ollama支持断线续传功能，而且我发现速度慢下来的时候，手动停止然后再启动接着下载模型的话，速度会恢复上来），成功运行后可通过命令行直接向deepseek提问，如下：

另外，也可以在命令行手动执行ollama相关指令：

无参数启动

C:\Users\arbboter\Desktop>ollama
Usage:ollama [flags]ollama [command]Available Commands:serve       Start ollamacreate      Create a model from a Modelfileshow        Show information for a modelrun         Run a modelpull        Pull a model from a registrypush        Push a model to a registrylist        List modelsps          List running modelscp          Copy a modelrm          Remove a modelhelp        Help about any commandFlags:-h, --help      help for ollama-v, --version   Show version informationUse "ollama [command] --help" for more information about a command.

命令	功能	示例
`ollama serve`	启动模型	`ollama serve`
`ollama pull`	下载模型	`ollama pull deepseek-r1:7b`
`ollama list`	查看本地模型	`ollama list`
`ollama rm`	删除模型	`ollama rm deepseek-r1:1.5b`
`ollama cp`	复制模型	`ollama cp deepseek-r1:7b my-backup`

3.配置ollama

# 限制本地访问（默认配置）
export OLLAMA_HOST=127.0.0.1# 允许局域网访问
export OLLAMA_HOST=0.0.0.0# 启用调试
export OLLAMA_DEBUG=1# 自定义模型路径（可能需重启机器生效）
export OLLAMA_MODELS=~\ollama\models

三、构建Web对话系统

备注说明：选型`flask`及代码编写基本是由`deepseek`完成，本人只负责提问和修缮

1. 项目结构

deepseek-web/
├── app.py          # Flask主程序
├── templates/
│   └── index.html  # 聊天界面

2. Flask后端实现（app.py）

# app.py
from flask import Flask, render_template, request, Response
import ollama
import logging
from datetime import datetimeapp = Flask(__name__)# 配置日志
logging.basicConfig(level=logging.INFO,format='%(asctime)s - %(levelname)s - %(message)s',handlers=[logging.FileHandler('chat.log'),logging.StreamHandler()]
)def chat_ollama(user_message, stream):host = 'http://192.168.1.10:11434'cli = ollama.Client(host=host)response = cli.chat(model='deepseek-r1:7b',messages=[{'role': 'user', 'content': user_message}],stream=stream,# options={'temperature': 0.7})return response@app.route('/')
def index():return render_template('index.html')@app.route('/api/chat', methods=['POST'])
def chat():"""流式聊天接口"""def generate(user_message):try:app.logger.info(f"流式处理开始: {user_message[:50]}...")stream = chat_ollama(user_message, True)for chunk in stream:content = chunk['message']['content']if content.startswith('<think>'):content = content.replace('<think>', '', 1)elif content.startswith('</think>'):content = content.replace('</think>', '\n', 1)app.logger.debug(f"发送数据块: {content}")yield f"{content}"app.logger.info("流式处理完成")except Exception as e:app.logger.error(f"流式错误: {str(e)}")yield f"[ERROR] {str(e)}\n\n"return Response(generate(request.json['message']), mimetype='text/event-stream')if __name__ == '__main__':app.run(host='0.0.0.0', port=5001, debug=True)

3. 前端实现（index.html）

<!DOCTYPE html>
<html lang="zh-CN">
<head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>AI 对话助手</title><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.9.0/styles/github.min.css"><script src="https://cdn.jsdelivr.net/npm/marked/marked.min.js"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.9.0/highlight.min.js"></script><style>:root {--primary-color: #10a37f;--bg-color: #f0f2f5;}body {margin: 0;padding: 20px;font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, sans-serif;background-color: var(--bg-color);max-width: 800px;margin: 0 auto;}#chat-container {height: 70vh;overflow-y: auto;border: 1px solid #e0e0e0;border-radius: 8px;padding: 15px;background: white;margin-bottom: 20px;}.message {margin: 12px 0;display: flex;gap: 15px;}.user-message {justify-content: flex-end;}.message-content {max-width: 80%;padding: 12px 16px;border-radius: 8px;}.assistant-message .message-content {background: #f8f9fa;border: 1px solid #e0e0e0;}.user-message .message-content {background: var(--primary-color);color: white;}#input-container {display: flex;gap: 10px;}#user-input {flex: 1;padding: 12px;border: 1px solid #e0e0e0;border-radius: 8px;resize: none;min-height: 44px;}button {background: var(--primary-color);color: white;border: none;padding: 0 20px;border-radius: 8px;cursor: pointer;transition: opacity 0.2s;}button:disabled {opacity: 0.6;cursor: not-allowed;}.typing-indicator {display: inline-block;padding: 8px 12px;background: #f8f9fa;border-radius: 8px;border: 1px solid #e0e0e0;}.dot {display: inline-block;width: 6px;height: 6px;margin-right: 3px;background: #ccc;border-radius: 50%;animation: bounce 1.4s infinite;}@keyframes bounce {0%, 80%, 100% { transform: translateY(0) }40% { transform: translateY(-6px) }}/* markdown基础样式 */.markdown-content {line-height: 1.6;transition: opacity 0.3s;}.markdown-content:not(.markdown-rendered) {opacity: 0.5;}.markdown-content h1 { font-size: 2em; margin: 0.67em 0; }.markdown-content h2 { font-size: 1.5em; margin: 0.83em 0; }.markdown-content pre { background: #f5f5f5;padding: 1em;border-radius: 4px;overflow-x: auto;}</style>
</head>
<body><div id="chat-container"></div><div id="input-container"><textarea id="user-input" placeholder="输入消息..." rows="1"></textarea><button id="send-btn" onclick="sendMessage()">发送</button></div><script>const chatContainer = document.getElementById('chat-container');const userInput = document.getElementById('user-input');const sendBtn = document.getElementById('send-btn');// 滚动到底部function scrollToBottom() {}function renderMarkdown(options = {}) {// 合并配置参数const config = {selector: options.selector || '.markdown-content',breaks: options.breaks ?? true,gfm: options.gfm ?? true,highlight: options.highlight || null};// 配置Markedmarked.setOptions({breaks: config.breaks,gfm: config.gfm,highlight: config.highlight});// 渲染处理器const render = () => {document.querySelectorAll(config.selector).forEach(container => {if (container.dataset.rendered) return;// 创建虚拟容器避免内容闪烁const virtualDiv = document.createElement('div');virtualDiv.style.display = 'none';virtualDiv.innerHTML = container.innerHTML.trim();// 执行Markdown转换container.innerHTML = marked.parse(virtualDiv.innerHTML);container.dataset.rendered = true;// 添加加载动画container.classList.add('markdown-rendered');});};// 自动执行渲染if (document.readyState === 'complete') {render();} else {document.addEventListener('DOMContentLoaded', render);}}// 添加用户消息function addUserMessage(content) {const messageDiv = document.createElement('div');messageDiv.className = 'message user-message';messageDiv.innerHTML = `<div class="message-content">${content}</div>`;chatContainer.appendChild(messageDiv);}// 添加AI消息（流式）async function addAssistantMessageStream() {const messageDiv = document.createElement('div');messageDiv.className = 'message assistant-message';messageDiv.innerHTML = `<div class="message-content markdown-content"><div class="typing-indicator"><span class="dot"></span><span class="dot" style="animation-delay: 0.2s"></span><span class="dot" style="animation-delay: 0.4s"></span></div></div>`;chatContainer.appendChild(messageDiv);return messageDiv.querySelector('.message-content');}// 发送消息async function sendMessage() {const content = userInput.value.trim();if (!content) return;sendBtn.disabled = true;userInput.disabled = true;userInput.value = '';addUserMessage(content);const responseContainer = await addAssistantMessageStream();try {const response = await fetch('/api/chat', {method: 'POST',headers: {'Content-Type': 'application/json',// 如果需要认证// 'Authorization': 'Bearer YOUR_TOKEN'},body: JSON.stringify({ message: content })});if (!response.ok) throw new Error('请求失败');await this.createStreamTypewriter(response, responseContainer, {});this.scrollToBottom();} catch (error) {responseContainer.innerHTML = '❌ 请求出错: ' + error.message;} finally {sendBtn.disabled = false;userInput.disabled = false;userInput.focus();}}// 输入框事件处理userInput.addEventListener('keydown', (e) => {if (e.key === 'Enter' && !e.shiftKey && !e.ctrlKey) {e.preventDefault();sendMessage();} else if (e.key === 'Enter' && (e.ctrlKey || e.metaKey)) {userInput.value += '\n';}});async function createStreamTypewriter(stream, container, options = {}) {const config = {baseSpeed: 50,maxSpeedup: 3,retryCount: 3,...options};this.reader = null;// 状态控制let isDestroyed = false;let cursorVisible = true;let renderQueue = [];let retryCounter = 0;// DOM元素初始化const cursor = document.createElement('span');cursor.className = 'typewriter-cursor';cursor.textContent = '▌';container.append(cursor);// 光标动画const cursorInterval = setInterval(() => {cursor.style.opacity = cursorVisible ? 1 : 0;cursorVisible = !cursorVisible;}, 600);// 核心渲染逻辑const renderEngine = () => {if (renderQueue.length === 0 || isDestroyed) return;// 动态调速算法const speed = Math.max(config.baseSpeed / config.maxSpeedup,config.baseSpeed - renderQueue.length * 2);const fragment = document.createDocumentFragment();while (renderQueue.length > 0) {const char = renderQueue.shift();fragment.append(document.createTextNode(char));}container.insertBefore(fragment, cursor);setTimeout(() => requestAnimationFrame(renderEngine), speed);};// 流数据处理const processStream = async () => {try {this.reader = stream.body.getReader();// Fetch模式处理while (!isDestroyed) {const { done, value } = await this.reader.read();if (done) break;renderQueue.push(...new TextDecoder().decode(value).split(''));if (!renderQueue.length) continue;requestAnimationFrame(renderEngine);}} catch (err) {if (retryCounter++ < config.retryCount && !isDestroyed) {processStream();} else {destroy();throw new Error('Stream connection failed');}} finally {container.innerHTML = marked.parse(container.textContent.replace('▌', ''));destroy();}};// 资源清理const destroy = () => {if (isDestroyed) return;isDestroyed = true;clearInterval(cursorInterval);cursor.remove();if (stream.cancel) stream.cancel();if (stream.close) stream.close();};// 启动引擎processStream();return { destroy };};</script>
</body>
</html>

四、启动与优化

1. 运行系统

flask run --port 5001

访问 http://localhost:5001 即可开始对话，如下：
主页面

2. 性能优化技巧

量化加速：使用ollama run deepseek-r1:7b --quantize q4_0 减少显存占用
GPU加速：在Ollama配置中启用CUDA支持

五、安全注意事项

端口防护：

export OLLAMA_HOST=127.0.0.1  # 禁止外部访问
netstat -an | grep 11434      # 验证监听地址

防火墙规则：

sudo ufw deny 11434/tcp      # 禁用Ollama外部端口

六、扩展应用场景

私有知识库：接入LangChain处理本地文档
自动化脚本：通过API实现代码生成/自动Debug
硬件控制：结合HomeAssistant实现语音智能家居

完整代码已开源（其实没有)：GitHub仓库地址
通过本教程，您已掌握从模型部署到应用开发的全流程。本地化AI部署不仅降低成本，更保障了数据隐私，为开发者提供了真正的「AI自由」！

从零开始部署DeepSeek：基于Ollama+Flask的本地化AI对话系统

从零开始部署DeepSeek：基于OllamaFlask的本地化AI对话系统一、部署背景与工具选型在AI大模型遍地开花的2025年，DeepSeek R1凭借其出色的推理能力和开源特性成为开发者首选。本文将以零基础视角，通过以下工具链实现本地化部署： …...

编程日记 2026/4/14 10:17:55

STM32 CubeMx配置串口收发使用DMA并调用Idle模式（二）

本篇主要结合代码落实，之前串口已经配置好的DMA方式。一、首先我们把串口看成一个对象，它有属性、私有数据和方法； 每个串口都有名字属性；有初始化、发送、接收方法；还有一个私有数据（这个私有数据是每个…...

编程日记 2026/4/15 1:25:04

使用Redis实现分布式锁，基于原本单体系统进行业务改造

一、单体系统下，使用锁机制实现秒杀功能，并限制一人一单功能 1.流程图： 2.代码实现： Service public class VoucherOrderServiceImpl extends ServiceImpl<VoucherOrderMapper, VoucherOrder> implements IVoucherOrderSe…...

编程日记 2026/4/14 12:36:12

数据结构中的邻接表

一、概念邻接表（Adjacency List）是一种用于表示图（Graph）数据结构的常用方法。它特别适用于稀疏图，即边的数量远小于顶点数量平方的图。邻接表通过为每个顶点维护一个列表来存储与该顶点相邻的顶点，从而高…...

编程日记 2026/3/28 14:37:50

js第九题

题九：放大镜效果要求： 1.鼠标移至图片上方，鼠标周围出现黄色的的正方形框，黄色矩形框会随着鼠标的移动而移动； 2.将黄色正方形框里的内容的长和宽均放大2.4倍，并在图片右边进行显示。 html <div …...

编程日记 2026/2/24 12:19:48

基于单片机ht7038 demo

单片机与ht7038 demo，三相电能表，电量数据包括电流电压功能，采用免校准方法列表 ht7038模块/CORE/core_cm3.c , 17273 ht7038模块/CORE/core_cm3.h , 85714 ht7038模块/CORE/startup_stm32f10x_hd.s , 15503 ht7038模块/CORE/startup_stm32…...

编程日记 2026/3/11 2:16:42

轮播图html

题十二：轮播图要求： 1.鼠标不在图片上方时，进行自动轮播，并且左右箭头不会显示；当鼠标放在图片上方时，停止轮播，并且左右箭头会显示； 2.图片切换之后，图片中下方的小圆…...

编程日记 2026/4/4 5:46:10

Nginx内存池源代码剖析----ngx_create_pool函数

ngx_create_pool 是 Nginx 内存池的初始化函数，负责创建并初始化一个内存池对象。它的作用是为后续的内存分配操作提供统一的管理入口，通过预分配一块较大的内存区域，并基于此区域实现高效的内存分配、对齐管理和资源回收。源代码定义&…...

编程日记 2026/4/3 18:47:37

DeepSeek 开放平台无法充值改用其他平台API调用DeepSeek-chat模型方法

近几天DeepSeek开放平台无法充值目前已经关闭状态，大家都是忙着接入DeepSeek模型 ，很多人想使用DeepSeek怎么办？ 当然还有改用其他平台API调用方法，本文以本站的提供chatgpt系统为例，如何修改DeepSeek-chat模型API接口…...

编程日记 2026/4/10 7:14:31

QT基础一、学会建一个项目

注：因为CSDN有很多付费才能吃到的史，本人对此深恶痛绝，所以我打算出一期免费的QT基础入门专栏，这是QT基础知识的第一期，学会建一个项目，本专栏是适用于c / c基础不错的朋友的一个免费专栏，接下来…...

编程日记 2026/4/13 3:50:11

科技引领未来，中建海龙C-MiC 2.0技术树立模块化建筑新标杆

在建筑行业追求高效与品质的征程中，中建海龙科技有限公司（简称“中建海龙”）以其卓越的创新能力和强大的技术实力，不断书写着装配式建筑领域的新篇章。1 月 10 日，由深圳安居集团规划，中建海龙与中海建筑共…...

编程日记 2026/4/13 14:22:05

解锁养生秘籍，拥抱健康生活

在这个快节奏的时代，人们行色匆匆，常常在忙碌中忽略了健康。其实，养生并非遥不可及，它就藏在生活的细微之处，等待我们去发现和实践。规律作息是健康的基础。日出而作，日落而息，顺应自然规律&am…...

编程日记 2026/4/13 6:34:14

STM32 如何使用DMA和获取ADC

目录背景 ‌摇杆的原理程序端口配置 ADC 配置 DMA配置背景 DMA是一种计算机技术，允许某些硬件子系统直接访问系统内存，而不需要中央处理器（CPU）的介入，从而减轻CPU的负担。我们可以通过DMA来从外设&#xf…...

编程日记 2026/4/6 9:05:29

细胞计数专题 | LUNA-FX7™新自动对焦算法提高极低细胞浓度下的细胞计数准确性

现代细胞计数仪采用自动化方法，在特定浓度范围内进行细胞计数。其上限受限于在高浓度条件下准确区分细胞边界的能力，而相机视野等因素则决定了下限。在图像中仅包含少量可识别细胞或特征的情况下，自动对焦可能会失效，从而影响细胞…...

编程日记 2026/4/17 12:33:15

DeepSeek教unity------MessagePack-01

中文：GitCode - 全球开发者的开源社区,开源代码托管平台 MessagePack是C# 的极速 MessagePack 序列化器。它比 MsgPack-Cli 快 10 倍，并且性能超过其他 C# 序列化器。MessagePack for C# 还内置支持 LZ4 压缩——一种极其快速的压缩算法。性能在诸如游戏…...

编程日记 2026/2/28 13:17:16

vite+vue3开发uni-app时低版本浏览器不支持es6语法的问题排坑笔记

重要提示：请首先完整阅读完文章内容后再操作，以免不必要的时间浪费！切记！！！在使用vitevue3开发uni-app项目时，存在低版本浏览器不兼容es6语法的问题，如“?.” “??” 等。为了方便…...

编程日记 2026/2/25 17:56:09

WPF-数据转换器

一、单值转换器 1.不传参数转换器当Value值大于100时返回红色 public class DataConverter : IValueConverter{/// <summary>/// 表示从源到目标数据转换/// </summary>/// <param name"value">数据源的值</param>/// <param name&q…...

编程日记 2026/2/21 5:17:30

蓝桥杯备考：贪心算法之纪念品分组

P1094 [NOIP 2007 普及组] 纪念品分组 - 洛谷这道题我们的贪心策略就是每次找出最大的和最小的，如果他们加起来不超过我们给的值，就分成一组，如果超过了，就把大的单独成一组，小的待定 #include <iostream> #i…...

编程日记 2026/4/11 11:39:24

系统要求安装WSL。开通虚拟化： 准备工作 dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestartdism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestartwsl --set-default-versi…...

编程日记 2026/4/16 13:36:42

以mysql驱动为案例，从源码角度深入分析Java的SPI机制

本文将以mysql驱动为案例，深入跟踪源码分析Java的SPI（Service Provider Interface）机制。环境 java 8，mysql8.0，mysql-connector-java 8.0.20 代码 public class MysqlConnectorTest {public static void main(St…...

编程日记 2026/3/20 17:40:37

市盈率（P/E Ratio）：理解股票价格与盈利的关系（中英双语）

市盈率（P/E Ratio）：理解股票价格与盈利的关系今天在阅读《漫步华尔街》（原书第13版）的过程中，看到了“股票价格是每股盈利的 6 倍”的类似表述，于是产生了本文。在投资股票时，投资…...

编程日记 2026/4/18 3:45:54

尚硅谷爬虫note008

一、handler处理器定制更高级的请求头 # _*_ coding : utf-8 _*_ # Time : 2025/2/17 08:55 # Author : 20250206-里奥 # File : demo01_urllib_handler处理器的基本使用 # Project : PythonPro17-21# 导入 import urllib.request from cgitb import handler# 需求&#xff…...

编程日记 2026/4/17 20:05:51

AWS上基于高德地图API验证Amazon Redshift里国内地址数据正确性的设计方案

该方案通过无服务架构实现高可扩展性，结合分页查询和批量更新确保高效处理海量数据，同时通过密钥托管和错误重试机制保障安全性及可靠性。一、技术栈组件技术选型说明计算层AWS Lambda无服务器执行，适合事件驱动、按需处理，成…...

编程日记 2026/1/20 1:28:31

matlab汽车动力学半车垂向振动模型

1、内容简介 matlab141-半车垂向振动模型可以交流、咨询、答疑 2、内容说明略 3、仿真分析略 4、参考论文略...

编程日记 2026/4/17 4:09:33

【新品解读】AI 应用场景全覆盖！解码超高端 VU+ FPGA 开发平台 AXVU13F

「AXVU13F」Virtex UltraScale XCVU13P Jetson Orin NX 继发布 AMD Virtex UltraScale FPGA PCIE3.0 开发平台 AXVU13P 后，ALINX 进一步研究尖端应用市场，面向 AI 场景进行优化设计，推出 AXVU13F。 AXVU13F 和 AXVU13P 采用相同的 AMD Vir…...

编程日记 2026/4/15 19:52:41

智能硬件定位技术发展趋势

在科技飞速进步的当下，智能硬件定位技术作为众多领域的关键支撑，正沿着多元且极具创新性的路径蓬勃发展，持续重塑我们的生活与工作方式。一、精度提升的极致追求当前，智能硬件定位精度虽已满足诸多日常应用，但未来…...

编程日记 2026/4/15 15:22:19

【Elasticsearch】`nested`和`flattened`字段在索引时有显著的区别

有同学问，nested查询效率不高为啥不直接扁平化查询呢？就跟之前的普通结构查询一样，这就有些想当然了，因为扁平化的结构在存储时，其实跟我们想的不一样，接下来给出扁平化在索引时的存储结构(尤其是当嵌套对象…...

编程日记 2026/4/15 5:54:01

【Linux探索学习】第二十七弹——信号（上）：Linux 信号基础详解

Linux学习笔记： https://blog.csdn.net/2301_80220607/category_12805278.html?spm1001.2014.3001.5482 前言： 前面我们已经将进程通信部分讲完了，现在我们来讲一个进程部分也非常重要的知识点——信号，信号也是进程间通信的一…...

编程日记 2026/4/14 19:50:53

redis解决高并发看门狗策略

当一个业务执行时间超过自己设定的锁释放时间，那么会导致有其他线程进入，从而抢到同一个票,所有需要使用看门狗策略，其实就是开一个守护线程，让守护线程去监控key，如果到时间了还未结束，就会将这个key重新s…...

编程日记 2026/4/12 13:57:22

Ollama+DeepSeek+Open-WebUi

环境准备 Docker Ollama Open-WebUi Ollama 下载地址：Ollama docker安装ollama docker run -d \ -v /data/ollama/data:/root/.ollama \ -p 11434:11434 \ --name ollama ollama/ollama 下载模型 Ollama模型仓库 # 示例：安装deepseek-r1:7b doc…...

编程日记 2026/4/14 0:46:19