当前位置: 首页 > news >正文

deepseek本地部署,ragflow,docker

先下载ollama

1.官网下载 

deepseek-r1:14bhttps://ollama.com/library/deepseek-r1:14b

2.GitHub下载GitHub - ollama/ollama: Get up and running with Llama 3.3, DeepSeek-R1, Phi-4, Gemma 2, and other large language models.

两种方式

安装完后,cmd->ollama run deepseek-r1:14b

用于下载相应大小的模型,我这个是14b,具体可在官网挑选

deepseek-r1:14bhttps://ollama.com/library/deepseek-r1:14b

cmd输入对应指令,会进行下载,已经下载成功了,输入此指令会run,如下

可以输入ollama list查看电脑下载了什么模型

下载模型前,如果不想把模型下载到C盘,可以环境变量设置:OLLAMA_MODELS

OLLAMA_HOST,是因为在ragflow部署的是docker虚拟机(它翻译的是基于linux的win,我理解是基于win的linux系统),要访问本机,需要开这个端口

设置好了环境变量,记得重启,才生效

GitHub上下载ragflow代码解压

GitHub - infiniflow/ragflow: RAGFlow is an open-source RAG (Retrieval-Augmented Generation) engine based on deep document understanding.

找到docker文件夹,修改env文件

注释RAGFLOW_IMAGE=infiniflow/ragflow:v0.16.0-slim

取消注释RAGFLOW_IMAGE=infiniflow/ragflow:v0.16.0

此目的是为了安装全量版本的ragflow,GitHub上有说

在docker文件夹下打开cmd(一定要在docker页面下输入,不然会报错),输入

docker compose -f docker-compose.yml up -d

出现如下错误context canceled,我的解决方法为科学上网

成功下载后,输入docker compose -f docker-compose.yml up -d,界面为:

打开docker,不用sign in,直接continue,skip,到如下界面,可以看到已经启动,container memory usage 为9.23GB,就是前面ollama run deepseek-r1:14b,下载的模型大小。

此时右下角会有2个图标

打开网页,输入localhost:80,打开ragflow,账号密码随便注册(因为是在本地,没限制)

登录过后,点击1.右上角头像;2.模型提供商;3.待添加的模型。

找到ollama,添加模型,deepseek是chat模型,选择chat,模型名称可以在cmd-ollama list查看

url自己本机的ip加端口(前面环境变量记得设置),然后token(随便写),确定。

如果报错,如下,模型名称不要直接粘贴从ollama上复制的ollama run deepseek-r1:14b,把ollama run去掉。我个肺雾,我一直以为是网络不通,在调ip,环境变量,防火墙(还报错,可能防火墙拦截了,直接关掉)

添加成功后,知识库,创建知识库

新增文件(上传自己的知识库),记得解析(圈起来的横三角)

点击聊天,新建助理,选择前面创建的知识库

进行问答

相关文章:

deepseek本地部署,ragflow,docker

先下载ollama 1.官网下载 deepseek-r1:14bhttps://ollama.com/library/deepseek-r1:14b 2.GitHub下载GitHub - ollama/ollama: Get up and running with Llama 3.3, DeepSeek-R1, Phi-4, Gemma 2, and other large language models. 两种方式 安装完后,cmd-&g…...

智能优化算法:莲花算法(Lotus flower algorithm,LFA)介绍,提供MATLAB代码

一、 莲花算法 1.1 算法原理 莲花算法(Lotus flower algorithm,LFA)是一种受自然启发的优化算法,其灵感来源于莲花的自清洁特性和授粉过程。莲花的自清洁特性,即所谓的“莲花效应”,是由其叶片表面的微纳…...

通过AI辅助生成PPT (by quqi99)

作者:张华 发表于:2025-02-23 版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本版权声明(http://blog.csdn.net/quqi99) 问题 媳妇需要将一个pdf文件中的某些部分做成PPT课件,我在想是…...

P9631 [ICPC 2020 Nanjing R] Just Another Game of Stones Solution

Description 给定序列 a ( a 1 , a 2 , ⋯ , a n ) a(a_1,a_2,\cdots,a_n) a(a1​,a2​,⋯,an​),有 m m m 个操作分两种: chmax ⁡ ( l , r , k ) \operatorname{chmax}(l,r,k) chmax(l,r,k):对每个 i ∈ [ l , r ] i \in [l,r] i∈[l,…...

nodejs:vue 3 + vite 作为前端,将 html 填入<iframe>,在线查询英汉词典

向 doubao.com/chat/ 提问: node.js js-mdict 作为后端,vue 3 vite 作为前端,编写在线查询英汉词典 后端部分(express js-mdict ) 详见上一篇:nodejs:express js-mdict 作为后端&#xff…...

QEMU源码全解析 —— 内存虚拟化(18)

接前一篇文章:QEMU源码全解析 —— 内存虚拟化(17) 本文内容参考: 《趣谈Linux操作系统》 —— 刘超,极客时间 《QEMU/KVM源码解析与应用》 —— 李强,机械工业出版社 QEMU内存管理模型...

Spring Boot 日志管理(官网文档解读)

摘要 本篇文章详细介绍了SpringBoot 日志管理相关的内容,文章主要参考官网文章的描述内容,并在其基础上进行一定的总结和拓展,以方便学习Spring Boot 的小伙伴能快速掌握Spring Boot 日志管理相关的内容。 日志实现方式 Sping Boot 的日志管…...

MATLAB进阶之路:数据导入与处理

在MATLAB的学习旅程中,我们已经初步了解了它的基础操作。如今,我们将沿着这条充满惊喜的道路,迈向下一个重要的站点——数据导入与处理。这部分内容就像是为MATLAB注入了强大的能量,使其能够从现实的数据世界中汲取信息,然后像一位智慧的魔法师一样,巧妙地处理这些数据,…...

fcntl()函数的概念和使用案例 c语言

在 Linux 系统编程中,fcntl() 函数(File Control)是用于操作文件描述符的核心函数,可控制文件或套接字的底层属性。它支持多种操作,包括设置非阻塞模式、获取/设置文件状态标志、管理文件锁等。以下是详细概念和使用案…...

Linux红帽:RHCSA认证知识讲解(一)RedHat背景与环境配置

Linux红帽:RHCSA认证知识讲解(一)RedHat背景与环境配置 前言一、RedHat公司背景二、RedHat环境安装步骤三、windows使用远程工具连接环境并上传文件到redhat方法: 前言 在接下来的博客中,我们从基础开始将介绍红帽Linu…...

Windows11安装GPU版本Pytorch2.6教程

1: 准备工作 针对已经安装好的Windows11系统,先检查Nvidia驱动和使用的CUDA版本情况。先打开Windows PowerShell,通过nvidia-smi命令查看GPU的情况,结果如下图1所示,从结果中可知使用的CUDA版本为12.8。 图1:检测安装…...

网络传输的七层协议

网络传输的七层协议是 OSI模型(开放系统互联模型) 中的七个层次,每一层都负责不同的网络功能。具体如下: 物理层(Physical Layer) 负责在物理媒介上传输比特流,即将数据以电信号、光信号等形式在…...

【蓝桥杯集训·每日一题2025】 AcWing 6134. 哞叫时间II python

6134. 哞叫时间II Week 1 2月20日 农夫约翰正在试图向埃尔茜描述他最喜欢的 USACO 竞赛,但她很难理解为什么他这么喜欢它。 他说「竞赛中我最喜欢的部分是贝茜说『现在是哞哞时间』并在整个竞赛中一直哞哞叫」。 埃尔茜仍然不理解,所以农夫约翰将竞赛…...

Spring Boot数据访问(JDBC)全解析:从基础配置到高级调优

文章目录 引言一、Spring Boot JDBC核心架构1.1 核心组件关系图1.2 自动配置逻辑 二、基础配置实践2.1 数据源配置2.2 多数据源配置 三、JdbcTemplate深度使用3.1 基础CRUD操作3.2 批处理优化 四、事务管理4.1 声明式事务4.2 事务传播机制 五、异常处理5.1 Spring异常体系5.2 自…...

三数之和:经典问题的多种优化策略

三数之和:经典问题的多种优化策略 大家好,我是Echo_Wish。今天我们来聊一个经典的算法问题——三数之和(3Sum)。它是许多面试和算法竞赛中常见的问题之一,也常常考察我们对算法优化的理解和技巧。我们不仅要解决问题&…...

信息学奥赛一本通 1520:【 例 1】分离的路径 | 洛谷 P2860 [USACO06JAN]Redundant Paths G

【题目链接】 ybt 1520:【 例 1】分离的路径 洛谷 P2860 [USACO06JAN]Redundant Paths G 【题目考点】 1. 图论:割边(桥) 边双连通分量 【解题思路】 每个草场是一个顶点,草场之间的双向路是无向边,该…...

架构师面试(六):熔断和降级

问题 在千万日活的电商系统中,商品列表页服务通过 RPC 调用广告服务;经过统计发现,在最近10秒的时间里,商品列表页服务在对广告服务的调用中有 98% 的调用是超时的; 针对这个场景,下面哪几项的说法是正确的…...

使用 DeepSeek 生成流程图、甘特图与思维导图:结合 Typora 和 XMind 的高效工作流

在现代工作与学习中,可视化工具如流程图、甘特图和思维导图能够极大地提升信息整理与表达的效率。本文将详细介绍如何使用 DeepSeek 生成 Mermaid 文本,结合 Typora 快速生成流程图和甘特图,并通过 Markdown 格式生成思维导图,最终…...

粘贴到Word里的图片显示不全

粘贴到Word里的图片显示不全,可从Word设置、图片本身、软件与系统等方面着手解决,具体方法如下: Word软件设置 经实践发现,图片在word行距的行距出现问题,可以按照如下调整行距进行处理 修改段落行距: 选…...

【C语言】结构体内存对齐问题

1.结构体内存对齐 我们已经基本掌握了结构体的使用了。那我们现在必须得知道结构体在内存中是如何存储的?内存是如何分配的?所以我们得知道如何计算结构体的大小?这就引出了我们今天所要探讨的内容:结构体内存对齐。 1.1 对齐规…...

别再只用ssh-keygen了!聊聊OpenSSH密钥算法:ed25519 vs RSA,我该选哪个?

SSH密钥算法深度解析:ed25519与RSA的技术抉择 当你面对ssh-keygen命令中琳琅满目的算法选项时,是否曾陷入选择困难?在安全与效率的天平上,ed25519和RSA究竟谁更胜一筹?本文将带你穿透技术迷雾,从密码学原理…...

别再手抄谱了!用Sibelius把MIDI文件一键转成五线谱(附Cubase协作流程)

别再手抄谱了!用Sibelius把MIDI文件一键转成五线谱(附Cubase协作流程) 每次在DAW里完成编曲后,最头疼的就是把那些灵光一现的旋律变成规整的五线谱。传统的手动记谱不仅耗时费力,还容易出错。作为从业十年的游戏音效师…...

互联网大厂 Java 面试中的微服务与 AI 应用探索

# 面试大厂 Java 开发:燕双非的幽默与科技的严肃 ## 文章简述 在这一篇幽默而又充满技术干货的文章中,我们跟随程序员燕双非的足迹,深入探讨在一家互联网大厂的 Java 面试过程。面试官的严肃提问与燕双非形象的幽默回答形成鲜明对比&#…...

告别复制粘贴!手把手教你理解STM32F103C6T6点灯代码里的‘*(unsigned int *)0x4001100C’到底在干什么

从机器码到电子流动&#xff1a;解码STM32寄存器操作背后的硬件语言 当你第一次看到*(unsigned int *)0x4001100C & ~(1<<13);这样的代码时&#xff0c;是否感觉像在阅读外星文字&#xff1f;这串看似随机的数字和符号组合&#xff0c;实际上是连接软件世界与硬件物理…...

别再手动改仿真值了!用LabVIEW 2020 + mbslave实现Modbus TCP数据自动读写与监控

LabVIEW 2020与Modbus TCP自动化监控实战指南 在工业自动化测试领域&#xff0c;手动修改仿真参数的时代已经过去。想象一下这样的场景&#xff1a;凌晨三点的生产线突然出现异常&#xff0c;而你的系统能够自动捕捉数据变化、触发警报并记录完整的过程数据——这正是现代自动…...

从实验报告到项目实战:用Verilog在ISE里复现南邮数电实验(含全加器、数据选择器源码)

从实验报告到FPGA实战&#xff1a;Verilog数字电路工程化指南 引言&#xff1a;跨越理论与实践的鸿沟 实验室里的波形图和课堂上的逻辑表达式&#xff0c;如何变成真正可运行的硬件电路&#xff1f;这是许多电子工程专业学生面临的第一个工程化挑战。去年指导毕业设计时&#x…...

解决RK3188 Android 5.1双屏异显副屏黑屏的完整排查与修复指南(附补丁)

RK3188 Android 5.1双屏异显副屏黑屏问题的深度解析与实战修复 当工程师在RK3188平台上为Android 5.1系统移植双屏异显功能时&#xff0c;副屏偶尔出现的黑屏问题&#xff08;仅有背光无图像&#xff09;往往令人头疼。这种现象并非每次必现&#xff0c;而是在特定条件下触发&a…...

用 Gemini TTS 生成音频故事

我目前正在做一个关于语言学习的副项目。主要功能包括使用 AI 生成内容以及将文本转换为音频文件。为了存储音频文件&#xff0c;我还需要云存储。 成本是我的首要考虑因素&#xff0c;因为我认为在云平台之间切换不会太困难。 最终&#xff0c;我选择了 Google Gemini、Goog…...

077、代码实战十九:扩散模型生成结果的偏见与多样性分析

一、从一次深夜调试说起 上周团队 review 生成结果时,发现一个诡异现象:连续生成 100 张“医生”图片,89 张是男性戴眼镜的白大褂形象;生成“护士”则 94 张是女性。数据组同事把统计结果扔过来时,我背后一凉——这模型怕不是从训练数据里学到了全套社会刻板印象。 更麻…...

RWKV7-1.5B-world镜像免配置:预置模型量化选项(AWQ/GPTQ),4bit推理可行性验证

RWKV7-1.5B-world镜像免配置&#xff1a;预置模型量化选项&#xff08;AWQ/GPTQ&#xff09;&#xff0c;4bit推理可行性验证 1. 模型概述 RWKV7-1.5B-world是基于第7代RWKV架构的轻量级双语对话模型&#xff0c;拥有15亿参数。该模型采用线性注意力机制替代传统Transformer的…...