【AI大模型】Ollama部署本地大模型DeepSeek-R1,交互界面Open-WebUI,RagFlow构建私有知识库
文章目录
- DeepSeek介绍
- 公司背景
- 核心技术
- 产品与服务
- 应用场景
- 优势与特点
- 访问与体验
- 各个DeepSeek-R系列模型的硬件需求和适用场景
- Ollama
- 主要特点
- 优势
- 应用场景
- 安装和使用
- 配置环境变量
- 总结
- 安装open-webui
- 下载和安装docker desktop
- 配置镜像源
- 安装open-webui
- 运行和使用
- RagFlow介绍
- 主要功能
- 适用场景
- 优势
- 下载及安装
- 私有知识库
- 1. 模型供应商配置
- 2. 创建知识库
- 3. 创建数据集
- 4. 创建助理和对话
个人主页:道友老李
欢迎加入社区:道友老李的学习社区
CSDN博客之星投票开始拉,希望兄弟们支持一下,投个票,谢谢拉!:我的CSDN博客之星-投票
DeepSeek介绍
DeepSeek官网
DeepSeek(深度求索)是一家专注于实现通用人工智能(AGI)的中国科技公司,致力于通过技术探索与创新,推动智能技术的广泛应用。以下是其核心信息的概述:
公司背景
- 成立时间:2023年(具体时间未公开披露)
- 总部:中国杭州
- 使命:通过AGI技术提升人类生产力,推动社会进步。
- 愿景:成为全球AGI领域的领导者。
核心技术
-
大语言模型(LLM)
- 自主研发高性能基座模型(如DeepSeek-R1、DeepSeek-R2),支持长文本理解、复杂推理和多语言处理。
- 模型参数量覆盖数十亿至千亿级,平衡性能与计算效率。
-
多模态AI
- 整合文本、图像、语音等多模态数据,开发跨模态理解与生成能力。
-
搜索增强技术
- 结合搜索引擎实时数据,提升模型在知识更新与事实准确性上的表现。
产品与服务
- 通用大模型:面向开发者的开放API(如DeepSeek API),支持文本生成、代码编写等任务。
- 行业定制模型:针对金融、医疗、教育等领域提供垂直场景优化方案。
- 企业级平台:提供模型训练、部署及管理的全流程工具链(如Fine-tuning平台)。
- 开源社区:部分模型和技术开源,促进开发者协作(如发布轻量版模型)。
应用场景
- 智能客服:自动化应答与客户意图分析。
- 内容生成:营销文案、代码、报告等自动化创作。
- 数据分析:从非结构化数据中提取洞察,辅助决策。
- 教育:个性化学习助手与智能题库生成。
优势与特点
- 技术领先:模型性能在多项基准测试(如MMLU、HumanEval)中位居前列。
- 场景深耕:聚焦企业级需求,提供高可用的行业解决方案。
- 生态合作:与云计算厂商、硬件供应商及高校建立联合实验室。
访问与体验
- 官网提供在线体验入口(如Chat界面)和开发者文档。
- 部分模型可通过Hugging Face、GitHub等平台获取。
如需更详细的技术参数、商业合作或最新动态,建议访问其官方网站或查阅官方发布的白皮书。
各个DeepSeek-R系列模型的硬件需求和适用场景

我的电脑配置:

可以跑7b和14b
Ollama
ollama search
Ollama 是一个开源的 AI 推理框架,专注于模型压缩和部署。它的目标是帮助用户在本地或边缘设备上高效运行大型语言模型(LLM),通过量化和其他技术显著减少模型大小,同时保持高性能。
主要特点
-
模型压缩与优化:
- Ollama 提供了多种模型压缩技术,如 4-bit 和 8-bit 量化,使大模型能够在低资源环境下运行。
- 支持主流语言模型(如 LLaMA、Vicuna 等)的适配和部署。
-
高性能推理:
- Ollama 能够在本地设备上实现低延迟、高吞吐量的推理,适合实时应用。
-
易于部署:
- 提供简洁的命令行界面(CLI),用户可以轻松下载模型、调整参数并运行推理服务。
- 支持 Docker 部署,便于在云服务器或边缘设备上快速搭建。
-
社区驱动:
- Ollama 是一个开源项目,依赖于活跃的社区支持,用户可以根据需求贡献和改进功能。
优势
- 轻量化:通过量化技术显著降低模型大小,适合资源受限的环境。
- 高性能:优化了推理速度,能够在本地快速响应。
- 灵活性:支持多种模型格式和后端(如 GGML、TensorRT 等)。
- 易于上手:用户无需复杂的配置即可开始使用。
应用场景
-
本地开发与实验:
- 开发者可以轻松在本地运行 LLM,用于快速测试和原型设计。
-
边缘计算:
- 在边缘设备(如 Raspberry Pi)上部署轻量级 AI 服务。
-
实时推理服务:
- 快速搭建支持多语言模型的推理服务器,满足企业或个人需求。
-
教育与研究:
- 提供了一个易于使用的工具,适合教学和研究场景。
安装和使用
国内下载:Ollama下载
-
打开cmd控制台,输入:
ollama可以看到帮助命令

-
下载模型(以 DeepSeek-R系列为例):
ollama pull deepseek-r1:1.5b -
启动推理服务:
ollama serve --port 11434 -
运行模型:
ollama run deepseek-r1:1.5b
可以开始对话了。
配置环境变量

OLLAMA_MODELS 是修改OLLAMA下载的模型存储位置,默认是在C盘
总结
Ollama 是一个强大的工具,旨在简化大型语言模型的部署和推理过程。它通过模型压缩和优化技术,使得在本地或边缘设备上运行 AI 模型变得高效且易于管理。无论是开发者、研究人员还是企业用户,Ollama 都能提供灵活和支持,满足多种应用场景的需求。
安装open-webui
下载和安装docker desktop
官网地址:Docker Desktop

GitHub地址:Docker Desktop

配置镜像源

第一个是阿里云的镜像源,可登录阿里云平台查看
"registry-mirrors": ["https://${阿里云的}.mirror.aliyuncs.com","https://docker.m.daocloud.io","https://mirror.baidubce.com","https://docker.nju.edu.cn","https://mirror.iscas.ac.cn"]
安装open-webui
搜索open-webui


我这里已经安装过了。
运行和使用
在容器中运行open-webui,然后浏览器输入http://localhost:3000

进入设置

配置Ollama地址

配置好后,保存,正常的情况下,界面就会显示Ollama中已下载好的模型了

完成!可以开始对话了!
RagFlow介绍
RagFlow 是一个基于大语言模型的流程自动化工具,旨在帮助用户通过自然语言处理(NLP)技术来自动化和优化工作流程。它结合了先进的AI技术和直观的用户界面,使得非技术人员也能轻松实现流程自动化。
主要功能
- 智能对话交互:用户可以通过与RagFlow进行自然语言对话,定义、管理和优化各种工作流程。
- 任务自动化:支持多种任务类型,如数据处理、信息提取、报告生成等,帮助用户自动完成重复性工作。
- 跨系统集成:能够与主流的第三方服务(如Slack、Jira、Google Drive等)无缝集成,实现不同系统的数据流动和协同工作。
- 动态流程调整:根据实时数据和上下文环境,智能调整工作流程,确保流程始终高效运行。
- 可扩展性:支持大规模业务需求,适用于从个人到企业的各种场景。
适用场景
- 企业流程优化:帮助企业在销售、 marketing、客服等环节实现自动化,提升效率。
- 个人任务管理:用户可以通过RagFlow自动化个人日常任务,如行程安排、邮件处理等。
- 数据整合与分析:通过自动化数据收集和处理,支持更高效的决策制定。
优势
- 易用性:无需编程知识,用户即可快速上手。
- 灵活性:支持定制化需求,满足不同用户的个性化要求。
- 高效性:利用AI技术提升流程执行效率,减少人工干预。
RagFlow 通过将复杂的流程自动化转化为简单的对话交互,极大地提升了工作效率和用户体验。如果你有具体的使用场景或问题,可以进一步探讨如何利用RagFlow来优化你的工作流程!
下载及安装
- 从github上下载 ragflow或直接:
git clone https://github.com/infiniflow/ragflow.git
- 运行脚本:进入docker 文件夹,利用提前编译好的 Docker 镜像启动服务器
docker compose -f docker-compose-CN.yml up -d
这个过程会很慢,成功后,会自动运行容器中的服务:

浏览器上输入:http://localhost

第一个注册的账号就是管理员,登录成功

私有知识库
1. 模型供应商配置
点击头像,进入模型供应商配置

选择下面列表中的Ollama,然后进行模型配置

模型名称就是Ollama中下载的模型名称
2. 创建知识库

解析方法改成General,其他默认即可

3. 创建数据集

新增本地文件

执行解析,等待解析完成


4. 创建助理和对话
切换到聊天页,新建助理,选择知识库

切换到模型设置,调整一下最大token数

新建聊天,开始对话

相关文章:
【AI大模型】Ollama部署本地大模型DeepSeek-R1,交互界面Open-WebUI,RagFlow构建私有知识库
文章目录 DeepSeek介绍公司背景核心技术产品与服务应用场景优势与特点访问与体验各个DeepSeek-R系列模型的硬件需求和适用场景 Ollama主要特点优势应用场景安装和使用配置环境变量总结 安装open-webui下载和安装docker desktop配置镜像源安装open-webui运行和使用 RagFlow介绍主…...
Unity 命令行设置运行在指定的显卡上
设置运行在指定的显卡上 -force-device-index...
Visual Studio 使用 “Ctrl + /”键设置注释和取消注释
问题:在默认的Visual Studio中,选择单行代码后,按下Ctrl /键会将代码注释掉,但再次按下Ctrl /键时,会进行双重注释,这不是我们想要的。 实现效果:当按下Ctrl /键会将代码注释掉,…...
共用poetry和conda的方法
起因 基于开源项目继续开发,发现该项目使用poetry管理依赖,但本地开发及调试环境依赖conda且未安装原生python,不支持直接安装poetry,因此需要使用conda安装及使用poetry。操作系统:Ubuntu 什么是poetry 一项依赖于…...
教程:使用 Vue 3 和 arco 实现表格合并
1. 功能概述 本教程将介绍如何使用 Vue 3 和 arco 组件库实现表格合并功能。具体来说,我们会根据表格数据中的某个字段(如 type)对表格的某一列(如入库类型列)进行合并,同时将质检说明列合并为一列。 2. …...
Docker 常用命令基础详解(二)
四、容器操作命令 4.1 运行容器 使用docker run命令可以创建并运行一个容器,它就像是一个神奇的 “启动器”,让镜像中的应用程序在容器中运行起来。其基本语法为: docker run [OPTIONS] IMAGE [COMMAND] [ARG...] 其中,OPTIONS…...
uniapp - iconfont下载本地并且运用至项目上
1、项目中创建一个文件夹放置iconfont相关文件,例如src/assets/iconfont(名称自己定义) 2、在iconfont下载项目至本地 3、解压后把文件复制进1的文件夹中 4、修改src/assets/iconfont - iconfont.css里的font-face的src地址,修…...
【前端】自己从头实现一个gpt聊天页面
预览 最小化功能点 主界面:侧边栏会话历史、聊天窗口发送和断开。侧边栏:展示会话列表,每个会话包含多条聊天记录, 通过localstorage本地储存和恢复,会话需要重命名和删除。聊天框:区分一下发送者和回答者…...
数据结构——二叉树(2025.2.12)
目录 一、树 1.定义 (1)树的构成 (2)度 2.二叉树 (1)定义 (2)二叉树的遍历 (3)遍历特性 二、练习 1.二叉树 (1)创建二叉树…...
Vulhub靶机 ActiveMQ任意 文件写入(CVE-2016-3088)(渗透测试详解)
一、开启vulhub环境 docker-compose up -d 启动 docker ps 查看开放的端口 漏洞版本:ActiveMQ在5.14.0之前的版本(不包括5.14.0) 二、访问靶机IP 8161端口 默认账户密码都是admin 1、利用bp抓包,修改为PUT方法并在fileserver…...
跟着李沐老师学习深度学习(十一)
经典的卷积神经网络 在本次笔记中主要介绍一些经典的卷积神经网络模型,主要包含以下: LeNet:最早发布的卷积神经网络之一,目的是识别图像中的手写数字;AlexNet: 是第一个在大规模视觉竞赛中击败传统计算机…...
【微软- Entra ID】Microsoft Entra ID
Microsoft Entra ID是微软提供的基于云的身份和访问管理服务。Microsoft Entra ID是一个全面的解决方案,用于管理身份、执行访问策略以及在云和本地保护您的应用程序和数据。 目录 一、查看 Microsoft Entra ID 微软Entra租户 微软Entra模式 二、比较Microsoft Entra ID与…...
Halcon相机标定
1,前言。 相机的成像过程实质上是坐标系的转换。首先空间中的点由“世界坐标系”转换到“相机坐标系”,然后再将其投影到成像平面(图像物理坐标系),最后再将成像的平面上的数据转换为图像像素坐标系。但是由于透镜的制…...
Linux 配置 MySQL 定时自动备份到另一台服务器
Linux 配置 MySQL 定时自动备份到另一台服务器 前言1、配置服务器通信1.1:配置过程 2、编写自动备份sh脚本文件3:设置定时自动执行 前言 此方案可使一台服务器上的 MySQL 中的所有数据库每天 0 点自动转储为 .sql 文件,然后将文件同步到另一…...
《安富莱嵌入式周报》第350期:Google开源Pebble智能手表,开源模块化机器人平台,开源万用表,支持10GHz HRTIM的单片机,开源CNC控制器
周报汇总地址:嵌入式周报 - uCOS & uCGUI & emWin & embOS & TouchGFX & ThreadX - 硬汉嵌入式论坛 - Powered by Discuz! 视频版: https://www.bilibili.com/video/BV1YPKEeyEeM/ 《安富莱嵌入式周报》第350期:Google开…...
LabVIEW与小众设备集成
在LabVIEW开发中,当面临控制如布鲁克OPUS红外光谱仪这类小众专业设备的需求,而厂家虽然提供了配套软件,但由于系统中还需要控制其他设备且不能使用厂商的软件时,必须依赖特定方法通过LabVIEW实现设备的控制。开发过程中࿰…...
无人机之无线传输技术!
一、Lightbridge和OcuSync图传技术 Lightbridge技术:这是大疆自主研发的一种专用通信链路技术,使用单向图像数据传输,类似于电视广播塔的数据传输形式。它主要采用2.4GHz频段进行传输,并且可以实现几乎“零延时”的720p高清图像传…...
移远通信边缘计算模组成功运行DeepSeek模型,以领先的工程能力加速端侧AI落地
近日,国产大模型DeepSeek凭借其“开源开放、高效推理、端侧友好”的核心优势,迅速风靡全球。移远通信基于边缘计算模组SG885G,已成功实现DeepSeek模型的稳定运行,并完成了针对性微调。 目前,该模型正在多款智能终端上进…...
rust学习一、入门之搭建简单开发环境
1、搭建开发环境(windows11) a.登录官网 一看就明白,此处略。 b.安装rustup 一看就明白,此处略。 c.安装 cargo script 或者 rust-script script cargo install cargo-script 完成后 注意:时间有一点点久。 测试 cargo s…...
FANUC机器人示教器中如何显示或关闭寄存器或IO的注释信息?
FANUC机器人示教器中如何显示或关闭寄存器或IO的注释信息? 如下图所示,我们打开一个子程序,可以看到程序中的寄存器和IO是显示注释信息的, 如果想关闭注释显示的话,怎么设置? 如下图所示,按下下一页的箭头(NEXT键), 如下图所示,点击“编辑”,在弹出的窗口中,选择“…...
在SpringBoot项目中有k8s配置,但报错
如下报错一般是你没有将k8s的config拷贝到项目里,你可以将k8s主节点的config拷贝一下到项目中。 2025-02-13 09:27:21.873 ERROR 1671 --- [.models.V1Pod-1] i.k.c.informer.cache.ReflectorRunnable : class io.kubernetes.client.openapi.models.V1Pod#Reflec…...
在springboot加vue项目中加入图形验证码
后端 首先先要创建一个CaptchaController的类,可以在下面的代码中看到 在getCaptcha的方法里面写好了生成随机的4位小写字母或数字的验证码,然后通过BufferedImage类变为图片,顺便加上了干扰线。之后把图片转为Base64编码方便传给前端 为了…...
23. AI-大语言模型
文章目录 前言一、LLM1. 简介2. 工作原理和结构3. 应用场景4. 最新研究进展5. 比较 二、Transformer架构1. 简介2. 基本原理和结构3. 应用场景4. 最新进展 三、开源1. 开源概念2. 开源模式3. 模型权重 四、再谈DeepSeek 前言 AI 一、LLM LLM(Large Language Mod…...
蓝桥杯备赛笔记(二)
这里的笔记是关于蓝桥杯关键知识点的记录,有别于基础语法,很多内容只要求会用就行,无需深入掌握。 文章目录 前言一、时间复杂度1.1 时间复杂度⭐1.2 空间复杂度1.3 分析技巧 二、枚举2.1 枚举算法介绍2.2 解空间的类型2.3 循环枚举解空间 三…...
MATLAB中的APPdesigner绘制多图问题解析?与逻辑值转成十进制
在matlab APPdesigner中绘图可以用UIAxes组件进行绘图,但是当想多张图时,只能提前绘制图像区域不方便。下面是几种办法: 为了操作可以添加Panl组件,方便操作。 1、当是要求的几个图像大小都是相同时刻采用函数: til…...
Spring Cloud-Sentinel
Sentinel服务熔断与限流 Sentinel 是面向分布式、多语言异构化服务架构的流量治理组件,主要以流量为切入点,从流量控制、流量路由、熔断降级、系统自适应保护等多个维度来帮助用户保障微服务的稳定性。 官网地址:home | Sentinelhttps://sen…...
Java中使用EasyExcel
Java中使用EasyExcel 文章目录 Java中使用EasyExcel一:EasyExcel介绍1.1、核心函数导入数据导出数据 1.2、项目实际应用导入数据导出数据 1.3、相关注解ExcelProperty作用示例 二:EasyExcel使用2.1、导入功能2.2、导出功能 三:EasyExcel完整代…...
Linux中退出vi编辑器的命令
在Linux中退出vi编辑器的命令有以下几种: 保存并退出:在命令模式下,按下Esc键退出插入模式,然后输入:wq或:x,按下回车键即可保存修改并退出vi编辑器。 不保存退出:在命令模式下,按…...
建筑兔零基础自学python记录18|实战人脸识别项目——视频检测07
本次要学视频检测,我们先回顾一下图片的人脸检测建筑兔零基础自学python记录16|实战人脸识别项目——人脸检测05-CSDN博客 我们先把上文中代码复制出来,保留红框的部分。 然后我们来看一下源代码: import cv2 as cvdef face_detect_demo(…...
自定义基座实时采集uniapp日志
自定义基座实时采集uniapp日志 打测试包给远端现场(测试/客户)实际测试时也能实时看到日志了,也有代码行数显示。 流程设计 #mermaid-svg-1I5W9r1DU4xUsaTF {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid…...
