当前位置: 首页 > news >正文

mac下dify+deepseek部署,实现私人知识库

目前deepseek 十分火爆,本地部署实现私有知识库,帮助自己日常工作,上一篇使用工具cherry studio可以做到私人知识库。今天学习了一下,使用Dify链接deepseek,实现私人知识库,也非常不错,这里分享下我的学习过程吧。

一、克隆 Dify 源代码至本地环境

git clone https://github.com/langgenius/dify.git

当然你也可以直接登录网址 https://github.com/langgenius/dify   点击Dnowload ZIP。

二、启动Dify(前提是先安装docker for mac)

1、进入 Dify 源代码的 Docker 目录

cd dify/docker

2、复制环境配置文件

cp .env.example .env

3、启动 Docker 容器

docker-compose up -d

安装好后,可以通过docker ps 查看所有容器是否都已正常运行。

4、访问dify

# 初始化访问,设置管理员账户
http://localhost/install

三、Dify配置deepseek大模型

首先从账户中心-设置中,点开。然后可以点击 ”模型供应商“。这时候可以看到很多大模型的供应商。我们可以选择添加自己已经注册或者本地部署过得大模型。

可以直接选择deepseek的大模型,通过填写自己的api-key,添加后,可以看到已经添加的模型。

当然你也可以通过siliconflow来实现你的知识库,注册账户后,将api-key填入即可。

这里介绍下如何绑定自己本地环境通过ollma部署的deepseek的模型,如下:

首先在模型供应商中找到ollma,然后点击添加大模型,填写本地部署的模型名称,

注意:这里的基础URL填写http://host.docker.internal:11434,localhost是无法连接的。这里可以参考Dify官网查看

添加好后,在按照同样的方法,继续添加Text Embedding。这是为知识库添加bge-large模型

当然这里的模型名称是自己本地部署的模型名称。

四、搭建知识库

1、来到Dify的主界面,点击知识库。创建新的知识库

2、上传文档

文档上传成功后,会自动嵌入,然后向量化。

文档也已经被分段处理

3、引用知识库

创建空白应用-创建聊天助手

然后在聊天界面中点击添加上下文,也就是你刚才创建的知识库。

此时在右边的对话框中就可以输入,大模型会根据知识库进行查询。在最后的界面中能看到引用自刚才创建的知识库文件。

知识库创建好后,你可以本地使用,如果想外部访问这个知识库,可以添加外部知识库API。配置好API Endpoint后就可以。

当然,想要让外部访问到,你自己的机器网络也需要在公网上。

五、Dify的亮点

在最后,还是想说一下Dify非常棒的功能,

Dify和cherry- studio、chatbox都可以随时切换聊天对话的大模型,像知识库这种,它还可以直接将聊天对话功能嵌入到自己的网站中去,这一点和阿里云的知识库很像。

它还有一个亮点让我觉得很惊喜的是,它有自己的API接口,可以直接对接,实现文件上传啊,文本创建啊等,更加灵活的实现自己的知识库功能,将Dify用于一个可视化的知识库管理页面来使用,实在是太棒了。

相关文章:

mac下dify+deepseek部署,实现私人知识库

目前deepseek 十分火爆,本地部署实现私有知识库,帮助自己日常工作,上一篇使用工具cherry studio可以做到私人知识库。今天学习了一下,使用Dify链接deepseek,实现私人知识库,也非常不错,这里分享…...

Linux中设置开机运行指令

系统:Debian 12 使用systemd来设置开机自启动脚本或命令是一个更加现代且推荐的方法。下面是具体的步骤: 创建守护脚本 首先,你需要创建一个Shell脚本文件,比如mydaemon.sh,并在其中编写你的守护脚本逻辑。确保这个脚…...

IDEA中列举的是否是SpringBoot的依赖项的全部?在哪里能查到所有依赖项,如何开发自己的依赖项让别人使用

在 IntelliJ IDEA 中列举的依赖项并不一定是 Spring Boot 项目的全部依赖项。IDEA 通常只显示你在 pom.xml(Maven)或 build.gradle(Gradle)中显式声明的依赖项,而这些依赖项本身可能还会引入其他传递性依赖。 1. 如何…...

Ollama命令使用指南

Ollama 命令使用指南 Ollama 命令使用指南1. Ollama 命令概览2. Ollama 命令详解2.1 启动 Ollama2.2 创建模型2.3 查看模型信息2.4 运行模型2.5 停止运行的模型2.6 从注册表拉取模型2.7 推送模型到注册表2.8 列出本地模型2.9 查看正在运行的模型2.10 复制模型2.11 删除模型 3. …...

LIMO:上海交大的工作 “少即是多” LLM 推理

25年2月来自上海交大、SII 和 GAIR 的论文“LIMO: Less is More for Reasoning”。 一个挑战是在大语言模型(LLM)中的复杂推理。虽然传统观点认为复杂的推理任务需要大量的训练数据(通常超过 100,000 个示例),但本文展…...

Android studio怎么创建assets目录

在Android Studio中创建assets文件夹是一个简单的步骤,通常用于存储不需要编译的资源文件,如文本文件、图片、音频等 main文件夹,邮件new->folder-assets folder...

常见的前端框架和库有哪些

1. React 描述:由 Facebook 开发的一个 JavaScript 库,用于构建用户界面,尤其是单页面应用(SPA)。特点: 基于组件的架构,便于重用 UI 组件。使用虚拟 DOM 提升性能。容易与其他库和框架集成。 …...

【批量获取图片信息】批量获取图片尺寸、海拔、分辨率、GPS经纬度、面积、位深度、等图片属性里的详细信息,提取出来后导出表格,基于WPF的详细解决方案

摄影工作室通常会有大量的图片素材,在进行图片整理和分类时,需要知道每张图片的尺寸、分辨率、GPS 经纬度(如果拍摄时记录了)等信息,以便更好地管理图片资源,比如根据图片尺寸和分辨率决定哪些图片适合用于…...

数据结构与算法(test3)

七、查找 1. 看图填空 查找表是由同一类型的数据元素(或记录)构成的集合。例如上图就是一个查找表。 期中(1)是______________. (2)是______________(3)是_____关键字_______。 2. 查找(Searching) 就是根据给定的某个值, 在查…...

基于Python的人工智能驱动基因组变异算法:设计与应用(下)

3.3.2 数据清洗与预处理 在基因组变异分析中,原始数据往往包含各种噪声和不完整信息,数据清洗与预处理是确保分析结果准确性和可靠性的关键步骤。通过 Python 的相关库和工具,可以有效地去除噪声、填补缺失值、标准化数据等,为后续的分析提供高质量的数据基础。 在基因组…...

C++ 顺序表

顺序表的操作有以下: 1 顺序表的元素插入 给定一个索引和元素,这个位置往后的元素位置都要往后移动一次,元素插入的步骤有以下几步 (1)判断插入的位置是否合法,如果不合法则抛出异常 (2&…...

Mac(m1)本地部署deepseek-R1模型

1. 下载安装ollama 直接下载软件,下载完成之后,安装即可,安装完成之后,命令行中可出现ollama命令 2. 在ollama官网查看需要下载的模型下载命令 1. 在官网查看deepseek对应的模型 2. 选择使用电脑配置的模型 3. copy 对应模型的安…...

Docker 部署 redis | 国内阿里镜像

一、简易单机版 1、镜像拉取 # docker hub 镜像 docker pull redis:7.0.4-bullseye # 阿里云镜像 docker pull alibaba-cloud-linux-3-registry.cn-hangzhou.cr.aliyuncs.com/alinux3/redis_optimized:20240221-6.2.7-2.3.0 2、运行镜像 docker run -itd --name redis \n …...

48V电气架构全面科普和解析:下一代智能电动汽车核心驱动

48V电气架构:下一代智能电动汽车核心驱动 随着全球汽车产业迈入电动化、智能化的新时代,传统12V电气系统逐渐暴露出其无法满足现代高功率需求的不足。在此背景下,48V电气架构应运而生,成为现代电动汽车(EV&#xff09…...

滤波器截止频率的计算

1、RC低通滤波器 图1.1 RC低通滤波器 RC低通滤波器如图1.1所示,电阻R串联电容C,输入电压记为Ui ,输出电压记为Uo。 电容容抗记为,其中ω 2πf。 根据串联分压,列出传递函数。 将①式最右侧的分子与分母各乘以1-jω…...

服务器绑定 127.0.0.1 和 0.0.0.0 的区别

前言 IP 地址实际上并不是分配给计算机的,而是分配给网卡的,因此当计算机上存在多块网卡时,每一块网卡都会有自己的 IP 地址。 绑定 127.0.0.1 是绑定到 lookback 这个虚拟的本地回环接口,该接口只处理本机上的数据,…...

DeepSeek提示词手册

一、核心原则:基于DeepSeek的推理特性 自然语言优先undefinedDeepSeek擅长理解自然表达,无需复杂模板。例如: ❌旧模板:"你是专业分析师,需分三步回答,第一步…" ✅高效提问:"…...

校园网规划方案

个人博客站—运维鹿: http://www.kervin24.top CSDN博客—做个超努力的小奚: https://blog.csdn.net/qq_52914969?typeblog 本课程设计参考学习计算机网络 思科Cisco Packet Tracer仿真实验_哔哩哔哩_bilibili, 文章和pkg详见个人博客站: http://www.kervin24.to…...

python怎么求 一个数是否包含3

python求一个数包含3的方法: 1、使用“for i in 列表名”循环遍历列表中的每一个元素并将每个元素用str()函数转换成字符串格式 2、用“if str(3) in i”判断该元素中是否含有3 完整代码如下: 执行结果如下:...

ARM RFEIA指令作用

FreeRTOS第一个任务如何run起来的 在给ARM cortex R5适配FreeRTOS的过程中,在执行第一个task时,都是使用vTaskStartScheduler()函数,把第一个task运行起来的,其中比较关键在port.c实现的xPortStartScheduler()函数中,…...

西门子触摸屏报警处理:除了弹窗,用这个‘非中断式’方法让产线更丝滑

西门子HMI非中断报警系统设计:让产线效率提升30%的实战方案 在快节奏的工业现场,每一次操作中断都意味着产能的隐形流失。传统HMI报警弹窗就像突然按下的暂停键——操作员必须停下手中任务去点击确认,而流水线上的产品仍在流动。这种矛盾在汽…...

Linux期末突击:从体系结构到VFS,一张图搞定所有简答题

Linux期末突击:从体系结构到VFS,一张图搞定所有简答题 距离期末考试只剩三天,书桌上堆满的Linux教材和笔记让人头皮发麻。别慌,这份突击指南将用最直观的图解方式,帮你把零散的知识点串联成完整的知识网络。我们不仅会…...

TypeScript——编译器和编译选项

编译器和编译选项 1、编译器1.1、安装编译器1.1.1、--help、--all1.1.2、--version 2、编译程序2.1、编译单个文件2.2、编译多个文件2.3、--watch和-w2.4、--presserveWatchOutput 2、编译选项2.1、编译选项风格2.2、使用编译选项2.3、严格类型检查2.3.1、--strict2.3.2、--nol…...

绿盾加密环境下Keil安装避坑指南:从ST-LINK报错到安全模式切换

绿盾加密环境下Keil安装全流程解析:从驱动修复到开发环境优化 在嵌入式开发领域,Keil MDK作为ARM架构微控制器的主流开发工具,其稳定性直接关系到项目进度和开发体验。但当企业级文档加密系统"绿盾"介入后,原本顺畅的开…...

新手必看:用T16IZ遥控器给PX4无人机对频,保姆级图文教程(附接线避坑点)

T16IZ遥控器与PX4无人机对频全指南:从零开始的安全操作手册 刚拿到T16IZ遥控器和PX4无人机套件时,面对密密麻麻的接口和陌生的专业术语,很多新手会感到无从下手。本文将以最直观的方式,带你一步步完成对频操作,同时避开…...

三极管倍频 vs 锁相环倍频:短波通信场景下的5个关键性能对比实验

三极管倍频与锁相环倍频在短波通信中的5组实测性能对决 短波通信系统的核心挑战之一在于如何生成高稳定度的射频信号。当工程师需要在有限频谱资源中实现高效传输时,频率合成技术的选择往往决定了系统整体性能。本文将基于实际测试平台,对比分析三极管倍…...

Hugo-PaperMod导航菜单异常修复:从故障诊断到性能优化全指南

Hugo-PaperMod导航菜单异常修复:从故障诊断到性能优化全指南 【免费下载链接】hugo-PaperMod A fast, clean, responsive Hugo theme. 项目地址: https://gitcode.com/GitHub_Trending/hu/hugo-PaperMod Hugo-PaperMod作为一款轻量级响应式主题,…...

探索ArtPlayer:如何通过轻量高效的HTML5视频引擎实现全场景适配播放体验

探索ArtPlayer:如何通过轻量高效的HTML5视频引擎实现全场景适配播放体验 【免费下载链接】ArtPlayer :art: ArtPlayer.js is a modern and full featured HTML5 video player 项目地址: https://gitcode.com/gh_mirrors/ar/ArtPlayer 在数字内容爆发的时代&a…...

别再折腾无障碍服务了!用Android蓝牙HID实现投屏反控的保姆级避坑指南

蓝牙HID协议在Android投屏反控中的深度实践 如果你正在开发一款类似Scrcpy的Android投屏工具,肯定遇到过这样的困境:无障碍服务(AccessibilityService)的授权流程繁琐且容易被厂商拦截,反射调用InputManagerService又需要系统级权限。这时候&…...

S32K144 LPUART中断接收丢字节?手把手教你用模拟空闲中断搞定Modbus RTU

S32K144 LPUART通信优化:模拟空闲中断实现Modbus RTU稳定传输 工业控制系统中,RS485总线上的Modbus RTU通信对时序和稳定性有着严苛要求。当使用NXP S32K144这类汽车级MCU时,开发者常会遇到一个典型问题:LPUART模块在连续接收多字…...