当前位置: 首页 > news >正文

基于 Elasticsearch 和 Milvus 的 RAG 运维知识库的架构设计和部署落地实现指南

最近在整理一些业务场景的架构设计和部署落地实现指南
先放一个 【基于RAG的运维知识库 (ElasticSearch + Milvus) 的详细实现指南】,其中包含了详尽的技术实现细节、可运行的示例代码、原理分析、优缺点分析和应用场景分析。

架构描述: 基于RAG的运维知识库 (ElasticSearch + Milvus)

部署指南

1. 极其详细的部署步骤 (包含详尽的技术实现细节和分步骤、可运行的示例代码-也只能给示例代码)

1.1 环境准备
  • 操作系统选择: 推荐使用 Linux 发行版,如 CentOS 7/8、Ubuntu 18.04/20.04。本指南以 CentOS 7 为例。

  • 网络环境配置: 确保服务器之间网络互通,防火墙开放 Elasticsearch (默认端口 9200)、Milvus (默认端口 19530) 和应用程序所需的端口。

  • 安装必要软件包:

    # 更新 yum 源
    sudo yum update -y# 安装常用工具
    sudo yum install -y wget curl vim net-tools# 安装 Java (Elasticsearch 依赖)
    sudo yum install -y java-1.8.0-openjdk-devel# 安装 Python (用于后续脚本)
    sudo yum install -y python3 python3-pip# 安装 Docker 和 Docker Compose (可选,用于容器化部署)
    sudo yum install -y yum-utils
    sudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo
    sudo yum install -y docker-ce docker-ce-cli containerd.io
    sudo systemctl start docker
    sudo systemctl enable docker
    sudo curl -L "https://github.com/docker/compose/releases/download/1.29.2/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
    sudo chmod +x /usr/local/bin/docker-compose
    
  • 配置环境变量:

    # 编辑 /etc/profile 或 ~/.bashrc
    # 添加以下内容 (根据实际安装路径修改)
    export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk
    export PATH=$JAVA_HOME/bin:$PATH# 使环境变量生效
    source /etc/profile  # 或 source ~/.bashrc
    
1.2 组件安装配置
1.2.1 Elasticsearch 安装配置
  1. 下载 Elasticsearch:

    wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.17.17-linux-x86_64.tar.gz  # 根据需要选择版本
    tar -xzf elasticsearch-7.17.17-linux-x86_64.tar.gz
    cd elasticsearch-7.17.17/
    
  2. 修改配置文件 config/elasticsearch.yml

    cluster.name: my-rag-cluster  # 集群名称
    node.name: node-1  # 节点名称
    network.host: 0.0.0.0  # 监听所有 IP 地址
    http.port: 9200  # Elasticsearch 端口
    discovery.seed_hosts: ["node-1"]  #  单节点部署,配置为节点名称
    cluster.initial_master_nodes: ["node-1"]  # 单节点部署
    # 建议配置 (根据实际情况调整):
    # bootstrap.memory_lock: true  # 锁定内存,防止交换
    # xpack.security.enabled: false  # 如果不需要安全认证,可以禁用
    # 注意:以上只是示例配置,生产环境请务必根据实际情况进行详细配置,特别是安全相关的配置。
    

    关键参数解释:

    • cluster.name: 集群名称,同一集群内的节点应具有相同的集群名称。
    • node.name: 节点名称,用于标识集群中的单个节点。
    • network.host: Elasticsearch 监听的 IP 地址,0.0.0.0 表示监听所有 IP。
    • http.port: Elasticsearch 的 HTTP 端口,默认为 9200。
    • discovery.seed_hosts: 集群发现的主机列表。在单节点部署中,可以设置为节点名称。
    • cluster.initial_master_nodes: 初始主节点列表。在单节点部署中,设置为节点名称。
    • bootstrap.memory_lock: 是否锁定内存,防止 Elasticsearch 内存被交换到磁盘,影响性能。
    • xpack.security.enabled:开启xpack security功能。
  3. 启动 Elasticsearch:

    ./bin/elasticsearch -d  # 后台启动
    
  4. 验证 Elasticsearch:

    curl http://localhost:9200/
    

    如果返回 JSON 格式的 Elasticsearch 信息,则表示启动成功。

1.2.2 Milvus 安装配置
  1. 使用 Docker Compose 安装 Milvus (推荐):

    # 创建 docker-compose.yml 文件
    cat > docker-compose.yml <<EOF
    version: '3.5'
    services:etcd:container_name: milvus-etcdimage: milvusdb/etcd:v3.5.5environment:ETCD_USE_EMBEDDED: "true"volumes:- ${DOCKER_VOLUME_DIRECTORY:-.}/volumes/etcd:/etcdstandalone:container_name: milvus-standaloneimage: milvusdb/milvus:v2.2.14 # 根据需要选择版本command: ["milvus", "run", "standalone"]environment:ETCD_ENDPOINTS: etcd:2379MINIO_ADDRESS: minio:9000volumes:- ${DOCKER_VOLUME_DIRECTORY:-.}/volumes/milvus:/var/lib/milvusports:- "19530:19530"- "9091:9091"depends_on:- "etcd"minio:container_name: milvus-minioimage: minio/minio:RELEASE.2022-10-29T06-21-33Zenvironment:MINIO_ACCESS_KEY: minioadminMINIO_SECRET_KEY: minioadminvolumes:- ${DOCKER_VOLUME_DIRECTORY:-.}/volumes/minio:/minio_dataports:- "9000:9000"- "9001:9001"command: minio server /minio_data --console-address ":9001"depends_on:- "etcd"
    networks:default:name: milvus
    EOF# 启动 Milvus
    docker-compose up -d
    

关键配置参数解释

  • milvus-etcd: etcd镜像,用于存储milvus的元数据。
  • milvus-standalone: Milvus的standalone模式镜像。
    • ETCD_ENDPOINTS: etcd 的连接地址。
    • MINIO_ADDRESS: MinIO 的连接地址,用于存储数据。
  • milvus-minio: 对象存储minIO镜像。
    • MINIO_ACCESS_KEY:MinIO用户名
    • MINIO_SECRET_KEY:MinIO密码
  1. 验证 Milvus:

    docker ps  # 查看 Milvus 容器是否正常运行
    
1.2.3 安装 Python 依赖
pip3 install pymilvus==2.2.14 elasticsearch==7.17.1 # 注意版本匹配
pip3 install sentence-transformers
1.3 组件集成 (RAG 应用程序)

以下是一个 Python 代码示例,展示如何使用 Elasticsearch 和 Milvus 实现 RAG:

from elasticsearch import Elasticsearch
from pymilvus import connections, FieldSchema, CollectionSchema, DataType, Collection, utility
from sentence_transformers import SentenceTransformer# --- 1. 连接到 Elasticsearch 和 Milvus ---es = Elasticsearch(hosts=["http://localhost:9200"],  # Elasticsearch 地址# 如果 Elasticsearch 启用了安全认证,需要提供用户名和密码# http_auth=("elastic", "your_password")
)connections.connect(alias="default",host="localhost",  # Milvus 地址port="19530"
)# --- 2. 定义 Elasticsearch 索引和 Milvus Collection ---# Elasticsearch 索引
index_name = "operations_knowledge"
if not es.indices.exists(index=index_name):es.indices.create(index=index_name,body

相关文章:

基于 Elasticsearch 和 Milvus 的 RAG 运维知识库的架构设计和部署落地实现指南

最近在整理一些业务场景的架构设计和部署落地实现指南 先放一个 【基于RAG的运维知识库 (ElasticSearch + Milvus) 的详细实现指南】,其中包含了详尽的技术实现细节、可运行的示例代码、原理分析、优缺点分析和应用场景分析。 架构描述: 基于RAG的运维知识库 (ElasticSearch…...

基于Python的web漏洞挖掘,漏洞扫描系统(附源码,部署)

本次技术通过利用Python技术来开发一款针对web漏洞挖掘扫描的技术&#xff0c;通过web漏洞的挖掘扫描来实现对网站URL的漏洞检测&#xff0c;通过高中低风险的判断来实现对一款网站中存在的漏洞进行可视化的分析&#xff0c;从而能够找到问题并且尽快的实现问题的解决。 博主介…...

Spring Boot全局异常处理:“危机公关”团队

目录 一、全局异常处理的作用二、Spring Boot 实现全局异常处理&#xff08;附上代码实例&#xff09;三、总结&#xff1a; &#x1f31f;我的其他文章也讲解的比较有趣&#x1f601;&#xff0c;如果喜欢博主的讲解方式&#xff0c;可以多多支持一下&#xff0c;感谢&#x1…...

Wireshark:自定义类型帧解析

文章目录 1. 前言2. 背景3. 开发 Lua 插件 1. 前言 限于作者能力水平&#xff0c;本文可能存在谬误&#xff0c;因此而给读者带来的损失&#xff0c;作者不做任何承诺。 2. 背景 Wireshark 不认识用 tcpdump 抓取的数据帧&#xff0c;仔细分析相关代码和数据帧后&#xff0c…...

Redis7——进阶篇(一)

前言&#xff1a;此篇文章系本人学习过程中记录下来的笔记&#xff0c;里面难免会有不少欠缺的地方&#xff0c;诚心期待大家多多给予指教。 基础篇&#xff1a; Redis&#xff08;一&#xff09;Redis&#xff08;二&#xff09;Redis&#xff08;三&#xff09;Redis&#x…...

word转换为pdf后图片失真解决办法、高质量PDF转换方法

1、安装Adobe Acrobat Pro DC 自行安装 2、配置Acrobat PDFMaker &#xff08;1&#xff09;点击word选项卡上的Acrobat插件&#xff0c;&#xff08;2&#xff09;点击“首选项”按钮&#xff0c;&#xff08;3&#xff09;点击“高级配置”按钮&#xff08;4&#xff09;点…...

Kafka零拷贝

Kafka为什么适用零拷贝&#xff0c;其他存储结构不适用&#xff1f; Kafka 采用的是日志存储模型&#xff0c;数据通常是顺序写入、顺序读取&#xff0c;并且它的消费模式是 “读完即走”&#xff08;一次性读取并发送给消费者&#xff09;&#xff0c;这与零拷贝的特性完美匹…...

鸿蒙应用开发入门教程

鸿蒙应用开发入门教程 基础准备与环境搭建 1. 了解鸿蒙系统 1.1 核心理念学习 HarmonyOS&#xff08;鸿蒙系统&#xff09;是华为推出的全场景分布式操作系统&#xff0c;其核心特点如下&#xff1a; 分布式能力 设备协同&#xff1a;手机、平板、智能手表、IoT设备等可无…...

【2022——暴力DP / 优雅背包】

题目 代码 #include <bits/stdc.h> using namespace std; using ll long long;const int N 2023;ll f[2][2023][2023];int main() {f[0][0][0] 1;for(int i 1; i < 10; i) //次数{for(int j 0; j< 2022; j)for(int k 0; k < 2022; k)f[i&1][j][k] 0…...

AI智能体与大语言模型:重塑SaaS系统的未来航向

在数字化转型的浪潮中&#xff0c;软件即服务&#xff08;SaaS&#xff09;系统一直是企业提升效率、优化业务流程的重要工具。随着AI智能体和大语言模型&#xff08;LLMs&#xff09;的迅速发展&#xff0c;SaaS系统正迎来前所未有的变革契机。本文将从AI智能体和大语言模型对…...

绕过密码卸载360终端安全管理系统

一不小心在电脑上安装了360终端安全管理系统&#xff0c;就会发现没有密码&#xff0c;就无法退出无法卸载360&#xff0c;很容易成为一个心病&#xff0c;360终端安全管理系统&#xff0c;没有密码&#xff0c;进程无法退出&#xff0c;软件无法卸载&#xff0c;前不久听同事说…...

golang安装(1.23.6)

1&#xff0e;切换到安装目录 cd /usr/local 2&#xff0e;下载安装包 wget https://go.dev/dl/go1.23.6.linux-amd64.tar.gz 3&#xff0e;解压安装包 sudo tar -C /usr/local -xzf go1.23.6.linux-amd64.tar.gz 4&#xff0e;配置环境变量 vi /etc/profile export PATH$…...

星闪开发入门之常见报错整理(一)

系列文章目录 星闪开发入门之常见报错整理&#xff08;一&#xff09; 文章目录 系列文章目录前言一、ComX open fail, please check com is busy or not exist二、‌CMake下载失败三、配置文件出现语法错误四、路径过长导致编译报错五、ninja: build stopped: subcommand fai…...

Node.js与MySQL的深入探讨

Node.js与MySQL的深入探讨 引言 Node.js,一个基于Chrome V8引擎的JavaScript运行时环境,以其非阻塞、事件驱动的方式在服务器端应用中占据了一席之地。MySQL,作为一款广泛使用的开源关系型数据库管理系统,凭借其稳定性和高效性,成为了许多应用的数据库选择。本文将深入探…...

【JAVA】阿里云百炼平台对接DeepSeek-V3大模型使用详解

1、DeepSeek简介 DeepSeek的火热让全世界见证了一场国产AI大模型走向巅峰的盛宴。DeepSeek的横空出世一方面让AI大模型的格局得到重塑&#xff0c;另一方面&#xff0c;对于普通人来说&#xff0c;也有机会零距离的体验到更懂国人的AI大模型。从很多使用过后的小伙伴们的反馈来…...

springboot项目部署脚本

Springboot部署脚本 该脚本可用于jenkins自动执行&#xff0c;具有以下功能 适配所有以内嵌tomcat容器springboot项目jar包可根据参数选择环境&#xff0c;基于profiles可自动识别并关闭已存在进程第一个参数是指定jar包所在绝对路径(该路径下必须有且仅有一个.jar文件) 第二…...

黑马Java面试教程_P5_微服务

系列博客目录 文章目录 系列博客目录1.引言2.Spring Cloud2.1 Spring Cloud 5大组件有哪些?面试文稿 2.2 服务注册和发现是什么意思?Spring Cloud 如何实现服务注册发现?面试文稿 2.3 我看你之前也用过nacos、你能说下nacos与eureka的区别?面试文稿 2.4 你们项目负载均衡如…...

使用Fuse-DFS挂载文件存储 HDFS-后端存储ceph

1. 编译环境准备 yum install cmake3 ln -s /usr/bin/cmake3 /usr/bin/cmake yum install gcc-c安装挂载依赖 yum -y install fuse fuse-devel fuse-libs执行以下命令&#xff0c;载入FUSE模块 modprobe fuse2. 下载源码包 hadoop-3.3.4-src.tar.gz解压后执行以下命令 打开…...

生成式AI项目的生命周期

总结自视频&#xff08;吴恩达大模型入门课&#xff09;&#xff1a;9_13_generative-ai-project-lifecycle_哔哩哔哩_bilibili 生成周期如下图&#xff0c;包含四部分&#xff1a;任务范围&#xff08;Scope&#xff09;&#xff0c;选择大模型&#xff08;Select&#xff09…...

SOC-ATF 安全启动BL1流程分析(1)

一、ATF 源码下载链接 1. ARM Trusted Firmware (ATF) 官方 GitHub 仓库 GitHub 地址: https://github.com/ARM-software/arm-trusted-firmware 这是 ATF 的官方源码仓库&#xff0c;包含最新的代码、文档和示例。 下载方式&#xff1a; 使用 Git 克隆仓库&#xff1a; git…...

手把手拆解蓝牙Extended Advertising数据包:从HCI Command到空口PDU的完整流程

手把手拆解蓝牙Extended Advertising数据包&#xff1a;从HCI Command到空口PDU的完整流程 蓝牙技术演进到5.0版本后&#xff0c;Extended Advertising&#xff08;扩展广播&#xff09;机制的引入彻底改变了低功耗蓝牙的通信范式。这项技术突破不仅解决了传统广播模式的诸多限…...

Construct3新手避坑指南:用《幽灵射手》教程搞定你的第一个射击游戏(附B站效果演示)

Construct3新手避坑指南&#xff1a;用《幽灵射手》教程搞定你的第一个射击游戏第一次打开Construct3的《幽灵射手》教程时&#xff0c;我盯着满屏的绿色幽灵和事件表发呆了半小时。为什么子弹穿过了幽灵却没造成伤害&#xff1f;为什么游戏运行三秒后就卡成幻灯片&#xff1f;…...

Seraphine:英雄联盟玩家的智能游戏助手完整指南

Seraphine&#xff1a;英雄联盟玩家的智能游戏助手完整指南 【免费下载链接】Seraphine 英雄联盟战绩查询工具 项目地址: https://gitcode.com/gh_mirrors/se/Seraphine Seraphine是一款基于英雄联盟官方LCU API开发的智能游戏助手&#xff0c;专为《英雄联盟》玩家设计…...

深度学习在碳离子治疗剂量计算中的应用:U-Net、GAN与扩散模型对比

1. 项目概述&#xff1a;当深度学习遇上碳离子治疗剂量计算在放射治疗领域&#xff0c;尤其是像碳离子治疗这样的先进粒子疗法中&#xff0c;剂量计算的精度和速度是决定治疗成败的关键。碳离子因其独特的“布拉格峰”物理特性&#xff0c;能够将高剂量能量精准地沉积在肿瘤靶区…...

隐蔽通信技术:原理、实现与应用

1. 隐蔽通信技术概述隐蔽通信&#xff08;Covert Communication&#xff09;是一种特殊的信息传输技术&#xff0c;其核心目标是实现低检测概率&#xff08;Low Probability of Detection, LPD&#xff09;的通信。与传统的加密通信不同&#xff0c;隐蔽通信不仅保护通信内容的…...

SHAP特征选择赋能量子机器学习,高效解决量子相分类难题

1. 项目概述&#xff1a;当量子机器学习遇见可解释AI在量子多体物理和材料科学领域&#xff0c;准确识别和分类物质的量子相是一个基础且极具挑战性的问题。传统的相图绘制依赖于精确求解模型哈密顿量或进行大规模数值模拟&#xff0c;过程复杂且计算成本高昂。近年来&#xff…...

别再手动拷贝了!用Debian 12 + NFSv4把远程服务器硬盘变成‘本地文件夹’(保姆级配置)

别再手动拷贝了&#xff01;用Debian 12 NFSv4把远程服务器硬盘变成‘本地文件夹’&#xff08;保姆级配置&#xff09; 每次在服务器间传输文件都要反复敲scp命令&#xff1f;开发时频繁上传下载代码导致版本混乱&#xff1f;NFSv4协议能让你像操作本地文件夹一样直接编辑远程…...

医疗AI入门实战:用Python从MIMIC-CXR数据集中提取X光图像和诊断报告(附完整代码)

医疗AI实战&#xff1a;Python解析MIMIC-CXR数据集全流程指南当第一次打开MIMIC-CXR数据集时&#xff0c;很多人会被它复杂的目录结构和海量文件吓到——超过37万张胸部X光片和22万份放射科报告分散在数百个嵌套文件夹中。这种看似混乱的存储方式其实反映了真实医院PACS系统的组…...

Android性能优化深度解析:从理论到实践

在Android开发领域,性能优化是确保应用流畅运行和用户体验的关键。作为一名安卓开发工程师,掌握性能优化技术不仅能提升应用质量,还能在面试和实际工作中脱颖而出。本文将以性能优化为核心领域,深入探讨其理论、工具和实践方法,并提供代码示例和常见面试问题及答案。文章内…...

ARM SVE2指令集与USUBWB指令优化实践

1. ARM SVE2指令集概述在当今计算密集型应用领域&#xff0c;向量处理能力已成为衡量处理器性能的关键指标。ARM架构的Scalable Vector Extension 2&#xff08;SVE2&#xff09;作为第二代可扩展向量指令集&#xff0c;在2021年随ARMv9架构一同发布&#xff0c;为高性能计算领…...