当前位置: 首页 > article >正文

保姆级教程:在Ubuntu 20.04上用Docker Compose一键部署Milvus向量数据库(附可视化界面)

基于Docker Compose的Milvus向量数据库全栈部署指南在AI应用开发领域向量数据库正成为处理非结构化数据的核心基础设施。作为一款开源的向量相似度搜索引擎Milvus凭借其出色的性能和易用性正在图像检索、推荐系统、自然语言处理等场景中快速普及。本文将分享如何通过Docker Compose在Ubuntu 20.04上快速搭建包含可视化管理的完整Milvus服务栈。1. 环境准备与架构设计在开始部署前我们需要明确几个关键概念。Milvus 2.x版本采用存储与计算分离的架构主要包含以下组件协调器(Coordinator)管理集群状态和任务调度工作节点(Worker Node)执行数据插入、索引构建和查询操作元数据存储(Meta Store)记录集合、分区等元信息推荐使用MySQL对象存储(Object Storage)持久化向量数据支持S3/MinIO等# 检查系统环境 lsb_release -a docker --version docker-compose --version提示建议使用至少8GB内存的机器Milvus的索引构建过程对内存要求较高对于生产环境我们通常需要部署分布式集群。但本文演示的单机版方案已能满足大多数开发测试需求且具有以下优势资源占用可控通过Docker资源限制避免影响主机其他服务一键启停所有服务通过compose文件统一管理配置集中化所有参数在YAML文件中明确定义扩展便捷可随时添加新服务节点2. Docker Compose编排配置下面是我们精心设计的docker-compose.yml文件整合了Milvus核心服务与可视化工具version: 3.5 services: etcd: container_name: milvus-etcd image: quay.io/coreos/etcd:v3.5.0 environment: - ETCD_AUTO_COMPACTION_MODErevision - ETCD_AUTO_COMPACTION_RETENTION1000 - ETCD_QUOTA_BACKEND_BYTES4294967296 volumes: - etcd_data:/etcd ports: - 2379:2379 command: etcd -advertise-client-urlshttp://0.0.0.0:2379 -listen-client-urls http://0.0.0.0:2379 minio: container_name: milvus-minio image: minio/minio:RELEASE.2022-03-17T06-34-49Z environment: - MINIO_ACCESS_KEYminioadmin - MINIO_SECRET_KEYminioadmin volumes: - minio_data:/minio_data ports: - 9000:9000 command: minio server /minio_data --console-address :9000 standalone: container_name: milvus-standalone image: milvusdb/milvus:v2.0.2 environment: - ETCD_ENDPOINTSetcd:2379 - MINIO_ADDRESSminio:9000 volumes: - milvus_data:/var/lib/milvus ports: - 19530:19530 - 9091:9091 depends_on: - etcd - minio attu: container_name: milvus-attu image: zilliz/attu:v2.0.5 environment: - MILVUS_URLstandalone:19530 ports: - 3000:3000 depends_on: - standalone volumes: etcd_data: minio_data: milvus_data:关键配置说明etcd服务Milvus使用etcd进行服务发现和元数据存储minio服务提供对象存储能力持久化向量数据standalone服务Milvus主服务暴露19530端口供客户端连接attu服务官方可视化工具提供Web管理界面3. 部署与初始化将上述配置保存为docker-compose.yml后执行以下命令启动服务栈# 启动所有服务后台模式 docker-compose up -d # 查看服务状态 docker-compose ps # 查看Milvus日志 docker logs milvus-standalone -f服务启动后可以通过以下方式验证各组件状态组件验证方式预期结果Milvuscurl localhost:19530/health返回{status:OK}Attu浏览器访问http://localhost:3000显示登录界面MinIO浏览器访问http://localhost:9000显示MinIO控制台注意首次启动可能需要1-2分钟完成各服务初始化期间访问可能出现连接错误4. 系统配置调优为了获得最佳性能我们需要根据硬件配置调整Milvus参数。创建custom.yaml文件进行个性化配置# custom.yaml queryNode: gracefulTime: 1000 stats: publishInterval: 1000 dataNode: flush: insertBufSize: 16777216 indexNode: buildParallel: 2 common: retentionDuration: 432000将该配置文件挂载到standalone服务# 修改docker-compose.yml中standalone服务的volumes部分 volumes: - ./custom.yaml:/milvus/configs/custom.yaml - milvus_data:/var/lib/milvus主要调优参数说明queryNode.gracefulTime查询超时时间(ms)dataNode.flush.insertBufSize插入缓冲区大小(bytes)indexNode.buildParallel并行构建索引的线程数common.retentionDuration数据保留时间(秒)5. 可视化管理与实践Attu提供了直观的Web界面支持以下核心操作集合管理创建/删除集合设置向量维度、索引类型配置分区策略数据操作批量导入向量数据执行相似度搜索查看数据统计信息系统监控实时资源使用情况查询性能指标节点健康状态典型工作流程示例# 使用PyMilvus连接 from pymilvus import connections, Collection connections.connect(default, hostlocalhost, port19530) # 创建集合 from pymilvus import FieldSchema, CollectionSchema, DataType fields [ FieldSchema(id, DataType.INT64, is_primaryTrue), FieldSchema(embedding, DataType.FLOAT_VECTOR, dim128) ] schema CollectionSchema(fields) collection Collection(demo_collection, schema) # 插入数据 import numpy as np vectors np.random.random((1000, 128)).tolist() collection.insert([list(range(1000)), vectors]) # 构建索引 index_params { index_type: IVF_FLAT, metric_type: L2, params: {nlist: 128} } collection.create_index(embedding, index_params) # 执行搜索 search_params {metric_type: L2, params: {nprobe: 10}} results collection.search( vectors[:5], embedding, search_params, limit3 )6. 常见问题排查遇到问题时可参考以下排查指南服务启动失败检查端口冲突netstat -tulnp | grep 19530查看容器日志docker-compose logs查询性能低下确认索引类型与场景匹配IVF_FLAT平衡精度与速度HNSW最高召回率DISKANN超大向量规模调整nprobe参数平衡精度与延迟内存不足限制容器内存在compose文件中添加standalone: deploy: resources: limits: memory: 8G降低缓存大小调整dataNode.flush.insertBufSize数据持久化定期备份MinIO数据目录导出关键元数据docker exec milvus-etcd etcdctl get --prefix backup.txt7. 生产环境建议对于关键业务部署建议考虑以下增强措施高可用架构部署3节点etcd集群配置MinIO纠删码启用Milvus分布式模式监控告警prometheus: image: prom/prometheus ports: - 9090:9090 volumes: - ./prometheus.yml:/etc/prometheus/prometheus.yml资源隔离为每个服务配置独立的cgroup使用--cpus参数限制CPU使用率设置内存硬限制防止OOM安全加固启用MinIO TLS加密配置etcd客户端证书认证限制Milvus管理端口访问实际部署中我们发现最耗时的环节通常是索引构建。对于千万级向量的场景建议使用SSD存储加速IO根据CPU核心数调整buildParallel在业务低峰期执行全量索引构建

相关文章:

保姆级教程:在Ubuntu 20.04上用Docker Compose一键部署Milvus向量数据库(附可视化界面)

基于Docker Compose的Milvus向量数据库全栈部署指南 在AI应用开发领域,向量数据库正成为处理非结构化数据的核心基础设施。作为一款开源的向量相似度搜索引擎,Milvus凭借其出色的性能和易用性,正在图像检索、推荐系统、自然语言处理等场景中快…...

Linux之buildroot(5)实战:从零定制嵌入式系统镜像

1. 初识Buildroot:嵌入式开发的瑞士军刀 第一次接触Buildroot是在2014年,当时为一个工业控制器项目构建定制化Linux系统。传统方式需要手动配置工具链、编译内核、组装根文件系统,整个过程就像玩多米诺骨牌——任何一个环节出错就得推倒重来。…...

SpringBoot项目实战:国际手机号归属地查询的3种实现方案对比

SpringBoot实战:国际手机号归属地查询方案深度评测与技术选型指南 在全球化应用开发中,国际手机号验证与归属地查询已成为用户注册、风控校验的标配功能。面对各国复杂的号码规则与运营商体系,开发者常陷入方案选型的困境。本文将基于SpringB…...

Harmonyos应用实例175:锐角三角函数动态定义

应用实例五:锐角三角函数动态定义 知识点:第二十八章《锐角三角函数》—— 正弦、余弦、正切。 功能:动态直角三角形。学生拖动角度滑块(0∘0^\circ0∘ -...

医学图像分割的‘内卷’之路:从U-Net到R2U-Net,我们到底在卷什么?

医学图像分割的进化逻辑:解码R2U-Net中的循环残差设计哲学 当我们在2023年回望医学图像分割领域的发展轨迹,会发现一个有趣的现象:U-Net及其衍生模型依然占据着研究与应用的主流地位。这不禁让人思考——在这个被认为"内卷"严重的细…...

AudioSeal Pixel Studio行业落地:教育音频防盗录、金融语音存证、媒体内容溯源

AudioSeal Pixel Studio行业落地:教育音频防盗录、金融语音存证、媒体内容溯源 1. 引言:当声音需要“身份证” 想象一下,你花了几周时间精心录制了一套付费课程音频,刚上线没多久,就发现它被录屏、剪辑后&#xff0c…...

Harmonyos应用实例174:位似图形变换

应用实例四:位似图形变换 知识点:第二十七章《相似》—— 位似。 功能:学生拖动“位似中心”点,调整缩放比例。图形实时进行放大或缩小变换。演示图形任意一对对应点连线均过位似中心,且位似比等于相似比。 interface Point {x: numbery: number }@Entry @Component st…...

鸿蒙Shape组件实战:5分钟搞定自定义几何图形绘制(附完整代码)

鸿蒙Shape组件实战:5分钟搞定自定义几何图形绘制(附完整代码) 在鸿蒙应用开发中,UI设计往往需要超越标准控件的限制,通过自定义图形来提升用户体验。Shape组件作为鸿蒙UI系统的核心绘图工具,能够帮助开发者…...

TWDS系统在重载铁路轮对动态检测中的关键技术解析

1. 重载铁路轮对检测的行业痛点 重载铁路运输作为现代物流体系的重要支柱,每天承载着数以万吨计的货物运输任务。以大秦铁路为例,这条年运量超过4亿吨的能源大动脉上,C80型货车以每小时80公里的速度日夜穿梭,单列车重量可达2万吨。…...

树莓派音频配置实战:aplay声卡识别问题排查指南

1. 当树莓派沉默时:aplay声卡识别问题初探 第一次在树莓派上运行aplay -l却看到"no soundcards found"的提示时,那种感觉就像对着麦克风喊话却听到一片寂静。作为一款本该开箱即用的开发板,音频输出问题却成了许多树莓派Ubuntu用户…...

别再死记硬背公式了!用MATLAB手把手教你玩转根轨迹,分析系统稳定性

用MATLAB实战根轨迹分析:从图形读懂系统稳定性 打开MATLAB,输入几行代码,你就能看到抽象的控制理论在屏幕上"活"过来——这就是根轨迹法的魅力。作为自动控制原理中的核心分析方法,根轨迹不仅能帮你避开繁琐的数学推导&…...

Fish Speech 1.5语音合成绿色计算:功耗监控与能效比优化实践

Fish Speech 1.5语音合成绿色计算:功耗监控与能效比优化实践 1. 语音合成的能耗挑战与绿色计算意义 语音合成技术在日常生活中的应用越来越广泛,从智能助手到有声读物,从客服系统到教育工具,无处不在。但随着使用量的增加&#…...

PXE vs iPXE:如何为你的H200 GPU服务器选择最佳网络引导方案(含性能对比)

PXE与iPXE深度解析:为H200 GPU服务器打造高效网络引导方案 1. 网络引导技术演进与核心价值 在数据中心和AI计算领域,网络引导技术正经历着从传统PXE到现代iPXE的范式转变。这种转变不仅仅是协议支持的扩展,更是对大规模GPU服务器集群部署效率…...

DanKoe 视频笔记:个人品牌构建:如何创建最有利可图的领域——你自己

在本节课中,我们将学习如何构建一个以你自身为核心的个人品牌领域。我们将探讨为何“你自己”是最独特的利基市场,并提供一个清晰的步骤指南,帮助你从零开始创建并发展它。 我购买的第一门商业课程是一门价值六位数的代理课程。 那是六年前的…...

为什么你的Dify异步节点总超时?揭秘插件下载源篡改风险、npm proxy冲突与install-hooks绕过方案

第一章:Dify异步节点超时现象的系统性归因Dify 的异步节点(如 LLM、HTTP、知识库检索等)在高负载或复杂编排场景下频繁出现超时,表面表现为 TaskTimeoutError 或 WorkerLostError,但其根源并非单一配置参数失当&#x…...

傅立叶变换不只是信号处理:看FNO如何用它革新AI求解物理方程

傅立叶变换不只是信号处理:看FNO如何用它革新AI求解物理方程 当我们谈论傅立叶变换时,大多数人脑海中浮现的可能是音频处理、图像压缩或无线通信。但今天,这个诞生于19世纪的数学工具正在人工智能领域掀起一场革命——傅立叶神经算子&#xf…...

AudioSeal Pixel Studio实操手册:检测报告PDF导出与API对接方法

AudioSeal Pixel Studio实操手册:检测报告PDF导出与API对接方法 1. 产品概述 AudioSeal Pixel Studio是一款基于Meta开源的AudioSeal算法构建的专业音频水印工具。它能够在保持原始音频质量的前提下,为音频文件嵌入隐形数字水印,同时提供强…...

Steam交易效率革命:从手动操作到智能批量化的终极指南

Steam交易效率革命:从手动操作到智能批量化的终极指南 【免费下载链接】Steam-Economy-Enhancer 中文版:Enhances the Steam Inventory and Steam Market. 项目地址: https://gitcode.com/gh_mirrors/ste/Steam-Economy-Enhancer 还在为Steam交易…...

嵌入式ByteBuffer库:轻量级字节缓冲区设计与实践

1. ByteBuffer 库深度解析:面向嵌入式系统的高效字节缓冲区设计与实践在嵌入式系统开发中,数据缓冲区(Buffer)是通信协议栈、传感器数据采集、串口收发、文件系统中间层等场景中最基础也最关键的基础设施。一个设计不良的缓冲区实…...

OFA图像字幕模型实战:为AR眼镜实时画面生成英文语音旁白

OFA图像字幕模型实战:为AR眼镜实时画面生成英文语音旁白 1. 项目概述与核心价值 想象一下,当你戴着AR眼镜漫步在陌生的城市街道,眼前的建筑、商店、风景都能实时获得英文语音解说——这就是OFA图像字幕模型的魅力所在。本项目基于iic/ofa_i…...

伊朗战争会给磁性元件行业带来怎样的影响?

霍尔木兹海峡的炮火未歇,全球能源供应链的涟漪已演变为磁性元件行业的潜在风暴。2026 年 2 月 28 日,伊朗战争骤然爆发,其封锁霍尔木兹海峡的反制措施,直接搅动了全球能源格局,并间接击中了磁性元件产业链的 “命门”。…...

跨域通信实战:利用iframe与postMessage安全获取接口数据

1. 为什么我们需要跨域通信? 想象一下这样的场景:你正在开发一个电商网站,需要嵌入第三方物流公司的包裹追踪页面。这个追踪页面放在iframe里,但当你尝试从父页面获取物流数据时,浏览器却无情地抛出了错误。这就是臭名…...

书匠策AI:论文数据分析的“超级外挂”,开启科研新纪元

在学术探索的漫漫征途中,论文写作宛如一场充满挑战的冒险。而数据分析,作为这场冒险中的关键关卡,常常让众多学者和学生望而却步。繁杂的数据、晦涩的统计方法,仿佛一道道难以跨越的沟壑。不过别担心,今天我要给大家介…...

探索智慧交通数据可视化:深圳地铁实时客流分析的技术实践与价值挖掘

探索智慧交通数据可视化:深圳地铁实时客流分析的技术实践与价值挖掘 【免费下载链接】SZT-bigdata 深圳地铁大数据客流分析系统🚇🚄🌟 项目地址: https://gitcode.com/gh_mirrors/sz/SZT-bigdata 在城市化进程加速的今天&a…...

AX12舵机底层驱动开发:协议解析与STM32工程实践

1. AX12舵机底层驱动库技术解析与工程实践AX12系列智能舵机(以Robotis AX-12A为代表)是嵌入式机器人领域广泛应用的串行总线型伺服执行器。其核心价值在于将传统模拟舵机的开环控制升级为具备位置、速度、负载、温度等多参数反馈的闭环数字控制系统&…...

Purple Pi OH主板GPIO控制秘籍:用libgpiod命令行工具快速调试硬件接口

Purple Pi OH主板GPIO深度操控指南:从命令行到实战开发的完整解决方案 在开源硬件领域,GPIO(通用输入输出接口)的灵活控制能力往往决定着项目开发的成败。Purple Pi OH作为一款基于RK3566处理器的多功能开发板,其GPIO系…...

告别Vivado卡顿:Notepad++轻量化Verilog语法检查全攻略(含NppExec配置)

硬件工程师的效率革命:Notepad与Verilog语法检查的深度整合 每次打开Vivado都要忍受漫长的启动时间,只为检查几行Verilog代码的语法?作为FPGA开发者,我们经常需要快速验证代码片段,但传统EDA工具的笨重让我们在简单任务…...

Polyworks宏脚本开发入门:5分钟搞定环境搭建与基础命令录制

Polyworks宏脚本开发入门:5分钟搞定环境搭建与基础命令录制 在工业测量与三维检测领域,Polyworks以其强大的点云处理能力和灵活的二次开发接口,成为众多工程师的首选工具。而宏脚本开发功能,则是解锁Polyworks全部潜力的关键钥匙。…...

鸿蒙开发避坑指南:手把手教你移植安卓网络请求库okhttp4.9.1

鸿蒙开发实战:从安卓迁移okhttp4.9.1的完整解决方案 当安卓开发者初次接触鸿蒙系统时,网络请求库的迁移往往是第一个需要攻克的难题。作为安卓生态中最流行的网络请求库之一,okhttp的稳定性和高效性使其成为众多应用的首选。本文将深入探讨如…...

ChatGPT实战指南:GPT-4o如何解决内容创作与代码开发的真实痛点

大模型的价值不在于参数规模,而在于能否解决实际问题。GPT-4o作为当前能力均衡的旗舰模型,在内容创作、代码开发、数据分析等场景中展现出实用价值。目前国内用户可通过聚合平台RskAi(www.rsk.cn)免费体验GPT-4o,无需特…...