当前位置: 首页 > article >正文

【词汇专栏】向量数据库:RAG的弹药库

向量数据库RAG的弹药库一句话理解向量数据库是AI时代的图书馆索引系统——不是按字母排序而是按语义相似度组织让AI能够快速找到意思相近的内容。2026年向量数据库已从可选项变成RAG和Agent系统的必选项。目录什么是向量数据库核心原理主流产品对比2026年最新动态实战代码选型指南常见问题延伸阅读读者互动1. 什么是向量数据库1.1 定义向量数据库Vector Database是一种专门存储和检索高维向量的数据库系统。对比维度传统数据库向量数据库查询语法SELECT * WHERE name AISELECT * WHERE similar TO machine匹配方式精确匹配语义相似示例name “AI”AI ≈ 机器学习1.2 为什么需要向量数据库场景传统方案向量数据库搜索手机只返回含手机的结果返回iPhone、智能手机等语义理解关键词匹配理解意图图片搜索文件名匹配视觉特征匹配推荐系统规则匹配协同过滤1.3 核心应用场景向量数据库四大应用应用说明RAG 检索增强生成结合知识库提供更准确的生成语义搜索基于语义理解而非关键词匹配Agent 记忆系统为Agent提供长期记忆能力推荐系统个性化推荐和相似度匹配2. 核心原理2.1 向量化把内容变成数字嵌入Embedding将文本、图像等转换为向量# 文本向量化示例fromsentence_transformersimportSentenceTransformer modelSentenceTransformer(all-MiniLM-L6-v2)# 单条文本text人工智能是让机器具有人类智能的技术vectormodel.encode(text)print(f向量维度:{len(vector)})# 384维print(f向量示例:{vector[:5]}...)# [-0.0231, 0.0542, ...]# 批量文本texts[AI是什么,机器学习入门,深度学习教程]vectorsmodel.encode(texts)print(f向量矩阵:{vectors.shape})# (3, 384)2.2 相似度度量度量方式公式适用场景余弦相似度cos(θ) A·B/(|A||B|)文本嵌入欧氏距离√Σ(Aᵢ-Bᵢ)²图像向量点积A·B归一化向量指标说明向量A[1, 1] → 向量方向45°向量B[1, 0] → 向量方向0°cos(θ) 0.707 → 70.7%相似结论更近的方向 更相似的语义2.3 近似最近邻ANN索引为什么需要ANN数据规模暴力搜索时间ANN搜索时间1,0001ms1ms100,000100ms1ms10,000,00010s10ms100,000,000100s100ms核心算法算法特点代表库HNSW图索引速度快Milvus, QdrantIVF倒排索引FaissPQ量化压缩FaissDiskANN磁盘索引大规模Microsoft层级结构作用Layer 2● ────── ●全局连接快速定位入口点Layer 1● ──● ──● ──●局部连接精细搜索Layer 0● ● ● ● ● ● ● ●底层数据点搜索流程从顶层快速定位 → 逐层下降 → 找到最近邻2.4 索引类型对比索引类型构建速度查询速度内存占用精度FLAT-慢大100%IVF_FLAT快中中95-99%HNSW快快大95-99%PQ很快快小85-95%HNSW_PQ很快很快小85-95%3. 主流产品对比3.1 产品一览产品类型GitHub特点Milvus开源43K Stars功能最全百亿级支持Pinecone云服务-零运维增长最快Qdrant开源25K StarsRust实现高性能Weaviate开源22K Stars原生多模态支持Chroma嵌入式15K Stars轻量级嵌入式FAISS库(Meta)30K Stars最成熟研究级3.2 详细对比表产品类型GitHub特点适合场景Milvus开源43K功能最全支持百亿级企业级大规模Pinecone云服务-零运维开箱即用快速上线Qdrant开源25KRust实现高性能实时检索Weaviate开源22K原生多模态多模态应用Chroma嵌入式15K轻量易用原型/POCFAISS库30KFacebook出品最成熟研究/离线3.3 选型建议问题选项推荐方案是否需要云服务Yes→ PineconeNo→ 继续判断开源方案No→ Chroma轻量POCYes→ 继续判断数据规模多大100M→ Milvus大规模其他→ Qdrant中小规模4. 2026年最新动态4.1 技术演进时间进展意义2025ChunkKV普及长文本检索效率提升2025Hybrid Search成熟关键词向量混合搜索2026.1ThinKV发布极致显存优化2026.2Graph-RAG整合图结构向量成为标配2026.4Agent Memory标配向量库成为Agent长期记忆4.2 2026年新趋势1. 混合检索成为标配阶段关键词检索 (BM25)向量检索 (Embedding)RRF融合用户查询“AI Agent的发展”同上-权重AI×0.3, Agent×0.4Agent×0.8, 发展×0.7Reciprocal Rank Fusion结果关键词匹配文档语义相似文档最终Top-K排序2. 与Agent深度整合# Agent记忆系统的向量数据库设计classAgentMemory:Agent的向量记忆库def__init__(self):# 短期记忆对话历史self.short_termMilvusCollection(short_term)# 长期记忆重要经验self.long_termMilvusCollection(long_term)# 知识库结构化知识self.knowledgeMilvusCollection(knowledge)defremember(self,experience):记忆存储vectorembed(experience)self.long_term.insert(vector,{content:experience})defrecall(self,query):记忆检索query_vectorembed(query)# 混合检索resultsself.long_term.search(query_vector,limit5,hybridTrue,# 启用混合检索rerankTrue# 重排序)returnresults5. 实战代码5.1 Milvus实战# Milvus向量数据库实战frompymilvusimportconnections,Collection,FieldSchema,CollectionSchema,DataTypefromsentence_transformersimportSentenceTransformer# 1. 连接Milvusconnections.connect(default,hostlocalhost,port19530)# 2. 定义Schemafields[FieldSchema(nameid,dtypeDataType.INT64,is_primaryTrue,auto_idTrue),FieldSchema(nameembedding,dtypeDataType.FLOAT_VECTOR,dim384),FieldSchema(nametext,dtypeDataType.VARCHAR,max_length65535),FieldSchema(namemetadata,dtypeDataType.JSON),]schemaCollectionSchema(fields,descriptionRAG Knowledge Base)# 3. 创建CollectioncollectionCollection(rag_knowledge,schema)# 4. 创建索引index_params{index_type:HNSW,metric_type:COSINE,params:{M:16,efConstruction:200}}collection.create_index(embedding,index_params)# 5. 插入数据modelSentenceTransformer(all-MiniLM-L6-v2)texts[RAG是检索增强生成技术,向量数据库用于存储嵌入向量,Agent可以调用工具完成任务]embeddingsmodel.encode(texts)entities[embeddings.tolist(),texts,[{source:doc1},{source:doc2},{source:doc3}]]collection.insert(entities)# 6. 检索collection.load()search_params{metric_type:COSINE,params:{ef:100}}query什么是RAG技术query_vectormodel.encode([query])resultscollection.search(query_vector.tolist(),embedding,search_params,limit3,output_fields[text,metadata])forhitinresults[0]:print(f文本:{hit.entity.get(text)})print(f相似度:{hit.score})5.2 Qdrant实战# Qdrant向量数据库实战fromqdrant_clientimportQdrantClient,modelsfromqdrant_client.modelsimportDistance,VectorParams,PointStruct# 1. 连接QdrantclientQdrantClient(localhost,port6333)# 2. 创建Collectionclient.create_collection(collection_namemy_collection,vectors_configVectorParams(size768,distanceDistance.COSINE),)# 3. 插入向量client.upsert(collection_namemy_collection,points[PointStruct(id1,vector[0.1]*768,payload{text:RAG技术简介,category:AI}),PointStruct(id2,vector[0.2]*768,payload{text:向量数据库原理,category:Database}),])# 4. 检索search_resultsclient.search(collection_namemy_collection,query_vector[0.15]*768,limit5,query_filtermodels.Filter(must[models.FieldCondition(keycategory,matchmodels.MatchValue(valueAI))]))5.3 Chroma轻量级实战# Chroma嵌入式向量数据库importchromadbfromchromadb.utilsimportembedding_functions# 1. 创建Chroma客户端clientchromadb.Client()# 2. 创建Collectioncollectionclient.create_collection(namemy_knowledge,embedding_functionembedding_functions.DefaultEmbeddingFunction())# 3. 添加文档collection.add(documents[RAG Retrieval Augmented Generation,向量数据库用于存储嵌入向量,Agent可以通过RAG获取知识],ids[doc1,doc2,doc3],metadatas[{source:web},{source:book},{source:paper}])# 4. 查询resultscollection.query(query_texts[什么是RAG],n_results2)print(results)6. 选型指南6.1 场景选型场景推荐选择原因快速POCChroma零配置易上手中小规模生产Qdrant性能好资源占用低大规模企业级Milvus功能全扩展性强云服务/零运维Pinecone全托管弹性扩展研究/实验FAISS最成熟灵活定制多模态应用Weaviate原生支持图像等6.2 成本对比产品免费额度起步价/月按量付费Pinecone1GB$70/100M向量✅Milvus Cloud1M向量$25/100M向量✅Qdrant Cloud1GB$25✅Weaviate Cloud1GB$25✅Chroma完全免费--Milvus (自部署)免费基础设施成本-7. 常见问题Q1向量数据库和普通数据库有什么区别答核心区别在于检索方式。对比普通数据库向量数据库检索方式精确匹配近似匹配查询语言SQL向量相似度索引B树、哈希HNSW、IVF适用场景结构化数据非结构化数据Q2什么时候需要向量数据库答当需要语义搜索或相似性检索时。✅ 需要AI理解查询意图✅ 处理大量非结构化数据文本、图片✅ 构建RAG系统✅ Agent需要长期记忆❌ 简单关键词匹配就够用❌ 数据量很小1000条Q3向量数据库的精度和性能如何平衡答根据业务需求选择。需求推荐配置高精度HNSW (M32, ef200)均衡HNSW (M16, ef100)高性能PQ HNSW内存受限DiskANNQ4向量数据库会取代传统数据库吗答不会两者互补。向量数据库处理非结构化数据的语义检索传统数据库处理结构化数据的事务和精确查询最佳实践混合架构两者配合使用8. 延伸阅读相关词汇关联度推荐理由W03 RAG⭐⭐⭐⭐向量数据库是RAG的核心组件W12 嵌入⭐⭐⭐⭐嵌入是向量化的基础W04 Agent⭐⭐⭐Agent Memory依赖向量库W28 Agent记忆系统⭐⭐⭐⭐Agent Memory 向量库 图库 批判性思考1. 向量数据库是否过度工程化很多场景真的需要专门的向量数据库吗PostgreSQL pgvector是否已经足够2. 云服务vs自部署的权衡Pinecone等云服务是否会导致vendor lock-in自部署的运维成本是否被低估3. 数据安全问题向量数据库中存储的数据安全性如何保证敏感信息向量化后是否仍需加密4. 标准化问题各家向量数据库的API和数据格式不统一是否需要行业标准本文收录于「AI词汇专栏」作者孤岛站岗本文参考资料2026年4月《向量数据库完全指南》QubitTool 2026.2《向量数据库选型指南2026》Dev.toMilvus官方文档 2026.4《43K Star的向量数据库实测》腾讯云 2026.4

相关文章:

【词汇专栏】向量数据库:RAG的弹药库

向量数据库:RAG的弹药库 一句话理解 向量数据库是AI时代的"图书馆索引系统"——不是按字母排序,而是按语义相似度组织,让AI能够快速找到"意思相近"的内容。2026年,向量数据库已从"可选项"变成RAG…...

楼宇空间资产,尽在掌控

招商团队手里的空置表、运营团队维护的房源表、财务团队核算的资产表,三张表里的楼宇信息经常对不上。招商说A座还有500平可租,运营说那500平上周已经签了意向书,财务说按合同那500平下个月才生效……不是谁错了,而是各自的数据更…...

IntelliJ IDEA 2026年4月新版本 2026.1 更新内容,安装激活使用教程

更新时间:2026-04-07 支持最新版本:2026.1(2026年4月发布) 支持在线更新 支持Windows、MAC、Linux 新版本更新亮点: 核心功能升级 AI生态开放平台:原生支持Codex、Cursor、GitHub Copilot等多智能体&am…...

第九篇:内容组织——知识图谱与实体关系:让AI像专家一样“理解”你

副标题:从“字符串”到“事物”——构建品牌在AI认知世界中的知识网络 引言:当AI只记得你的“名字”,却不知道你“是谁” 陆薇在智联优品的GEO监测报告中,发现了一个让她困惑的现象。 品牌在AI答案中的提及率已经提升了近三倍,AI开始引用智联优品的品牌名称和产品参数。…...

SSH 密钥格式错误排查指南

引言 在日常的远程服务器管理中,SSH(Secure Shell)是一个必不可少的工具。然而,有时我们会遇到一些看似简单却让人头疼的问题,比如无法通过 SSH 连接到服务器。本文将详细介绍一个常见的 SSH 问题——密钥格式错误,并通过一个实例来说明如何解决此类问题。 SSH 密钥格式…...

【实战指南】Gradio:从零构建可交互的机器学习演示平台

1. 为什么你需要Gradio? 如果你做过机器学习项目,肯定遇到过这样的尴尬:辛辛苦苦训练好的模型,只能躺在Jupyter Notebook里吃灰。想给同事演示效果?要么得让他们装Python环境,要么就得把代码打包成晦涩的AP…...

洋葱矮砧密植模式:水肥一体化系统铺设全实操指南

【导读】这篇文章主要写给正在尝试或者打算搞洋葱矮砧密植的朋友们。你可能听说过“矮砧密植”这个词,但放在洋葱上到底怎么操作?水肥一体化系统又该怎么铺?别急,我会用大白话把整套流程拆开来讲,从前期准备到管子怎么…...

UML用例建模实战:从零开始绘制高效用例图

1. 什么是UML用例建模? UML用例建模是软件开发中最基础也最重要的需求分析技术之一。简单来说,就是用图形化的方式描述系统该做什么,而不是怎么做。我第一次接触用例图是在大学软件工程课上,当时觉得这些"小人"和"…...

CANdevStudio完全指南:终极免费开源CAN总线仿真开发平台

CANdevStudio完全指南:终极免费开源CAN总线仿真开发平台 【免费下载链接】CANdevStudio Development tool for CAN bus simulation 项目地址: https://gitcode.com/gh_mirrors/ca/CANdevStudio 在汽车电子和工业控制领域,CAN总线仿真工具是开发调…...

程序员夫妻的日常对话,外人听起来像加密通话

一、需求分析:当家务分工变成“用户故事”场景还原妻子:“冰箱食材库存告警,需补充生鲜模块。采购需求优先级:鸡蛋(紧急)、牛肉(高)、草莓(低)。若遇榴莲&…...

Proxmox VE终极配置工具:pvetools高效管理脚本的深度解析

Proxmox VE终极配置工具:pvetools高效管理脚本的深度解析 【免费下载链接】pvetools proxmox ve tools script(debian9 can use it).Including email, samba, NFS set zfs max ram, nested virtualization ,docker , pci passthrough etc. for english user,please …...

保姆级教程:ROS Melodic下用usb_cam驱动UVC摄像头,解决花屏和像素格式警告

ROS Melodic下UVC摄像头驱动配置全指南:从花屏排查到像素格式优化 第一次在ROS中连接USB摄像头时,看到屏幕上闪烁的彩色噪点和扭曲图像,那种挫败感我至今记忆犹新。这不是简单的设备故障,而是ROS视觉开发中典型的"入门仪式&q…...

2024最值得入手的5款农业植保无人机横向测评:大疆T40 vs 极飞P100实战对比

2024农业植保无人机实战横评:5款旗舰机型果园避障与雨季作业深度测试 站在自家果园的田埂上,老张望着刚完成植保作业的无人机缓缓降落,机翼上还沾着晨露与农药的混合液。三年前他第一次接触植保无人机时,光是学习操作就花了整整两…...

探究在 Android 设备上利用 Termux 安装 llama.cpp 并启动 webui

嘿,各位技术爱好者们!我们总是渴望在各种设备上挖掘更多的可能性。Android 设备作为我们日常生活中最常用的工具之一,除了能用来刷剧、聊天,还能变身强大的 “小电脑” 来运行一些有趣的程序。今天,我们就来探索一下如…...

Windows系统QT下载(保姆级教程,一步一步手把手教程!都能学会)

官网链接:https://www.qt.io/zh-cn/development/download 还有一个网盘链接:https://pan.baidu.com/s/1Ny1_MwhpwIuA_1ISt9AcWA?pwd6666 注:这不是主包分享的,是引用其他主包分享的了解,是《_清豆》这个主包的&#x…...

Phi-3-mini-128k-instruct资源监控与成本优化:GPU利用率分析与调优建议

Phi-3-mini-128k-instruct资源监控与成本优化:GPU利用率分析与调优建议 部署一个像Phi-3-mini-128k-instruct这样的模型,就像买了一台高性能跑车。刚上手时,你可能会沉浸在它流畅的对话和快速的响应中,但开了一段时间后&#xff…...

RWKV7-1.5B-G1A代码审查助手:集成VS Code提升代码质量

RWKV7-1.5B-G1A代码审查助手:集成VS Code提升代码质量 1. 开发者的代码质量痛点 每个开发者都经历过这样的场景:写完一段代码后,总觉得哪里不对劲,但又说不上来具体问题。传统的代码审查需要等待同事有空才能进行,而…...

网盘直链下载助手完整指南:告别限速,轻松获取真实下载地址

网盘直链下载助手完整指南:告别限速,轻松获取真实下载地址 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国…...

Cadence 16.6与17.4个人学习版安装指南及常见问题解析

1. Cadence个人学习版简介与下载准备 Cadence个人学习版是硬件工程师入门的绝佳选择,它基于官方安装包进行了精简优化,预装了最新补丁并完成激活,真正做到开箱即用。这个版本由吴川斌老师维护,包含了Capture原理图设计、PSpice电路…...

茉莉花插件完整指南:3步彻底解决Zotero中文文献管理难题

茉莉花插件完整指南:3步彻底解决Zotero中文文献管理难题 【免费下载链接】jasminum A Zotero add-on to retrive CNKI meta data. 一个简单的Zotero 插件,用于识别中文元数据 项目地址: https://gitcode.com/gh_mirrors/ja/jasminum 茉莉花(Jasmi…...

从Blender着色器到Unity材质球:手把手教你用‘烘焙大法’搞定跨平台材质迁移

从Blender着色器到Unity材质球:解密跨平台材质迁移的核心逻辑 在三维内容创作流程中,Blender与Unity的组合堪称黄金搭档,但两者材质系统的差异常常让开发者陷入困境。当你精心设计的材质在Unity中变成一片灰白时,那种挫败感不言而…...

从选电容到调眼图:一个硬件工程师的PCIe 4.0实战避坑笔记

从选电容到调眼图:一个硬件工程师的PCIe 4.0实战避坑笔记 去年参与某AI加速卡项目时,团队第一次尝试PCIe 4.0设计就遭遇了信号完整性问题。当示波器上出现几乎闭合的眼图时,我才真正理解高速信号设计的复杂性。本文将分享从器件选型到调试全流…...

跨平台内网穿透实战:NPS在Windows与Linux下的部署与调试

1. 为什么需要内网穿透? 想象一下这个场景:你正在家里用Windows电脑开发一个Web应用,需要让外地的同事实时查看效果。但你家宽带没有固定公网IP,路由器也做了NAT转换,外部根本无法直接访问你的本地服务。这就是内网穿透…...

信号完整性(SI)与电源完整性(PI)设计实战:从理论到解决方案

1. 信号完整性与电源完整性基础概念 刚入行那会儿,每次听到"信号完整性"和"电源完整性"这两个词就头大。直到有次调试一块高速板卡,信号波形乱得像心电图,我才真正明白它们的重要性。简单来说,**信号完整性(S…...

揭秘R3nzSkin:一款内存级游戏皮肤修改器的技术实现与实战指南

揭秘R3nzSkin:一款内存级游戏皮肤修改器的技术实现与实战指南 【免费下载链接】R3nzSkin Skin changer for League of Legends (LOL) 项目地址: https://gitcode.com/gh_mirrors/r3n/R3nzSkin R3nzSkin是一款专为《英雄联盟》设计的开源换肤工具,…...

贵阳纳海川科技·蔬菜配送行业解决方案

AIIoT赋能蔬菜配送数字化转型:全链路技术方案实践据行业数据显示,传统蔬菜配送行业平均损耗率达15%-25%,人工分拣错漏率超8%,车辆空驶率达28%,利润率仅4%左右。面对蔬菜易腐烂、价位波动大、保鲜要求高的行业特性&…...

如何永久保存微信聊天记录:留痕工具终极指南

如何永久保存微信聊天记录:留痕工具终极指南 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trending/we/WeChatMsg …...

ZooKeeper启动报错排查指南:从JMX配置到dataDir路径修正

1. ZooKeeper启动报错:JMX与dataDir问题全景解析 第一次启动ZooKeeper时看到满屏红色报错,相信很多开发者都会心头一紧。最近在搭建Kafka集群时,我就遇到了经典的启动报错组合拳: ZooKeeper JMX enabled by default Using config:…...

中科智飞青少年也能亲手造

中国 “机械飞鸟” 刷屏🔥中科智飞青少年也能亲手造! 不是电影!是 2026 爆火黑科技🚀无人机进化成真・飞鸟啦 央视 人民日报集体报道我国仿生扑翼无人机震撼全球仿鹰|仿蝶|仿甲虫续航256 分钟 4 小时 &am…...

跨平台组网利器Candy:从零搭建你的私有游戏联机网络

1. 为什么你需要Candy这样的组网工具 记得十年前和大学室友通宵打CS的日子吗?那时候只要一根网线就能把几台电脑连成局域网,延迟低得几乎感觉不到。现在大家天各一方,想联机玩个Minecraft却要忍受公共服务器的高延迟和复杂配置,这…...