当前位置: 首页 > article >正文

faiss向量检索库(并非向量数据库)

文章目录faiss是一个轻量数据库吗?安装依赖最简单示例带持久化的简单示例faiss # 轻量chromadb # 中量milvus # 重量faiss是一个轻量数据库吗?轻量 # 对数据库 # 错它不是一个完整的数据库(没有服务、没有事务、没有分布式)只是一个向量检索库安装依赖注安装的包名是faiss-cpu不是faiss。pip install faiss-cpu最简单示例代码importnumpyasnpimportfaiss datanp.array([[1.0,1.0],[1.0,2.0],[5.0,5.0],[5.0,6.0],[9.0,1.0]],dtypefloat32)# ⚠️ 注意FAISS 必须用 float32# IndexFlatL2 代表计算欧几里得距离直线距离dimension2indexfaiss.IndexFlatL2(dimension)index.add(data)print(f 库里现在有{index.ntotal}条数据)# 进行搜索 假设用户问了一个问题它的向量是 (1.1, 1.1) —— 离 (1,1) 最近querynp.array([[1.1,1.1]],dtypefloat32)# k2 表示返回最近的 2 个结果D,Iindex.search(query,k2)print( 查询向量:,query)print( 距离 (越小越近):,D)print( 找到的索引位置:,I)# 验证I[0][0] 应该是 0因为 data[0] 是 [1.0, 1.0]离 [1.1, 1.1] 最近print(f✅ 最相似的数据是第{I[0][0]}条内容是:{data[I[0][0]]})只需要关注这3个对象1、data (矩阵)你的数据库内容。必须是 float32 格式的 NumPy 数组。2、index (索引)这就是“数据库引擎”。IndexFlatL2 是最基础的索引意思是“把所有数据存下来查的时候一个个算距离”。它不需要训练适合小数据量10万。3、D 和 I (结果)search 函数永远返回两个值。D (Distance)距离。数值越小代表越相似。I (Index)下标。代表这个数据在原来数组里的第几行。带持久化的简单示例要实现持久化核心就是利用FAISS自带的write_index和read_index函数。importnumpyasnpimportfaissimportos# 定义文件名INDEX_FILEmy_faiss_index.bindimension2ifos.path.exists(INDEX_FILE):print(f 发现本地文件{INDEX_FILE}正在加载...)# 【关键步骤】从硬盘读取索引indexfaiss.read_index(INDEX_FILE)else:print(✨ 未找到文件正在创建新索引...)# 1.1 准备数据 (注意这里强制转为 float32)datanp.array([[1.0,1.0],[1.0,2.0],[5.0,5.0],[5.0,6.0],[9.0,1.0]],dtypefloat32)# 1.2 建立索引并添加数据indexfaiss.IndexFlatL2(dimension)index.add(data)# 【关键步骤】将索引保存到硬盘print(f 正在保存索引到{INDEX_FILE}...)faiss.write_index(index,INDEX_FILE)print(✅ 保存完成)querynp.array([[1.1,1.1]],dtypefloat32)D,Iindex.search(query,k2)print(-*30)print(f 查询结果 (距离:{D}, 索引:{I}))print(f当前内存中数据总量:{index.ntotal})

相关文章:

faiss向量检索库(并非向量数据库)

文章目录faiss是一个轻量数据库吗?安装依赖最简单示例带持久化的简单示例faiss # 轻量chromadb # 中量milvus # 重量faiss是一个轻量数据库吗? 轻量 # 对 数据库 # 错,它不是一个完整的数据库(没有服务、没有事务、没有分布式),只是一个向量检索库 安…...

FSSADMIN全栈后台管理系统:高性能、多特性,助力企业快速开发

【导语:FssAdmin是一款开源企业级中后台管理系统,基于多种前端最新技术栈,具有简洁、易上手等特点。它采用Workerman常驻内存引擎驱动,支持多租户SaaS架构,在前后端均有诸多特性,功能丰富且具备安全防护机制…...

3个简单步骤:如何用游戏手柄控制你的Windows电脑?

3个简单步骤:如何用游戏手柄控制你的Windows电脑? 【免费下载链接】Gopher360 Gopher360 is a free zero-config app that instantly turns your Xbox 360, Xbox One, or even DualShock controller into a mouse and keyboard. Just download, run, and…...

Preact安全加固终极指南:7个防御性编程技巧

Preact安全加固终极指南:7个防御性编程技巧 【免费下载链接】preact ⚛️ Fast 3kB React alternative with the same modern API. Components & Virtual DOM. 项目地址: https://gitcode.com/gh_mirrors/pr/preact Preact作为一款轻量级的React替代库&a…...

D3D12渲染窗口一片黑?别慌,用微软PIX工具5分钟定位GPU端问题

D3D12渲染窗口一片黑?用微软PIX工具快速定位GPU端问题 当你满怀期待地运行自己编写的D3D12渲染程序,却发现窗口一片漆黑时,那种挫败感每个图形开发者都深有体会。不同于传统的CPU调试,GPU端的错误往往让人无从下手——代码编译通…...

如何快速成为麻将高手:Akagi麻雀助手完整实战指南

如何快速成为麻将高手:Akagi麻雀助手完整实战指南 【免费下载链接】Akagi 支持雀魂、天鳳、麻雀一番街、天月麻將,能夠使用自定義的AI模型實時分析對局並給出建議,內建Mortal AI作為示例。 Supports Majsoul, Tenhou, Riichi City, Amatsuki,…...

终极指南:如何使用Semantic Release实现Gatsby项目的自动化版本管理

终极指南:如何使用Semantic Release实现Gatsby项目的自动化版本管理 【免费下载链接】gatsby React-based framework with performance, scalability, and security built in. 项目地址: https://gitcode.com/gh_mirrors/ga/gatsby Gatsby是一个基于React的框…...

ERNIE 5.0多模态大模型架构与统一建模技术解析

1. ERNIE 5.0架构解析:多模态统一建模的技术突破ERNIE 5.0作为新一代多模态大模型的代表,其核心创新在于实现了文本、图像、视频和音频的统一建模。与传统多模态模型采用的分立编码器架构不同,ERNIE 5.0通过共享的Transformer骨干网络处理所有…...

如何用KeymouseGo实现鼠标键盘自动化:新手完全指南

如何用KeymouseGo实现鼠标键盘自动化:新手完全指南 【免费下载链接】KeymouseGo 类似按键精灵的鼠标键盘录制和自动化操作 模拟点击和键入 | automate mouse clicks and keyboard input 项目地址: https://gitcode.com/gh_mirrors/ke/KeymouseGo KeymouseGo是…...

Go语言HTTP轮询库rrclaw:高并发轮询客户端的设计与实践

1. 项目概述与核心价值最近在折腾一些需要处理大量网络请求和并发任务的项目,比如数据采集、API压力测试,或者构建一个高并发的微服务后端。这类场景下,一个稳定、高效且易于管理的HTTP客户端库就成了刚需。我尝试过不少方案,从Py…...

专业级AMD Ryzen硬件调试与性能调优终极指南

专业级AMD Ryzen硬件调试与性能调优终极指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gitcode.com/gh_mirrors…...

终极指南:如何使用Black统一Python代码格式化标准

终极指南:如何使用Black统一Python代码格式化标准 【免费下载链接】black The uncompromising Python code formatter 项目地址: https://gitcode.com/GitHub_Trending/bl/black Black是一款毫不妥协的Python代码格式化工具,它能够自动调整你的代…...

云手机免费无限时间版靠谱吗

要判断云手机免费无限时间版是否靠谱,可以从几个维度来分析,首先是合规性,这类打着“免费无限时间”旗号的版本,大多不是官方推出的正规服务,云手机运行需要依托实体服务器,本身就存在带宽、电力、设备折旧…...

智慧农业害虫识别 水稻病虫害数据集 农作物害虫识别数据集 褐飞虱数据集 绿叶蝉识别 卷叶螟、稻蝽检测数据集、二化螟识别数据集、稻潜叶蝇

水稻病虫害数据集核心信息简介 一、数据集核心信息速览表类别 lasses (6) 类别(6) brown-planthopper 褐飞虱 green-leafhopper 绿叶蝉 leaf-folder 卷叶虫 rice-bug 稻蝽象 stem-borer 蛀茎虫 whorl-maggot 卷叶蛆信息类别具体内容数据集类别目标检测类…...

智慧农业出苗率识别图像数据集 无人机航拍农作物出苗率识别 玉米出苗率识别 向日葵出苗率识别 甜菜出苗率数据集 图像数据集1030

智慧农业出苗率识别图像数据集 一、数据集核心信息横向表格信息类别具体内容应用场景面向目标检测任务,主要应用于农业领域,支持农作物相关的检测与计数研究工作数据集数量包含 189 张图像,标注对象总数达 16122 个,无预先划分的训…...

OmenSuperHub终极指南:免费解锁惠普游戏本性能的完整教程

OmenSuperHub终极指南:免费解锁惠普游戏本性能的完整教程 【免费下载链接】OmenSuperHub 使用 WMI BIOS控制性能和风扇速度,自动解除DB功耗限制。 项目地址: https://gitcode.com/gh_mirrors/om/OmenSuperHub 还在为惠普OMEN游戏本官方软件臃肿、…...

大湾区与狮城:亚洲 Web3、Fintech 与家族办公室 IT 架构师的双城记

站在 2026 北美秋招与全球科技招聘放缓的十字路口,许多计算机科学与软件工程专业的留学生在经历 H1B 抽签的不确定性与 OPT 延期的合规压力后,开始将长线职业规划的目光投向亚洲。香港(大湾区金融核心)与新加坡作为亚洲首屈一指的…...

Python + Rust混合编程实战:用PyO3重构核心Order Matching模块,吞吐提升3.8倍,延迟降低67%(附GitHub可运行代码)

更多请点击: https://intelliparadigm.com 第一章:Python 金融量化高频交易引擎 Python 凭借其丰富的生态与低门槛的开发体验,已成为构建金融量化高频交易引擎的核心语言之一。在毫秒级响应、订单簿实时解析与低延迟执行等关键场景中&#x…...

AI Agent Harness Engineering 个性化推荐算法:基于用户行为的智能适配与优化

《AI Agent Harness Engineering落地指南:打造千人千面的个性化推荐算法,从用户行为感知到智能适配全流程拆解》 关键词 AI Agent Harness Engineering、个性化推荐、用户行为建模、智能适配、多智能体协同、推荐系统优化、强化学习推荐 摘要 你是否有过这样的经历:前几…...

如何通过社区力量推动Preact技术公益发展:完整指南

如何通过社区力量推动Preact技术公益发展:完整指南 【免费下载链接】preact ⚛️ Fast 3kB React alternative with the same modern API. Components & Virtual DOM. 项目地址: https://gitcode.com/gh_mirrors/pr/preact Preact作为一款轻量级的React替…...

别再乱存数据了!手把手教你用STM32F407的内部Flash做个掉电不丢的‘小硬盘’

STM32F407内部Flash实战:构建高可靠键值存储系统 每次产品断电重启后参数丢失?日志记录无处安放?外部EEPROM又贵又占空间?今天咱们用STM32F407内部Flash打造一个堪比小型数据库的存储系统。不同于基础读写教程,这里要解…...

写给做系统设计 / 项目实战的你:风控规则版本管理和审计怎么设计

风控规则版本管理怎么做才可审计?版本快照、变更记录、回滚留痕全讲清 这篇直接按风控规则版本管理来拆,不只讲“保存一个版本号”,而是把快照、Diff、审批、回滚和变更留痕讲清楚。 目标是你看完后,能把规则版本从“能回退”提升…...

如何创建PostCSS自定义解析器:轻松扩展新CSS语法的完整指南

如何创建PostCSS自定义解析器:轻松扩展新CSS语法的完整指南 【免费下载链接】postcss Transforming styles with JS plugins 项目地址: https://gitcode.com/gh_mirrors/po/postcss PostCSS作为强大的CSS转换工具,不仅支持标准CSS语法&#xff0c…...

告别数据手册!用STM32CubeMX和HAL库5分钟搞定MAX31855热电偶测温(附模拟SPI备用方案)

5分钟实战:用STM32CubeMX和HAL库快速集成MAX31855热电偶模块 当你在创客项目中需要快速实现高精度温度监测时,MAX31855热电偶数字转换器是个不错的选择。但传统开发方式需要反复查阅数据手册、调试SPI时序,往往耗费大量时间。本文将展示如何用…...

plumber实战:10个常用场景示例详解

plumber实战:10个常用场景示例详解 【免费下载链接】plumber A swiss army knife CLI tool for interacting with Kafka, RabbitMQ and other messaging systems. 项目地址: https://gitcode.com/gh_mirrors/pl/plumber plumber是一款功能强大的命令行工具&a…...

BLHeli编程适配器制作指南:低成本DIY专业烧录工具

BLHeli编程适配器制作指南:低成本DIY专业烧录工具 【免费下载链接】BLHeli BLHeli for brushless ESC firmware 项目地址: https://gitcode.com/gh_mirrors/bl/BLHeli BLHeli是一款广泛应用于无刷电调的开源固件,为了对电调进行固件升级和参数配置…...

rust-tools.nvim宏展开功能:揭秘Rust宏的底层实现

rust-tools.nvim宏展开功能:揭秘Rust宏的底层实现 【免费下载链接】rust-tools.nvim Tools for better development in rust using neovims builtin lsp 项目地址: https://gitcode.com/gh_mirrors/ru/rust-tools.nvim rust-tools.nvim是一款专为Neovim打造的…...

VSCode AI编程伴侣Twinny:本地部署与云端API配置全攻略

1. 项目概述:一个真正免费的VSCode AI编程伴侣 如果你和我一样,是个长期泡在代码编辑器里的开发者,肯定对AI编程助手又爱又恨。爱的是它确实能提升效率,恨的是那些主流工具要么收费不菲,要么对网络和隐私有要求。直到…...

curl-impersonate故障排除:常见问题和解决方案的完整清单

curl-impersonate故障排除:常见问题和解决方案的完整清单 【免费下载链接】curl-impersonate An active fork of curl-impersonate with more versions and build targets. A series of patches that make curl requests look like Chrome, Firefox and Safari. 项…...

3分钟解锁macOS虚拟机:VMware Unlocker终极配置指南

3分钟解锁macOS虚拟机:VMware Unlocker终极配置指南 【免费下载链接】unlocker VMware Workstation macOS 项目地址: https://gitcode.com/gh_mirrors/unlo/unlocker 你是否想在Windows或Linux电脑上体验macOS系统,却受限于VMware的限制&#xf…...