当前位置：首页 > news >正文

【AI大模型】企业级向量数据库的选择与实战

news 2026/5/19 3:06:10

前言

ChatGPT4相比于ChatGPT3.5,有着诸多不可比拟的优势，比如图片生成、图片内容解析、GPTS开发、更智能的语言理解能力等，但是在国内使用GPT4存在网络及充值障碍等问题，如果您对ChatGPT4.0感兴趣，可以私信博主为您解决账号和环境问题。同时，如果您有一些AI技术应用的需要，也欢迎私信博主，我们聊一聊思路和解决方案，能为您解决问题，是我的荣幸！！

引言

随着人工智能和机器学习技术的不断发展，向量数据库在处理高维数据和相似性搜索中扮演着越来越重要的角色。本文将介绍三种主流的向量数据库：Milvus、Faiss 和 Annoy，探讨它们的安装、配置与使用，并结合实际应用场景，提供具体的代码示例和性能优化技巧，帮助企业选择合适的向量数据库解决方案。

一、Milvus的安装、配置与使用

1.1 Milvus简介

Milvus 是一款开源的向量数据库，专为高效的相似性搜索和高维数据分析设计。它支持多种索引类型，包括 IVF、HNSW 和 ANNOY，能够处理数十亿条向量数据。Milvus 还具有高可扩展性和高可用性，适合企业级应用。

1.2 Milvus的安装

Milvus 提供了多种安装方式，包括 Docker、Helm 和源码安装。下面以 Docker 安装为例。

1.2.1 环境准备

确保你的系统已经安装了 Docker 和 Docker Compose。可以通过以下命令检查：

docker --version
docker-compose --version

1.2.2 下载 Milvus Docker 镜像

使用 Docker Compose 文件来启动 Milvus。首先，创建一个目录并进入该目录：

mkdir milvus-docker && cd milvus-docker

创建一个名为 docker-compose.yml 的文件，内容如下：

version: '3.5'
services:etcd:image: quay.io/coreos/etcd:v3.4.3container_name: milvus_etcdports:- "2379:2379"- "2380:2380"command: etcd -advertise-client-urls http://0.0.0.0:2379 --listen-client-urls http://0.0.0.0:2379minio:image: minio/minio:RELEASE.2020-12-03T00-03-10Zcontainer_name: milvus_minioenvironment:MINIO_ACCESS_KEY: "minioadmin"MINIO_SECRET_KEY: "minioadmin"command: server /dataports:- "9000:9000"milvus:image: milvusdb/milvus:v1.1.0-cpu-d030521-2e559ccontainer_name: milvus_cpuports:- "19530:19530"volumes:- /var/lib/milvus/db:/var/lib/milvus/db- /var/lib/milvus/conf:/var/lib/milvus/conf- /var/lib/milvus/logs:/var/lib/milvus/logs- /var/lib/milvus/wal:/var/lib/milvus/walcommand: ["milvus", "run"]

启动 Milvus 服务：

docker-compose up -d

1.3 Milvus的配置

Milvus 的配置文件位于 /var/lib/milvus/conf 目录下，主要配置文件为 server_config.yaml。你可以通过修改此文件来调整 Milvus 的参数设置，例如内存限制、日志级别等。

1.4 Milvus的使用

1.4.1 Python SDK 安装

Milvus 提供了多种客户端 SDK，这里以 Python SDK 为例。首先安装 Milvus 的 Python SDK：

pip install pymilvus

1.4.2 创建和管理向量集合

下面是一个简单的例子，展示如何使用 Milvus 创建一个向量集合并插入数据：

from pymilvus import connections, FieldSchema, CollectionSchema, DataType, Collection# 连接 Milvus 服务
connections.connect("default", host="localhost", port="19530")# 定义字段
fields = [FieldSchema(name="ID", dtype=DataType.INT64, is_primary=True),FieldSchema(name="vector", dtype=DataType.FLOAT_VECTOR, dim=128)
]# 定义集合模式
schema = CollectionSchema(fields, "test_collection")# 创建集合
collection = Collection("test_collection", schema)# 插入数据
import numpy as npvectors = np.random.random((10, 128)).astype(np.float32)
ids = [i for i in range(10)]collection.insert([ids, vectors])# 检索数据
search_vectors = np.random.random((1, 128)).astype(np.float32)
results = collection.search(search_vectors, "vector", params={"nprobe": 10}, limit=5)
for result in results:print(result)

以上代码展示了如何连接 Milvus 服务、创建向量集合、插入数据以及进行简单的向量检索。

二、Faiss的性能优化与实践

2.1 Faiss简介

Faiss 是由 Facebook AI Research 开发的一款高效相似性搜索库，专为处理大型向量集合而设计。Faiss 提供了多种索引类型和优化算法，支持 CPU 和 GPU 加速，适用于需要高性能向量搜索的应用场景。

2.2 Faiss的安装

Faiss 提供了多种安装方式，包括通过 pip 安装和源码编译。这里以 pip 安装为例：

pip install faiss-cpu
# 如果有 GPU 支持
# pip install faiss-gpu

2.3 Faiss的使用

2.3.1 创建索引并插入数据

下面是一个简单的例子，展示如何使用 Faiss 创建一个索引并插入数据：

import numpy as np
import faiss# 生成随机向量数据
d = 128  # 向量维度
nb = 10000  # 向量数量
np.random.seed(1234)
data = np.random.random((nb, d)).astype('float32')# 创建索引
index = faiss.IndexFlatL2(d)# 插入数据
index.add(data)# 检索数据
nq = 5  # 查询数量
xq = np.random.random((nq, d)).astype('float32')
k = 4  # 返回前 k 个最近邻
D, I = index.search(xq, k)
print(I)

2.4 Faiss的性能优化

2.4.1 使用 GPU 加速

如果你的系统支持 GPU，可以使用 GPU 版本的 Faiss 来提高检索速度。首先，安装 faiss-gpu：

pip install faiss-gpu

然后，修改索引创建代码以使用 GPU：

# 创建 GPU 资源
res = faiss.StandardGpuResources()# 将索引移至 GPU
gpu_index = faiss.index_cpu_to_gpu(res, 0, index)# 插入数据
gpu_index.add(data)# 检索数据
D, I = gpu_index.search(xq, k)
print(I)

2.4.2 使用分层索引

Faiss 提供了多种分层索引结构，如 IVF（倒排文件）和 HNSW（层次化的近似图）。下面是使用 IVF 索引的示例：

nlist = 100  # 聚类中心数
quantizer = faiss.IndexFlatL2(d)
index_ivf = faiss.IndexIVFFlat(quantizer, d, nlist, faiss.METRIC_L2)# 训练索引
index_ivf.train(data)# 插入数据
index_ivf.add(data)# 检索数据
index_ivf.nprobe = 10  # 查询时使用的聚类中心数
D, I = index_ivf.search(xq, k)
print(I)

通过这些优化措施，Faiss 可以在大规模向量数据检索中提供高效的性能。

三、Annoy在资源受限环境下的应用

3.1 Annoy简介

Annoy (Approximate Nearest Neighbors Oh Yeah) 是由 Spotify 开发的一款近似最近邻搜索库，特别适合在资源受限的环境中使用。Annoy 使用随机投影树（Random Projection Trees）实现高效的相似性搜索，内存和计算资源占用较低。

3.2 Annoy的安装

Annoy 可以通过 pip 安装：

pip install annoy

3.3 Annoy的使用

3.3.1 创建索引并插入数据

下面是一个简单的例子，展示如何使用 Annoy 创建一个索引并插入数据：

from annoy import AnnoyIndex
import numpy as np# 生成随机向量数据
f = 128  # 向量维度
t = AnnoyIndex(f, 'euclidean')# 插入数据
for i in range(10000):v = np.random.random(f).astype('float32')t.add_item(i, v)# 构建索引树
t.build(10)  # 10 棵树# 保存索引
t.save('test.ann')# 加载索引
u = AnnoyIndex(f, 'euclidean')
u.load('test.ann')  # 注意：索引文件必须在同一维度# 检索数据
index = 0
k = 5  # 返回前 k 个最近邻
print(u.get_nns_by_item(index, k))

3.4 Annoy的资源管理

Annoy 的设计非常适合资源受限的环境。它的内存使用效率很高，并且支持将索引持久化到磁盘，以减少内存占用。

3.5 Annoy在实际应用中的案例

Spotify 使用 Annoy 实现音乐推荐系统，通过用户听歌记录和音乐特征向量进行相似性搜索，提供个性化推荐。此外，Annoy 还广泛应用于图像搜索、文本相似性检测等领域，具有广泛的实用性。

前言

引言