当前位置：首页 > article >正文

从零开始搭建向量数据库：基于 Xinference 和 Milvus 的文本搜索实践

article 2026/3/1 13:54:44

引言

在 AI 和大数据时代，向量数据库正成为处理非结构化数据（如文本、图像）的利器。最近，我尝试用 Xinference 和 Milvus 搭建一个简单的文本搜索系统，从读取本地文本文件到实现交互式查询和高亮显示匹配结果，整个过程充满了挑战和乐趣。这篇文章将分享我的实践步骤、技术难点及解决方案，希望能帮助有同样兴趣的朋友少走弯路。

项目目标

我的目标是：

从本地 document.txt 文件读取多条文本数据（例如 name:liubao,age:32）。
使用 Xinference生成文本的嵌入向量。
将向量存储到 Milvus中，构建向量数据库。
实现交互式查询功能，返回相似文本并高亮匹配部分。

硬件环境：一台普通的 Windows 电脑（16GB 内存，无 GPU），纯 CPU 运行。16G很勉强，idea直接就干你一半内存，你气不气

技术选型

Xinference：一个轻量级推理框架，支持多种嵌入模型，我选择了 bge-small-en-v1.5，适合 CPU 环境。
Milvus：开源向量数据库，用于存储和搜索嵌入向量。
Python：核心编程语言，搭配 requests、pymilvus 和 colorama 等库。
Docker：运行 Milvus 服务。

实现步骤

1. 环境搭建

安装 Conda 和 Python：我创建了一个名为 xiangliang 的 Conda 环境，使用 Python 3.10。
```
conda create -n xiangliang python=3.10
conda activate xiangliang
```
安装 Xinference：
```
pip install xinference
```
注意：我原本也尝试用 Docker 运行 Xinference 时遇到启动问题，最终切换到本地 Conda 部署。
安装 Milvus：使用 Docker 部署 standalone 版本：
去下载docker-compose.yml，注意重命名改成docker-compose.yml，然后运行
```
docker compose up -d
#如果你是老版本的用docker-compose up -d
```
下载attu可视化向量数据库管理工具:Releases · zilliztech/attu · GitHub
默认直接登录就行

安装依赖：

pip install pymilvus requests torch --index-url https://download.pytorch.org/whl/cpu
pip install transformers colorama

2. 数据准备

我创建了一个 document.txt 文件，包含 10 条测试数据，例如：

name:liubao,age:32
name:zhangwei,age:25
name:lihua,age:40
name:wangming,age:28
name:chenxi,age:35
name:yangyang,age:22
name:zhaojie,age:45
name:liuyi,age:30
name:sunhao,age:27
name:zhouqi,age:33

这些数据模拟了简单的个人信息，用于测试搜索效果。

3. 初始化向量数据库

脚本 test.py 负责读取文件、生成向量并存储到 Milvus：

import requests
from pymilvus import connections, Collection, FieldSchema, CollectionSchema, DataType
import re# 读取文件
with open("document.txt", "r", encoding="utf-8") as file:lines = file.readlines()
texts = [re.sub(r'\s+', ' ', line).strip() for line in lines if line.strip()]# Xinference 生成向量
model_url = "http://localhost:9997/v1/models"
payload = {"model_name": "bge-small-en-v1.5", "model_type": "embedding"}
response = requests.post(model_url, json=payload)
model_uid = response.json()["model_uid"]
embed_url = "http://localhost:9997/v1/embeddings"
embeddings = [requests.post(embed_url, json={"model": model_uid, "input": text}).json()["data"][0]["embedding"] for text in texts]# 存储到 Milvus
connections.connect(host='localhost', port='19530')
fields = [FieldSchema(name="id", dtype=DataType.INT64, is_primary=True),FieldSchema(name="embedding", dtype=DataType.FLOAT_VECTOR, dim=384),FieldSchema(name="text", dtype=DataType.VARCHAR, max_length=65535)
]
collection = Collection(name="text_collection", schema=CollectionSchema(fields=fields))
collection.drop()  # 清理旧数据
collection = Collection(name="text_collection", schema=CollectionSchema(fields=fields))
ids = list(range(1, len(texts) + 1))
collection.insert([ids, embeddings, texts])
collection.create_index("embedding", {"metric_type": "COSINE", "index_type": "IVF_FLAT", "params": {"nlist": 1024}})
collection.load()print("Inserted", collection.num_entities, "entities")

运行前启动 Xinference：

xinference-local

在xiangliang的虚拟环境中运行python test.py正常情况下会生成数据到向量数据库中

4. 实现交互式查询和高亮

脚本 query.py 提供交互式搜索功能，并高亮匹配结果：

import requests
from pymilvus import connections, Collection
import re
from colorama import init, Fore, Styleinit()  # 初始化 coloramaconnections.connect(host='localhost', port='19530')
collection = Collection(name="text_collection")
collection.load()model_uid = "bge-small-en-v1.5-a5JDNlUy"
embed_url = "http://localhost:9997/v1/embeddings"def highlight_match(text, query):pattern = re.compile(re.escape(query), re.IGNORECASE)return pattern.sub(f"{Fore.RED}{Style.BRIGHT}\\g<0>{Style.RESET_ALL}", text)def search_query(query_text):payload = {"model": model_uid, "input": query_text}query_embedding = requests.post(embed_url, json=payload).json()["data"][0]["embedding"]results = collection.search(data=[query_embedding],anns_field="embedding",param={"metric_type": "COSINE", "params": {"nprobe": 10}},limit=5,output_fields=["text"])threshold = 0.7found = Falsefor result in results[0]:similarity = result.distanceif similarity >= threshold:text = result.entity.get("text")highlighted_text = highlight_match(text, query_text)print(f"Similarity: {similarity:.4f}, Text: {highlighted_text}...")found = Trueif not found:print(f"没有找到相似度高于 {threshold} 的结果")while True:query = input("请输入查询词（输入 'exit' 退出）：")if query.lower() == "exit":breaksearch_query(query)

可以看到根据搜索词，分值高的在前，匹配上的高亮了

5. 技术难点与解决方案

Xinference 模型选择：最初尝试用 all-MiniLM-L6-v2，但 Xinference 不支持，最终改为内置的 bge-small-en-v1.5。
连接问题：多次遇到 ConnectionRefusedError，通过确保 xinference-local 运行并检查端口解决。
高亮显示：Windows CMD 不支持 ANSI 码，引入 colorama 实现跨平台兼容。
单一结果问题：初始数据只有一条，查询总是返回它，后来增加了多条数据并设置相似度阈值。

成果展示

输入 liubao：返回高亮的 name:liubao,age:32，相似度约 0.85。
输入 25：返回 name:zhangwei,age:25，相似度约 0.82。
输入无关词 xyz：显示“没有找到相似度高于 0.7 的结果”。

总结与反思

这个项目让我深入理解了向量数据库的工作原理，从文本嵌入到相似性搜索的全流程。虽然只用了 CPU，但性能完全满足小型应用需求。未来可以尝试：

扩展数据规模，测试更大集合的性能。
优化查询速度，例如调整 Milvus 的索引参数。
将结果输出到 Web 界面，增强用户体验。

最后：简单的整体过程

从零开始搭建向量数据库：基于 Xinference 和 Milvus 的文本搜索实践

引言在 AI 和大数据时代，向量数据库正成为处理非结构化数据（如文本、图像）的利器。最近，我尝试用 Xinference 和 Milvus 搭建一个简单的文本搜索系统，从读取本地文本文件到实现交互式查询和高亮显示匹配结果&#xf…...

编程日记 2026/2/27 13:23:46

音视频系列——Websockets接口封装为Http接口

模型服务示例：实时语音转文本服务本示例展示一个支持双协议（WebSocket流式接口HTTP同步接口）的语音转文本模型服务，并提供将WebSocket接口封装为HTTP接口的代码实现。一、服务架构设计 #mermaid-svg-nw0dMZ4uKfS4vGZR {font-fa…...

编程日记 2025/6/23 11:42:31

scrapy入门（深入）

Scrapy框架简介 Scrapy是:由Python语言开发的一个快速、高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据，只需要实现少量的代码，就能够快速的抓取。新建项目 (scrapy startproject xxx)：新建一个新的…...

编程日记 2026/2/24 22:08:41

docker模拟Dos_SYN Flood拒绝服务攻击（Ubuntu20.04）

目录 ✅ 一、实验环境准备（3 个终端） 👉 所以最终推荐做法： 2️⃣ 配置 seed-attacker 为攻击者，开启 telnet 服务： 3️⃣ 配置 victim-10.9.0.5 为受害者服务器，开启 telnet 客户端并监听&…...

编程日记 2026/2/25 22:17:59

使用 Ansys Fluent 评估金属管道腐蚀

金属管道的维护和完整性在石油和天然气、石化和供水等各个行业中都至关重要。腐蚀对这些管道构成了重大威胁，可能导致泄漏、结构故障和环境危害。Ansys Fluent 提供了一个强大的平台来建模和分析金属管道腐蚀。腐蚀是一种自然过程，金属材料会因与环境发…...

编程日记 2026/2/18 5:45:52

firefly经典蓝牙和QProcess、QFileSystemWatcher记录

QProcess 默认不会启动一个 shell 来解析命令，而是直接调用操作系统的系统调用来启动外部程序。也就是通过fork一个子线程或者exec一个子进程来执行命令。 QProcess的参数模式 QProcess 需要明确指定命令的可执行文件路径或参数列表。如果命令是一个可执行文件的路径…...

编程日记 2026/2/14 0:57:01

基于PySide6的CATIA自动化工具开发实战——空几何体批量清理系统

一、功能概述本工具通过PySide6构建用户界面，结合PyCATIA库实现CATIA V5的自动化操作，提供两大核心功能： 空几何体清理：智能识别并删除零件文档中的无内容几何体（Bodies）空几何图形集清理&#xff1…...

编程日记 2026/2/27 3:28:12

Blender配置渲染设置并输出动画

在Blender中，渲染设置和渲染动画的选项位于不同的面板中。以下是具体步骤： 渲染设置渲染设置用于配置输出格式、分辨率、帧率等参数。打开右侧的属性面板（按 N 键可切换显示）。点击 “输出属性” 选项卡（图标是…...

编程日记 2025/12/18 4:09:22

Spring 声明式事务应该怎么学？

1、引言 Spring 的声明式事务极大地方便了日常的事务相关代码编写，它的设计如此巧妙，以至于在使用中几乎感觉不到它的存在，只需要优雅地加一个 Transactional 注解，一切就都顺理成章地完成了！ 毫不夸张地讲&#xff…...

编程日记 2026/2/21 6:56:43

C++11 引入了的新特性与实例说明

C11 引入了许多重要的新特性，以下是一些关键特性及其对应的示例代码，用于体现这些特性的用法和优势。 1. 自动类型推导 (auto) auto 关键字允许编译器自动推导变量的类型，简化代码书写。 #include <iostream> #include <vector>…...

编程日记 2025/12/16 0:41:45

二手Mac验机过程

1.1 外观检查螺丝是否拧过螺丝 1.2 关于本机中序列号，盒子序列号，机器背部核对参数 https://checkcoverage.apple.com/coverage 1.3 检查apple ID与查找 1 登出 iCloud、iTunes、FaceTime、iMessage 在 Mac 上打開「訊息」應用程式，從上方…...

编程日记 2026/2/18 13:32:39

从 0 到 1 掌握鸿蒙 AudioRenderer 音频渲染：我的自学笔记与踩坑实录（API 14）

最近我在研究 HarmonyOS 音频开发。在音视频领域，鸿蒙的 AudioKit 框架提供了 AVPlayer 和 AudioRenderer 两种方案。AVPlayer 适合快速实现播放功能，而 AudioRenderer 允许更底层的音频处理，适合定制化需求。本文将以一个开发者的自学视角&a…...

编程日记 2026/2/18 17:20:11

Android 13深度定制：SystemUI状态栏时间居中显示终极实战指南

一、架构设计与技术解析 1. SystemUI状态栏核心布局机制层级结构 mermaid 复制 graph TDPhoneStatusBarView --> StatusBarContents[status_bar_contents]StatusBarContents --> LeftLayout[status_bar_left_side]StatusBarContents --> ClockLayout[Clock控件]Left…...

编程日记 2026/2/24 23:20:33

支持多系统多协议且可提速的下载工具

在网络下载需求日益多样的当下，一款好用的下载器能极大提升效率。今天就给大家介绍 AB Download Manager，它免费又开源，能适配 Windows 和 Linux 系统，带来超便捷的下载体验。 AB Download Manager 采用先进的多线程技术&#xf…...

编程日记 2026/2/13 17:05:05

【leetcode hot 100 22】括号生成

解法一：（回溯法）用两个整数记录左右括号数，以在回溯过程中保证先生成左括号，且左右括号数不能大于n。 class Solution {public List<String> generateParenthesis(int n) {List<String> result new Arra…...

编程日记 2026/2/15 8:24:11

如何在 HTML 中创建一个有序列表和无序列表，它们的语义有何不同？

大白话如何在 HTML 中创建一个有序列表和无序列表，它们的语义有何不同？ 1. HTML 中有序列表和无序列表的基本概念在 HTML 里，列表是一种用来组织信息的方式。有序列表就是带有编号的列表，它可以让内容按照一定的顺序呈现&#…...

编程日记 2026/2/25 21:32:01

【武汉·4月11日】Parasoft联合光庭信息研讨会|邀您共探AI赋能新机遇

Parasoft联合光庭信息Workshop邀您共探AI赋能新机遇 AI浪潮已至，你准备好了吗？ 在智能网联汽车飞速发展的今天，AI技术正以前所未有的速度重塑行业生态。如何把握AI机遇，赋能企业创新？ 4月11日，自动化软件…...

编程日记 2026/2/20 1:28:28

PHP PSR（PHP Standards Recommendations）介绍

PHP PSR（PHP Standards Recommendations）是 PHP 社区制定的一系列标准化规范，旨在统一 PHP 代码的编写方式、接口设计和开发实践，以提高代码的可读性、可维护性和互操作性。以下是核心 PSR 标准的解读和具体使用方法： …...

编程日记 2026/2/18 12:14:50

闻所闻尽：穿透声音的寂静，照见生命的本真

在《楞严经》的梵音缭绕中，"闻所闻尽"四个字如晨钟暮鼓，叩击着每个修行者的心门。这个源自观世音菩萨耳根圆通法门的核心概念，既是佛门修行的次第指引，更蕴含着东方哲学对生命本质的终极叩问。当我们穿越时空的帷幕&…...

编程日记 2026/2/22 7:42:38

F28335进入非法中断ILLEGAL_ISR定位

在非法中断函数中，再调用一个函数接口，比如save_illegal_error()，然后在save_illegal_error中实现如下代码： g_illegal_isr_sp 0;(这个是全局变量，需要先定义 ） asm( “ MOVW ACC, SP\n” " MOVL …...

编程日记 2026/2/18 0:00:59

PreparedStatement 和 Statement 从功能、性能、安全性、适用场景等维度详细对比分析

以下是 PreparedStatement 和 Statement 的对比分析，从功能、性能、安全性、适用场景等维度详细说明： 1. 核心区别特性PreparedStatementStatement定义预编译的 SQL 语句，支持参数化查询执行静态 SQL 语句，不支持参数占位符安…...

编程日记 2026/2/15 0:32:01

VLAN综合实验报告

一、实验拓扑网络拓扑结构包括三台交换机（LSW1、LSW2、LSW3）、一台路由器（AR1）以及六台PC（PC1-PC6）。交换机之间通过Trunk链路相连，交换机与PC、路由器通过Access或Hybrid链路连接。二、实验…...

编程日记 2026/2/16 12:25:37

使用 Docker 部署 mysql 应用

使用 Docker 部署环境搭建 Docker 安装文档创建容器在系统任意位置创建一个文件夹（可选） mkdir -p /opt/docker/mysql && cd /opt/docker/mysqlmkdir ./{conf,data,logs}搜索 & 拉取镜像 docker search mysql docker pull mysql:5.6启…...

编程日记 2025/12/25 2:11:22

美团Leaf分布式ID实战：深入解析雪花算法原理与应用

📖 前言在分布式系统中，全局唯一ID生成是保证数据一致性的核心技术之一。传统方案（如数据库自增ID、UUID）存在性能瓶颈或无序性问题，而美团开源的Leaf框架提供了高可用、高性能的分布式ID解决方案。本文重点解析Leaf…...

编程日记 2025/12/21 7:16:03

Midjourney使用教程—2.作品修改

当您已生成第一张Midjourney图像的时候，接下来该做什么？了解我们用于修改图像的工具！使用 Midjourney 制作图像后，您的创意之旅就不会止步于此。您可以使用各种工具来修改和增强图像。一、放大操作 Midjourney每次会根据提示词…...

编程日记 2026/3/1 0:58:07

【人工智能】LM Studio 的 GPU 加速：释放大模型推理潜能的极致优化

《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界随着大语言模型（LLM）的广泛应用，其推理效率成为限制性能的关键瓶颈。LM Studio 作为一个轻量级机器学习框架，通过 GPU 加速显著提升了大…...

编程日记 2025/9/5 11:36:59

S32K144入门笔记（十七）：PDB的API函数解读

文章目录 1. SDK中的函数2. API函数的释义 1. SDK中的函数在SDK中并没有转为PDB设置专门的PAL驱动，在基本的DRIVER库中一共有21个API函数，本文将解读这些函数的功能。 2. API函数的释义 void PDB_DRV_Init(const uint32_t instance,const pdb_timer_…...

编程日记 2026/2/17 9:14:13