当前位置：首页 > news >正文

文献分享集：跨模态的最邻近查询RoarGraph

news 2026/2/8 20:11:46

文章目录

$\textbf{1. }$ 导论
$\textbf{2. }$ 对 $\textbf{OOD}$ 负载的分析与验证
$\textbf{3. RoarGraph}$

原文章: $\text{RoarGraph: A Projected Bipartite Graph for Efficient Cross-Modal Approximate Nearest Neighbor Search}$

$\textbf{1. }$ 导论

$\textbf{1.1. }$ 研究背景

1️⃣跨模态检索：

含义：使用某个模态的数据作为 $\text{query}$ ，返回另一个模态中语义相似的内容
示例：输入"Apple"后，返回苹果的照片

2️⃣模态差距 $\text{(gap)}$ ：不同模态数据即使映射到同一语义空间(比如用 $\text{CLIP}$ )，其分布特征仍差距显著

$\quad$

3️⃣两种 $\text{ANN}$

单模态 $\text{ANN}$ ：查询向量分布 $\xleftrightarrow{\text{ID}}$ 基础数据分布，即查询来源于与数据库数据相同的分布
跨模态 $\text{ANN}$ ：查询向量分布 $\xleftrightarrow{\text{OOD}}$ 基础数据分布，即查询来源于与数据库数据不同的分布

$\textbf{1.2. }$ 本文的研究

1️⃣研究动机：当前 $\text{SOTA}$ 的 $\text{ANN}$ 都是单模态的，在 $\text{OOD}$ 负载上表现差

2️⃣研究内容

$\text{OOD}$ 工作负载分析：跨模态后性能下降，源于查询过远 $+$ 标签分散 $\text{→}$ 收敛变慢 $/$ 跳数增加
类型查询 $\boldsymbol{\xleftrightarrow{距离}}$ 基础数据查询最邻近 $\boldsymbol{i\xleftrightarrow{距离}}$ 查询最邻近查询 $\boldsymbol{\xleftrightarrow{分布}}$ 基础数据
单模态 $\text{ANN}$ 近(基本假设) 近(基本假设) $\text{ID}$
跨模态 $\text{ANN}$ 远(实验得到) 远(实验得到) $\text{OOD}$

$\text{RoarGraph}$ 的提出：
原理：让查询参与图构建 $\text{→}$ 将[查询点 $\xleftrightarrow{}$ 基础点]邻接关系投影到基础点 $\text{→}$ 形成仅有基础点的图
意义：让空间上很远但是查询上很近的点相连，从而能高效处理 $\text{OOD-ANNS}$

效果：在跨模态数据集上实现了 $\text{QPS}$ 和 $\text{Recall}$ 指标的提升

$\textbf{1.3. }$ 有关工作

方法核心思想优缺点
束搜索终止利用查询训练分类模型判断何时终止搜索提升效率，但训练成本较高
图卷积 $\text{(GCN)}$ 引入 $\text{GCN}$ 学习最优搜索路径路径优化明显，但训练成本较高
$\text{GCN+RL}$ 强化学习与 $\text{GCN}$ 结合引导搜索路由提升效果显著，但训练成本较高
$\text{GraSP}$ 概率模型与子图采样学习边重要性性能优化明显，但索引构建成本高
$\text{ScaNN}$ 结合向量量化和 $\text{PQ}$ 进行分区与压缩压缩与搜索性能高效，但依赖调参

类型	查询 $\boldsymbol{\xleftrightarrow{距离}}$ 基础数据	查询最邻近 $\boldsymbol{i\xleftrightarrow{距离}}$ 查询最邻近	查询 $\boldsymbol{\xleftrightarrow{分布}}$ 基础数据
单模态 $\text{ANN}$	近(基本假设)	近(基本假设)	$\text{ID}$
跨模态 $\text{ANN}$	远(实验得到)	远(实验得到)	$\text{OOD}$

方法	核心思想	优缺点
束搜索终止	利用查询训练分类模型判断何时终止搜索	提升效率，但训练成本较高
图卷积 $\text{(GCN)}$	引入 $\text{GCN}$ 学习最优搜索路径	路径优化明显，但训练成本较高
$\text{GCN+RL}$	强化学习与 $\text{GCN}$ 结合引导搜索路由	提升效果显著，但训练成本较高
$\text{GraSP}$	概率模型与子图采样学习边重要性	性能优化明显，但索引构建成本高
$\text{ScaNN}$	结合向量量化和 $\text{PQ}$ 进行分区与压缩	压缩与搜索性能高效，但依赖调参

$\textbf{2. }$ 对 $\textbf{OOD}$ 负载的分析与验证

$\textbf{2.1. }$ 初步的背景及其验证

$\textbf{2.1.1. }$ 对模态差距的验证

1️⃣ $\text{OOD}$ 的量化

距离类型衡量什么如何理解
$\text{Wasserstein}$ 距离两个分布间的差异把一个分布搬到另一个的最小代价
$\text{Mahalanobis}$ 距离一个向量到一个分布的距离一个点相对于一个分布的异常程度

1️⃣实验 $1$ ：用 $\text{Wasserstein}$ 距离衡量 $\text{OOD}$ 特性

数据集：基础数据集中抽取的无交叉集 $B_1/B_2$ ， $\text{OOD}$ 的查询集 $Q$
结果： $\text{Wasserstein}(B_1,Q)$ 和 $\text{Wasserstein}(B_2,Q)$ ，大致是 $\text{Wasserstein}(B_1,B_2)$ 两倍

2️⃣实验 $2$ ：用 $\text{Mahalanobis}$ 距离衡量 $\text{OOD}$ 特性

数据集：满足分布 $P$ 的基础数据，来自 $\text{ID}$ 查询集的 $q_{id}$ ，来自 $\text{OOD}$ 查询集的 $q_{ood}$
结果： $\text{Mahalanobis}(q_{\text{id}},P)\text{<}\text{Mahalanobis}(q_{\text{ood}},P)$

$\textbf{2.1.2. }\textbf{SOTA-ANN}$ 在 $\textbf{OOD}$ 任务上的表现

1️⃣对传统的 $\text{SOTA-ANN}$

索引方法在 $\textbf{OOD}$ 上的表现(相比在 $\textbf{ID}$ 上)
$\text{HNSW}$ 性能显著下降，在 $\text{BeamSearch}$ 过程显著访问更多的结点(要经历更多跳)
$\text{IVF-PQ}$ 性能显著下降，需要更多的聚类数才能达到相同的 $\text{Recall}$

2️⃣对改进的 $\text{ANN}$ ：针对 $\text{OOD-ANNS}$ 的首个图索引 $\text{RobustVamana(OOD-DiskANN)}$

原理：先用 $\text{Vamana}$ 建图，然后再用 $\text{RobustStitch}$ 根据查询向量，连接新的边
性能：比 $\text{DiskANN}$ 在 $\text{OOD}$ 任务上提升了 $\text{40\%}$ 性能，但是查询速度慢了 ${\text{×}4\text{-10}}$

$\textbf{2.2. }$ 对 $\textbf{OOD}$ 上 $\textbf{ANN}$ 工作负载的分析
$\textbf{2.2.1. OOD-ANNS}$ 和 $\textbf{ID-ANNS}$ 的两个差异

1️⃣两种差异及实验结果

$\text{OOD}$ 查询离其最邻近很远：即 $\delta\left(q_{\text{ood}}, i^{t h} \text{-NN}_{\text{ood}}\right) \text{≫} \delta\left(q_{\text{id}}, i^{t h} \text{-NN}_{\text{id}}\right)$ ，左为 $i\text{=}1$ 时的分布结果
$\text{OOD}$ 查询的最邻近彼此原理： $100^{t h} \text{-NN}$ 互相之间的平均距离，实验结果如右

2️⃣对差异的直观理解

简单(概念)示例：

$\text{ID}$ 查询：查询与其最邻近在球面上，相互靠近
$\text{ODD}$ 查询：查询在球心，其最邻近在球面上(由此距离较远且查询不多 $\text{+}$ 分散分布)

真实示例：真实数据 $\text{PCA}$ 降到二维的视图， $\text{ID}$ 查询更为集中

$\textbf{2.2.2. }$ 为何传统 $\textbf{SOTA-ANN}$ 在 $\textbf{ODD}$ 表现不佳
0️⃣传统 $\text{ANN}$ 的设计

基于两假设：查询 $/$ 数据同分布 $+ k$ 个最近邻彼此相互靠近(邻居的邻居是邻居)，刚好全反的
设计的思路：
建图：用 $\text{BeamSearch}$ 来构建 $\text{KNN}$ 图 $\text{→}$ 空间中相近的点转化为图中紧密连接的结点
搜索：从中心点开始 $\text{GreedySearch}$

1️⃣在基于图 $\text{ANN}$ 上： $\text{OOD}$ 会使得搜索空间增大
可识别搜索空间：包围当前访问结点 $x$ 的 $B^{s}(x)\text{+}B^{k}\left(1^{\text{st}}\text{-NN}, R\right)$
球 $B^{k}\left(1^{\text{st}}\text{-NN}, R\right)$ ：以 $1^{\text{st}}\text{-NN}$ 为球心， $k$ 邻近间互相距离 $\delta\left(i^{\text{th}}\text{-NN}, j^{\text{th}}\text{-NN}\right)$ 最大值为半径
球 $B^{s}(x)$ ：以当前结点 $x$ 为圆心，以 $\delta\left(x, i^{\text{th}}\text{-NN}\right)$ 的最大值(到最远最邻近的距离)为半径

$\text{OOD}$ 的影响：搜索空间大幅增大
对 $B^{k}$ ：由于 $\text{OOD}$ 的性质 $R_{\text {ood }}\text{≫}R_{\text{id}}$ ，这一差异在体积层面放大到 $\left(\cfrac{R_{\text {ood }}}{R_{\text{id}}}\right)^D$ 级别
对 $B^{s}$ ：由于 $\text{OOD}$ 的性质 $\delta\left(x, i^{\text{th}}\text{-NN}_{\text{ood}}\right)\text{≫}\delta\left(x, i^{\text{th}}\text{-NN}_{\text{id}}\right)$ ，使得体积也大幅膨胀
对搜索过程的影响：
对于 $\text{ID}$ 查询：由于最近邻彼此靠近， $\text{GreedySearch}$ 可以使 $B^{s}(x)$ 轻松收敛
起点 -> 近邻1 -> 近邻2 -> 近邻3 (一个小范围内)
对于 $\text{OOD}$ 查询：最近邻方向分散难以收敛，需要更大的 $\text{Beam}$ 宽度 $/$ 搜索路径等
       近邻2↗️     
起点 -> 近邻1 -> 近邻3 (分散在大范围内)↘️     近邻4
2️⃣在基于划分 $\text{IVF}$ 上

原理上： $\text{IVF}$ 先将原数据分簇
$\text{ID}$ 查询：最邻近集中在少数几个相邻簇中
$\text{OOD}$ 查询：最邻近分散在多个不相邻簇中

实验上： $\text{OOD}$ 查询需要扫描更多的簇，性能下降 $2.5$ 倍

距离类型	衡量什么	如何理解
$\text{Wasserstein}$ 距离	两个分布间的差异	把一个分布搬到另一个的最小代价
$\text{Mahalanobis}$ 距离	一个向量到一个分布的距离	一个点相对于一个分布的异常程度

索引方法	在 $\textbf{OOD}$ 上的表现(相比在 $\textbf{ID}$ 上)
$\text{HNSW}$	性能显著下降，在 $\text{BeamSearch}$ 过程显著访问更多的结点(要经历更多跳)
$\text{IVF-PQ}$	性能显著下降，需要更多的聚类数才能达到相同的 $\text{Recall}$

$\textbf{3. RoarGraph}$

$\textbf{3.1. RoarGraph}$ 的设计思路

1️⃣面向解决三种挑战

边的建立：如何连接查询 $/$ 基础两类结点，同时避免基础结点度数太高
搜索效率：查询结点要保持极高出度以覆盖基础节点，但同时也会大幅增加跳数 $/$ 内存开销
连通性：避免出现孤立结点，独立子图

1️⃣大致的设计流程

构建：建立查询 $\boldsymbol{\xleftrightarrow{}}$ 基础二分图 $\text{→}$ 将邻接信息投影到基础点中 $\text{→}$ 增强连接
查询：同样是用 $\text{BeamSearch}$

$\textbf{3.2. RoarGraph}$ 的构建: 三个阶段
$\textbf{3.2.1. }$ 阶段 $\textbf{1}$ : 查询 $\boldsymbol{\xleftrightarrow{}}$ 基础二分图构建
1️⃣二分图概述：

基本概念：将所有的点分为两个集合，所有边必须连接不同子集的点，不能内部连接

在此处：两子集查询结点 $+$ 基础节点，两种边[查询结点 $\text{→}$ 基础结点] $\text{+}$ [查询结点 $\text{←}$ 基础结点]

2️⃣构建过程概述

$\quad$
预处理：计算每个查询向量的真实 $N_q\text{-NN}$ 标签
边构建：
方向操作
查询点 $\text{→}$ 基础点查询点 $\xrightarrow{连接}$ 查询点的 $N_q\text{-NN}$ 基础点
基础点 $\text{→}$ 查询点查询点 $\xleftarrow{连接}$ 查询点的 $1\text{-NN}$ 基础点，查询点 $\xrightarrow{断连}$ 查询点的 $1\text{-NN}$ 基础点
示例：
预处理: T1 -> X1, X2, X3 (Nq=3)
边构建: T1 -> X2, X3 T1 <- X1 
2️⃣构建过程分析
结点度数的考量：
高查询结点出度：提高 $N_q$ 值，增加[基础点 $\xrightarrow[覆盖性]{重叠性}$ 查询点]，使多基础点可由同一查询点联系
低基础节点出度：为了解决上述挑战 $1$ ，目的在于提高二分图上的搜索效率
边方向的考虑：不进行双向连接，避免二分图搜索时要去检查邻居的邻居( $N_q^2$ )
预处理: T1 -> X1, X2, X3 (Nq=3)
边构建: T1 -> X1, X2, X3 T1 <- X1T1 <- X2T1 <- X3
$\textbf{3.2.2. }$ 阶段 $\textbf{2}$ : 领域感知投影
1️⃣一些分析

优化动机：二分图内存消耗高(额外存储了查询节点)，搜索路径长(需要额外经过查询结点)
关于投影：
目的：移除二分图中的查询结点，并保留从查询分布获得的邻近关系
方式：最简单的可将查询点所连的全部基础点全连接(度数太高)，优化方法如领域感知投影

2️⃣投影过程：
预处理：
遍历查询点：获得与查询点相连的最邻近基础点
查询Q -> {B1, B2, B3, B4, B5}  (Q连接了5个基础节点)
选择中心点：即查询点的 $\text{1-NN}$ 点，作为 $\text{Pivot}$
查询Q -> {B1, B2, B3, B4, B5}  (Q连接了5个基础节点)👆pivot
排序基础结点：将余下 $N_q\text{-NN}$ 点，按与 $\text{Pivot}$ 的距离排序
感知投影：
连接：让中心点与余下点建立连接
B1 -> B2 (最近)
B1 -> B3 (次近)
B1 -> B4 (较远)
B1 -> B5 (最远)
过滤：保证与 $\text{Pivot}$ 连接方向的多样性

条件含义操作
$\text{Dist}(X,Y)\text{<}\text{Dist}(\text{Pivot},Y)$ 该方向已有连接则筛掉 $Y$ (不与 $\text{Pivot}$ 建立连接)
$\text{Dist}(X,Y)\text{>}\text{Dist}(\text{Pivot},Y)$ 代表新的搜索方向则保留 $Y$ (可与 $\text{Pivot}$ 建立连接)

填充：当 $\text{Pivot}$ 的出度小于度数限制，则又重新连接之前过滤掉的结点
$\textbf{3.2.3. }$ 连通性增强

1️⃣为何要增强：仅依赖于二分图的覆盖范围，投影图的连通性还太低，对 $\text{GreedySearch}$ 不友好

2️⃣增强的方法：

检索：从基础集的 $\text{Medoid}$ 开始，对每个基础点执行 $\text{BeamSearch}$ 得到最邻近(作为候选点)
连边：在不超过度数限制的前提下，让该基础点连接一定数量的候选点作
$\textbf{3.3. RoarGraph}$ 性能的验证

$\textbf{3.3.1. }$ 实验设置

1️⃣数据集

数据集描述查询集索引集
$\text{Text-to-Image}$ 流行基准数据集，含图像和文本查询向量官方 $1\text{w}$ 条余下不重叠数据
$\text{LAION}$ 数百万对图像 $-$ 替代文本对采样 $1\text{w}$ 条余下不重叠数据
$\text{WebVid}$ 素材网站获取的字幕和视频对采样 $1\text{w}$ 条余下不重叠数据

2️⃣超参数设置

模型超参数列表
$\text{HNSW}$ $M\text{=}32$ , $\text{efConstruction}\text{=}500$
$\text{NSG}$ $R\text{=}64$ , $C\text{=}L\text{=}500$
$\tau\text{-MNG}$ $R\text{=}64$ , $C\text{=}L\text{=}500$ , $\tau\text{=}0.01$
$\text{RobustVamana}$ $R\text{=}64$ , $L\text{=}500$ , $\alpha\text{=}1.0$
$\text{RoarGraph}$ $N_q\text{=}100$ (最近邻候选数量), $M\text{=}35$ (出度约束), $L\text{=}500$ (候选集大小)

3️⃣性能指标： $\text{Recall@k}$ 和 $\text{QPS}$ (检索速度)

$\textbf{3.3.2. }$ 实验结果

1️⃣ $\text{QPS}$ 与召回： $\text{RoarGraph}$ 最优(超过 $\text{RobustVamana}$ )， $\text{HNSW/NSG}$ 差不多, $\tau\text{-MNG}$ 最差

2️⃣跳数与召回： $\text{RoarGraph}$ 跳数显著减少，且随 $\text{Recall@}$ 的 $k$ 增大，减少趋势下降

3️⃣消融实验：对比了二分图 $/$ 投影图 $/$ 完整图，可见通过邻域感知投影显著提升性能

4️⃣查询集规模：即查询集大小占基础集大小比重对索引性能的影响；可见起始模型对规模并不敏感

5️⃣在 $\text{ID}$ 负载上的性能： $\text{RoarGraph}$ 依旧能打，和 $\text{HNSW}$ 相当

6️⃣索引开销成本：使用 $10\%$ 数据可大幅降低构建成本，同时保持搜索性能

$\quad$

$\textbf{3.4. RoarGraph}$ 的一些讨论

1️⃣运用场景：结合大量历史查询数据，用多模态深度学习模型生成嵌入，部署在大型检索 $/$ 推荐系统

2️⃣更新机制：

初始搜索：
结点查询：将新插入下新基础节点 $v$ 作为查询，在基础数据集中搜索其最邻近
结点筛选：要求最邻近满足，曾在图构建过程中与至少一个查询点连接过的基础点
反向回溯：对该最邻近点，回溯到与其曾建立过连接的距离最近的查询点 $q$

子图构建：
二分子图：将 $q\xleftrightarrow{}N_{\text {out}}\text{∪}v$ 整合为二分子图
邻域投影：将 $v$ 作为 $\text{Pivot}$ 按同样的方式，生成投影图

3️⃣删除操作：采用墓碑标记法 $\text{Tombstones}$ ，即被删结点任参与路由，但排除在搜索结果中

方向	操作
查询点 $\text{→}$ 基础点	查询点 $\xrightarrow{连接}$ 查询点的 $N_q\text{-NN}$ 基础点
基础点 $\text{→}$ 查询点	查询点 $\xleftarrow{连接}$ 查询点的 $1\text{-NN}$ 基础点，查询点 $\xrightarrow{断连}$ 查询点的 $1\text{-NN}$ 基础点

条件	含义	操作
$\text{Dist}(X,Y)\text{<}\text{Dist}(\text{Pivot},Y)$	该方向已有连接	则筛掉 $Y$ (不与 $\text{Pivot}$ 建立连接)
$\text{Dist}(X,Y)\text{>}\text{Dist}(\text{Pivot},Y)$	代表新的搜索方向	则保留 $Y$ (可与 $\text{Pivot}$ 建立连接)

数据集	描述	查询集	索引集
$\text{Text-to-Image}$	流行基准数据集，含图像和文本查询向量	官方 $1\text{w}$ 条	余下不重叠数据
$\text{LAION}$	数百万对图像 $-$ 替代文本对	采样 $1\text{w}$ 条	余下不重叠数据
$\text{WebVid}$	素材网站获取的字幕和视频对	采样 $1\text{w}$ 条	余下不重叠数据

模型	超参数列表
$\text{HNSW}$	$M\text{=}32$ , $\text{efConstruction}\text{=}500$
$\text{NSG}$	$R\text{=}64$ , $C\text{=}L\text{=}500$
$\tau\text{-MNG}$	$R\text{=}64$ , $C\text{=}L\text{=}500$ , $\tau\text{=}0.01$
$\text{RobustVamana}$	$R\text{=}64$ , $L\text{=}500$ , $\alpha\text{=}1.0$
$\text{RoarGraph}$	$N_q\text{=}100$ (最近邻候选数量), $M\text{=}35$ (出度约束), $L\text{=}500$ (候选集大小)

文献分享集：跨模态的最邻近查询RoarGraph

文章目录 1. \textbf{1. } 1. 导论 1.1. \textbf{1.1. } 1.1. 研究背景 1.2. \textbf{1.2. } 1.2. 本文的研究 1.3. \textbf{1.3. } 1.3. 有关工作 2. \textbf{2. } 2. 对 OOD \textbf{OOD} OOD负载的分析与验证 2.1. \textbf{2.1. } 2.1. 初步的背景及其验证 2.1.1. \textbf{2…...

编程日记 2025/1/5 21:18:27

xdoj 判断字符串子串

判断字符串子串问题描述编写程序： 判断一个不大于 20 个字符的字符串是否是另一个不大于 20 个字符的字符串的子串，如果是，则输出子串在父串的起始位置, 如果不是子串，则输出 No!。输入说明输入分 2 行： 第…...

编程日记 2025/1/5 21:14:23

n8n - AI自动化工作流

文章目录一、关于 n8n关键能力n8n 是什么意思二、快速上手一、关于 n8n n8n是一个具有原生AI功能的工作流自动化平台，它为技术团队提供了代码的灵活性和无代码的速度。凭借400多种集成、原生人工智能功能和公平代码许可证，n8n可让您构建强大的自动化…...

编程日记 2025/1/5 21:13:22

asp.net core 属性路由和约定路由

在 ASP.NET Core 中，Web API 中的路由（Route）用于确定客户端请求的 URL 与服务器端处理逻辑之间的映射关系。路由机制在 Web API 的开发中非常重要，它帮助定义和管理不同请求路径如何触发特定的控制器和操作方法。 1. 路由概述 …...

编程日记 2025/1/5 21:12:22

【PS不常见教程】实操篇之通道抠图-抠黑色背景的图片

观前小提示：本文内容为我原创成果，若您需要转载或引用其中图片或文字内容，请记得标注来源是“璞子的家”哦，感谢您的尊重，理解与支持，谢谢啦！ 如果没看过之前的文章，可以先看之前的两…...

编程日记 2025/1/5 21:03:13

电子电气架构 --- 整车整车网络管理浅析

我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：所谓鸡汤，要么蛊惑你认命，要么怂恿你拼命，但都是回避问题的根源，以现象替代逻辑，以情绪代替思考，把消极接受现实的懦弱，伪装成乐观面对不幸的…...

编程日记 2025/1/5 20:57:08

【数据结构05】排序

系列文章目录【数据结构05】排序 . 【算法思想04】二分查找文章目录系列文章目录[toc] 1. 基本思想与实现1.1 插入类排序1.1.1 直接插入排序（*）1.1.2 折半插入排序1.1.3 希尔排序（*） 1.2 交换类排序1.2.1 冒泡排序&#xff08…...

编程日记 2025/1/5 20:56:04

ModuleNotFoundError: No module named XXX

我们在安装了某个包之后，还是提示找不到包方法一： python -m pip install 包名 -i https://pypi.tuna.tsinghua.edu.cn/simple 方法二： conda install 包名如果还是找不到包： 请检查环境：...

编程日记 2025/1/5 20:52:57

JAVA：HashMap在1.8做了哪些优化的详细解析

1、简述 HashMap 是 Java 中最常用的数据结构之一，它以键值对的形式存储数据，允许快速的插入、删除和查找操作。在 JDK 1.8 之前，HashMap 主要是基于数组加链表的结构实现的。然而，在面对大量哈希冲突时（即多个键的哈…...

编程日记 2025/1/5 20:51:56

jest使用mocks设置模拟函数不生效解决方案

模拟文件 // __mocks__/axios.js const axios jest.fn(); axios.get jest.fn(); axios.get.mockResolvedValue({data: {undoList: [get data],}, }); export default axios; 测试文件 jest.mock(axios); import Axios from axios;test(mytest, () > {console.log("…...

编程日记 2025/1/5 20:50:55

javaEE-网络原理-1初识

目录一.网络发展史 1.独立模式 2.网络互联二.局域网LAN 1.基于网线直连： 2.基于集线器组件： 3.基于交换机组件： 4.基于交换机和路由器组件编辑三、广域网WAN 四、网络通信基础 1.ip地址 2.端口号： 3.协议 4.五…...

编程日记 2025/1/5 20:48:53

笔上云世界微服务版

目录一、项目背景二、项目功能一功能介绍三、环境准备 • 需要开发的端口 • Mysql 导入数据库编辑 • Redis 编辑 • RabbitMQ 编辑在创建blog虚拟主机(方法如下) • Nacos • Nginx 四、前端部署五、后端部署六、测试计划操作一功能测试二…...

编程日记 2025/1/5 20:46:49

linux安装redis及Python操作redis

目录一、Redis安装 1、下载安装包 2、解压文件 3、迁移文件夹 4、编译 5、管理redis文件 6、修改配置文件 7、启动Redis 8、将redis服务交给systemd管理二、Redis介绍 1、数据结构 ①字符串String ②列表List ③哈希Hash ④集合Set ⑤有序集合Sorted Set 2、…...

编程日记 2025/1/5 20:43:45

node.js内置模块之---stream 模块

stream 模块的作用在 Node.js 中，stream 模块是一个用于处理流（stream）的核心模块。流是一种处理数据的抽象方式，允许程序处理大量数据时不会一次性将所有数据加载到内存中，从而提高性能和内存效率。通过流&#xff0…...

编程日记 2025/1/5 20:41:36

《learn_the_architecture_-_aarch64_exception_model》学习笔记

1.当发生异常时，异常级别可以增加或保持不变，永远无法通过异常来转移到较低的权限级别。从异常返回时，异常级别可能会降低或保持不变，永远无法通过从异常返回来移动到更高的权限级别。EL0级不进行异常处理，异常必须在比…...

编程日记 2025/1/5 20:40:31

【C++项目实战】贪吃蛇小游戏

一、引言贪吃蛇，这款经典的电子游戏，自1976年诞生以来，一直受到全球玩家的喜爱。它的规则简单，玩法直观，但同时也充满了挑战性。在这篇文章中，我们将一起探索如何开发一个贪吃蛇游戏，无论是作为…...

编程日记 2025/1/5 20:39:25

Python基于matplotlib实现树形图的绘制

在Python中，你可以使用matplotlib库来绘制树形图（Tree Diagram）。虽然matplotlib本身没有专门的树形图绘制函数，但你可以通过组合不同的图形元素（如线条和文本）来实现这一点。以下是一个简单的示例&#…...

编程日记 2025/1/5 20:37:21

【UE5 C++课程系列笔记】21——弱指针的简单使用

目录概念声明和初始化转换为共享指针打破循环引用弱指针使用警告概念在UE C 中，弱指针（TWeakPtr ）也是一种智能指针类型，主要用于解决循环引用问题以及在不需要强引用保证对象始终有效的场景下，提供一种可…...

编程日记 2025/1/5 20:36:16

【游戏设计原理】46 - 魔杖

幻想，人们可以通过多种形式来引发，比如文字，图片，绘画，语言等，但游戏与以上这些形式的区别，正如游戏与其他艺术形式的区别一样，游戏作为一种艺术和娱乐形式，其独特之处在…...

编程日记 2025/1/5 20:33:13

UE5 学习系列（二）用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇，在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下： 【Note】：如果你已经完成安装等操作，可以只执行第一篇博客中 2. 新建一个空白游戏项目章节操作，重…...

编程新知 2026/2/8 4:37:41

基于距离变化能量开销动态调整的WSN低功耗拓扑控制开销算法matlab仿真

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.算法仿真参数 5.算法理论概述 6.参考文献 7.完整程序 1.程序功能描述通过动态调整节点通信的能量开销，平衡网络负载，延长WSN生命周期。具体通过建立基于距离的能量消耗模型&am…...

编程新知 2026/2/6 5:38:46

React Native 开发环境搭建（全平台详解）

React Native 开发环境搭建（全平台详解） 在开始使用 React Native 开发移动应用之前，正确设置开发环境是至关重要的一步。本文将为你提供一份全面的指南，涵盖 macOS 和 Windows 平台的配置步骤，如何在 Android 和 iOS…...

编程新知 2025/10/7 2:47:54

MySQL 隔离级别：脏读、幻读及不可重复读的原理与示例

一、MySQL 隔离级别 MySQL 提供了四种隔离级别，用于控制事务之间的并发访问以及数据的可见性，不同隔离级别对脏读、幻读、不可重复读这几种并发数据问题有着不同的处理方式，具体如下：隔离级别脏读不可重复读幻读性能特点及锁机制读未提交（READ UNCOMMITTED）允许出现允许…...

编程新知 2025/9/16 21:01:58

基于ASP.NET+ SQL Server实现（Web）医院信息管理系统

医院信息管理系统 1. 课程设计内容在 visual studio 2017 平台上，开发一个“医院信息管理系统”Web 程序。 2. 课程设计目的综合运用 c#.net 知识，在 vs 2017 平台上，进行 ASP.NET 应用程序和简易网站的开发；初步熟悉开发一…...

编程新知 2026/1/23 12:16:56

mongodb源码分析session执行handleRequest命令find过程

mongo/transport/service_state_machine.cpp已经分析startSession创建ASIOSession过程，并且验证connection是否超过限制ASIOSession和connection是循环接受客户端命令，把数据流转换成Message，状态转变流程是：State::Created 》 St…...

编程新知 2026/1/15 4:39:38

centos 7 部署awstats 网站访问检测

一、基础环境准备（两种安装方式都要做） bash # 安装必要依赖 yum install -y httpd perl mod_perl perl-Time-HiRes perl-DateTime systemctl enable httpd # 设置 Apache 开机自启 systemctl start httpd # 启动 Apache二、安装 AWStats&#xff0…...

编程新知 2026/1/23 8:33:56

【项目实战】通过多模态+LangGraph实现PPT生成助手

PPT自动生成系统基于LangGraph的PPT自动生成系统，可以将Markdown文档自动转换为PPT演示文稿。功能特点 Markdown解析：自动解析Markdown文档结构PPT模板分析：分析PPT模板的布局和风格智能布局决策：匹配内容与合适的PPT布局自动…...

编程新知 2026/2/3 22:50:07

ip子接口配置及删除

配置永久生效的子接口，2个IP 都可以登录你这一台服务器。重启不失效。永久的 [应用] vi /etc/sysconfig/network-scripts/ifcfg-eth0修改文件内内容 TYPE"Ethernet" BOOTPROTO"none" NAME"eth0" DEVICE"eth0" ONBOOT&q…...

编程新知 2025/10/26 5:04:25

Xen Server服务器释放磁盘空间

disk.sh #!/bin/bashcd /run/sr-mount/e54f0646-ae11-0457-b64f-eba4673b824c # 全部虚拟机物理磁盘文件存储 a$(ls -l | awk {print $NF} | cut -d. -f1) # 使用中的虚拟机物理磁盘文件 b$(xe vm-disk-list --multiple | grep uuid | awk {print $NF})printf "%s\n"…...

编程新知 2025/11/19 6:04:18

文章目录

1. \textbf{1. } 1. 导论

1.1. \textbf{1.1. } 1.1. 研究背景

1.2. \textbf{1.2. } 1.2. 本文的研究

1.3. \textbf{1.3. } 1.3. 有关工作

2. \textbf{2. } 2. 对 OOD \textbf{OOD} OOD负载的分析与验证

2.1. \textbf{2.1. } 2.1. 初步的背景及其验证

2.1.1. \textbf{2.1.1. } 2.1.1. 对模态差距的验证

2.1.2. SOTA-ANN \textbf{2.1.2. }\textbf{SOTA-ANN} 2.1.2. SOTA-ANN在 OOD \textbf{OOD} OOD任务上的表现

2.2. \textbf{2.2. } 2.2. 对 OOD \textbf{OOD} OOD上 ANN \textbf{ANN} ANN工作负载的分析

2.2.1. OOD-ANNS \textbf{2.2.1. OOD-ANNS} 2.2.1. OOD-ANNS和 ID-ANNS \textbf{ID-ANNS} ID-ANNS的两个差异

2.2.2. \textbf{2.2.2. } 2.2.2. 为何传统 SOTA-ANN \textbf{SOTA-ANN} SOTA-ANN在 ODD \textbf{ODD} ODD表现不佳

3. RoarGraph \textbf{3. RoarGraph} 3. RoarGraph

3.1. RoarGraph \textbf{3.1. RoarGraph} 3.1. RoarGraph的设计思路

3.2. RoarGraph \textbf{3.2. RoarGraph} 3.2. RoarGraph的构建: 三个阶段

3.2.1. \textbf{3.2.1. } 3.2.1. 阶段 1 \textbf{1} 1: 查询 ↔ \boldsymbol{\xleftrightarrow{}} ​基础二分图构建

3.2.2. \textbf{3.2.2. } 3.2.2. 阶段 2 \textbf{2} 2: 领域感知投影

3.2.3. \textbf{3.2.3. } 3.2.3. 连通性增强

3.3. RoarGraph \textbf{3.3. RoarGraph} 3.3. RoarGraph性能的验证

3.3.1. \textbf{3.3.1. } 3.3.1. 实验设置

3.3.2. \textbf{3.3.2. } 3.3.2. 实验结果

3.4. RoarGraph \textbf{3.4. RoarGraph} 3.4. RoarGraph的一些讨论

相关文章：

$\textbf{1. }$ 导论

$\textbf{1.1. }$ 研究背景

$\textbf{1.2. }$ 本文的研究

$\textbf{1.3. }$ 有关工作

$\textbf{2. }$ 对 $\textbf{OOD}$ 负载的分析与验证

$\textbf{2.1. }$ 初步的背景及其验证

$\textbf{2.1.1. }$ 对模态差距的验证

$\textbf{2.1.2. }\textbf{SOTA-ANN}$ 在 $\textbf{OOD}$ 任务上的表现

$\textbf{2.2. }$ 对 $\textbf{OOD}$ 上 $\textbf{ANN}$ 工作负载的分析

$\textbf{2.2.1. OOD-ANNS}$ 和 $\textbf{ID-ANNS}$ 的两个差异

$\textbf{2.2.2. }$ 为何传统 $\textbf{SOTA-ANN}$ 在 $\textbf{ODD}$ 表现不佳

$\textbf{3. RoarGraph}$

$\textbf{3.1. RoarGraph}$ 的设计思路

$\textbf{3.2. RoarGraph}$ 的构建: 三个阶段

$\textbf{3.2.1. }$ 阶段 $\textbf{1}$ : 查询 $\boldsymbol{\xleftrightarrow{}}$ 基础二分图构建

$\textbf{3.2.2. }$ 阶段 $\textbf{2}$ : 领域感知投影

$\textbf{3.2.3. }$ 连通性增强

$\textbf{3.3. RoarGraph}$ 性能的验证

$\textbf{3.3.1. }$ 实验设置

$\textbf{3.3.2. }$ 实验结果

$\textbf{3.4. RoarGraph}$ 的一些讨论