当前位置：首页 > news >正文

文献分享：RoarGraph——跨模态的最邻近查询

news 2026/2/10 17:28:41

文章目录

$\textbf{1. }$ 导论
$\textbf{2. }$ 对 $\textbf{OOD}$ 负载的分析与验证
$\textbf{3. RoarGraph}$

原文章: $\text{RoarGraph: A Projected Bipartite Graph for Efficient Cross-Modal Approximate Nearest Neighbor Search}$

$\textbf{1. }$ 导论

$\textbf{1.1. }$ 研究背景

1️⃣跨模态检索：

含义：使用某个模态的数据作为 $\text{query}$ ，返回另一个模态中语义相似的内容
示例：输入"Apple"后，返回苹果的照片

2️⃣模态差距 $\text{(gap)}$ ：不同模态数据即使映射到同一语义空间(比如用 $\text{CLIP}$ )，其分布特征仍差距显著

$\quad$

3️⃣两种 $\text{ANN}$

单模态 $\text{ANN}$ ：查询向量分布 $\xleftrightarrow{\text{ID}}$ 基础数据分布，即查询来源于与数据库数据相同的分布
跨模态 $\text{ANN}$ ：查询向量分布 $\xleftrightarrow{\text{OOD}}$ 基础数据分布，即查询来源于与数据库数据不同的分布

$\textbf{1.2. }$ 本文的研究

1️⃣研究动机：当前 $\text{SOTA}$ 的 $\text{ANN}$ 都是单模态的，在 $\text{OOD}$ 负载上表现差

2️⃣研究内容

$\text{OOD}$ 工作负载分析：跨模态后性能下降，源于查询过远 $+$ 标签分散 $\text{→}$ 收敛变慢 $/$ 跳数增加
类型查询 $\boldsymbol{\xleftrightarrow{距离}}$ 基础数据查询最邻近 $\boldsymbol{i\xleftrightarrow{距离}}$ 查询最邻近查询 $\boldsymbol{\xleftrightarrow{分布}}$ 基础数据
单模态 $\text{ANN}$ 近(基本假设) 近(基本假设) $\text{ID}$
跨模态 $\text{ANN}$ 远(实验得到) 远(实验得到) $\text{OOD}$

$\text{RoarGraph}$ 的提出：
原理：让查询参与图构建 $\text{→}$ 将[查询点 $\xleftrightarrow{}$ 基础点]邻接关系投影到基础点 $\text{→}$ 形成仅有基础点的图
意义：让空间上很远但是查询上很近的点相连，从而能高效处理 $\text{OOD-ANNS}$

效果：在跨模态数据集上实现了 $\text{QPS}$ 和 $\text{Recall}$ 指标的提升

$\textbf{1.3. }$ 有关工作

方法核心思想优缺点
束搜索终止利用查询训练分类模型判断何时终止搜索提升效率，但训练成本较高
图卷积 $\text{(GCN)}$ 引入 $\text{GCN}$ 学习最优搜索路径路径优化明显，但训练成本较高
$\text{GCN+RL}$ 强化学习与 $\text{GCN}$ 结合引导搜索路由提升效果显著，但训练成本较高
$\text{GraSP}$ 概率模型与子图采样学习边重要性性能优化明显，但索引构建成本高
$\text{ScaNN}$ 结合向量量化和 $\text{PQ}$ 进行分区与压缩压缩与搜索性能高效，但依赖调参

类型	查询 $\boldsymbol{\xleftrightarrow{距离}}$ 基础数据	查询最邻近 $\boldsymbol{i\xleftrightarrow{距离}}$ 查询最邻近	查询 $\boldsymbol{\xleftrightarrow{分布}}$ 基础数据
单模态 $\text{ANN}$	近(基本假设)	近(基本假设)	$\text{ID}$
跨模态 $\text{ANN}$	远(实验得到)	远(实验得到)	$\text{OOD}$

方法	核心思想	优缺点
束搜索终止	利用查询训练分类模型判断何时终止搜索	提升效率，但训练成本较高
图卷积 $\text{(GCN)}$	引入 $\text{GCN}$ 学习最优搜索路径	路径优化明显，但训练成本较高
$\text{GCN+RL}$	强化学习与 $\text{GCN}$ 结合引导搜索路由	提升效果显著，但训练成本较高
$\text{GraSP}$	概率模型与子图采样学习边重要性	性能优化明显，但索引构建成本高
$\text{ScaNN}$	结合向量量化和 $\text{PQ}$ 进行分区与压缩	压缩与搜索性能高效，但依赖调参

$\textbf{2. }$ 对 $\textbf{OOD}$ 负载的分析与验证

$\textbf{2.1. }$ 初步的背景及其验证

$\textbf{2.1.1. }$ 对模态差距的验证

1️⃣ $\text{OOD}$ 的量化

距离类型衡量什么如何理解
$\text{Wasserstein}$ 距离两个分布间的差异把一个分布搬到另一个的最小代价
$\text{Mahalanobis}$ 距离一个向量到一个分布的距离一个点相对于一个分布的异常程度

1️⃣实验 $1$ ：用 $\text{Wasserstein}$ 距离衡量 $\text{OOD}$ 特性

数据集：基础数据集中抽取的无交叉集 $B_1/B_2$ ， $\text{OOD}$ 的查询集 $Q$
结果： $\text{Wasserstein}(B_1,Q)$ 和 $\text{Wasserstein}(B_2,Q)$ ，大致是 $\text{Wasserstein}(B_1,B_2)$ 两倍

2️⃣实验 $2$ ：用 $\text{Mahalanobis}$ 距离衡量 $\text{OOD}$ 特性

数据集：满足分布 $P$ 的基础数据，来自 $\text{ID}$ 查询集的 $q_{id}$ ，来自 $\text{OOD}$ 查询集的 $q_{ood}$
结果： $\text{Mahalanobis}(q_{\text{id}},P)\text{<}\text{Mahalanobis}(q_{\text{ood}},P)$

$\textbf{2.1.2. }\textbf{SOTA-ANN}$ 在 $\textbf{OOD}$ 任务上的表现

1️⃣对传统的 $\text{SOTA-ANN}$

索引方法在 $\textbf{OOD}$ 上的表现(相比在 $\textbf{ID}$ 上)
$\text{HNSW}$ 性能显著下降，在 $\text{BeamSearch}$ 过程显著访问更多的结点(要经历更多跳)
$\text{IVF-PQ}$ 性能显著下降，需要更多的聚类数才能达到相同的 $\text{Recall}$

2️⃣对改进的 $\text{ANN}$ ：针对 $\text{OOD-ANNS}$ 的首个图索引 $\text{RobustVamana(OOD-DiskANN)}$

原理：先用 $\text{Vamana}$ 建图，然后再用 $\text{RobustStitch}$ 根据查询向量，连接新的边
性能：比 $\text{DiskANN}$ 在 $\text{OOD}$ 任务上提升了 $\text{40\%}$ 性能，但是查询速度慢了 ${\text{×}4\text{-10}}$

$\textbf{2.2. }$ 对 $\textbf{OOD}$ 上 $\textbf{ANN}$ 工作负载的分析
$\textbf{2.2.1. OOD-ANNS}$ 和 $\textbf{ID-ANNS}$ 的两个差异

1️⃣两种差异及实验结果

$\text{OOD}$ 查询离其最邻近很远：即 $\delta\left(q_{\text{ood}}, i^{t h} \text{-NN}_{\text{ood}}\right) \text{≫} \delta\left(q_{\text{id}}, i^{t h} \text{-NN}_{\text{id}}\right)$ ，左为 $i\text{=}1$ 时的分布结果
$\text{OOD}$ 查询的最邻近彼此原理： $100^{t h} \text{-NN}$ 互相之间的平均距离，实验结果如右

2️⃣对差异的直观理解

简单(概念)示例：

$\text{ID}$ 查询：查询与其最邻近在球面上，相互靠近
$\text{ODD}$ 查询：查询在球心，其最邻近在球面上(由此距离较远且查询不多 $\text{+}$ 分散分布)

真实示例：真实数据 $\text{PCA}$ 降到二维的视图， $\text{ID}$ 查询更为集中

$\textbf{2.2.2. }$ 为何传统 $\textbf{SOTA-ANN}$ 在 $\textbf{ODD}$ 表现不佳
0️⃣传统 $\text{ANN}$ 的设计

基于两假设：查询 $/$ 数据同分布 $+ k$ 个最近邻彼此相互靠近(邻居的邻居是邻居)，刚好全反的
设计的思路：
建图：用 $\text{BeamSearch}$ 来构建 $\text{KNN}$ 图 $\text{→}$ 空间中相近的点转化为图中紧密连接的结点
搜索：从中心点开始 $\text{GreedySearch}$

1️⃣在基于图 $\text{ANN}$ 上： $\text{OOD}$ 会使得搜索空间增大
可识别搜索空间：包围当前访问结点 $x$ 的 $B^{s}(x)\text{+}B^{k}\left(1^{\text{st}}\text{-NN}, R\right)$
球 $B^{k}\left(1^{\text{st}}\text{-NN}, R\right)$ ：以 $1^{\text{st}}\text{-NN}$ 为球心， $k$ 邻近间互相距离 $\delta\left(i^{\text{th}}\text{-NN}, j^{\text{th}}\text{-NN}\right)$ 最大值为半径
球 $B^{s}(x)$ ：以当前结点 $x$ 为圆心，以 $\delta\left(x, i^{\text{th}}\text{-NN}\right)$ 的最大值(到最远最邻近的距离)为半径

$\text{OOD}$ 的影响：搜索空间大幅增大
对 $B^{k}$ ：由于 $\text{OOD}$ 的性质 $R_{\text {ood }}\text{≫}R_{\text{id}}$ ，这一差异在体积层面放大到 $\left(\cfrac{R_{\text {ood }}}{R_{\text{id}}}\right)^D$ 级别
对 $B^{s}$ ：由于 $\text{OOD}$ 的性质 $\delta\left(x, i^{\text{th}}\text{-NN}_{\text{ood}}\right)\text{≫}\delta\left(x, i^{\text{th}}\text{-NN}_{\text{id}}\right)$ ，使得体积也大幅膨胀
对搜索过程的影响：
对于 $\text{ID}$ 查询：由于最近邻彼此靠近， $\text{GreedySearch}$ 可以使 $B^{s}(x)$ 轻松收敛
起点 -> 近邻1 -> 近邻2 -> 近邻3 (一个小范围内)
对于 $\text{OOD}$ 查询：最近邻方向分散难以收敛，需要更大的 $\text{Beam}$ 宽度 $/$ 搜索路径等
       近邻2↗️     
起点 -> 近邻1 -> 近邻3 (分散在大范围内)↘️     近邻4
2️⃣在基于划分 $\text{IVF}$ 上

原理上： $\text{IVF}$ 先将原数据分簇
$\text{ID}$ 查询：最邻近集中在少数几个相邻簇中
$\text{OOD}$ 查询：最邻近分散在多个不相邻簇中

实验上： $\text{OOD}$ 查询需要扫描更多的簇，性能下降 $2.5$ 倍

距离类型	衡量什么	如何理解
$\text{Wasserstein}$ 距离	两个分布间的差异	把一个分布搬到另一个的最小代价
$\text{Mahalanobis}$ 距离	一个向量到一个分布的距离	一个点相对于一个分布的异常程度

索引方法	在 $\textbf{OOD}$ 上的表现(相比在 $\textbf{ID}$ 上)
$\text{HNSW}$	性能显著下降，在 $\text{BeamSearch}$ 过程显著访问更多的结点(要经历更多跳)
$\text{IVF-PQ}$	性能显著下降，需要更多的聚类数才能达到相同的 $\text{Recall}$

$\textbf{3. RoarGraph}$

$\textbf{3.1. RoarGraph}$ 的设计思路

1️⃣面向解决三种挑战

边的建立：如何连接查询 $/$ 基础两类结点，同时避免基础结点度数太高
搜索效率：查询结点要保持极高出度以覆盖基础节点，但同时也会大幅增加跳数 $/$ 内存开销
连通性：避免出现孤立结点，独立子图

1️⃣大致的设计流程

构建：建立查询 $\boldsymbol{\xleftrightarrow{}}$ 基础二分图 $\text{→}$ 将邻接信息投影到基础点中 $\text{→}$ 增强连接
查询：同样是用 $\text{BeamSearch}$

$\textbf{3.2. RoarGraph}$ 的构建: 三个阶段
$\textbf{3.2.1. }$ 阶段 $\textbf{1}$ : 查询 $\boldsymbol{\xleftrightarrow{}}$ 基础二分图构建
1️⃣二分图概述：

基本概念：将所有的点分为两个集合，所有边必须连接不同子集的点，不能内部连接

在此处：两子集查询结点 $+$ 基础节点，两种边[查询结点 $\text{→}$ 基础结点] $\text{+}$ [查询结点 $\text{←}$ 基础结点]

2️⃣构建过程概述

$\quad$
预处理：计算每个查询向量的真实 $N_q\text{-NN}$ 标签
边构建：
方向操作
查询点 $\text{→}$ 基础点查询点 $\xrightarrow{连接}$ 查询点的 $N_q\text{-NN}$ 基础点
基础点 $\text{→}$ 查询点查询点 $\xleftarrow{连接}$ 查询点的 $1\text{-NN}$ 基础点，查询点 $\xrightarrow{断连}$ 查询点的 $1\text{-NN}$ 基础点
示例：
预处理: T1 -> X1, X2, X3 (Nq=3)
边构建: T1 -> X2, X3 T1 <- X1 
2️⃣构建过程分析
结点度数的考量：
高查询结点出度：提高 $N_q$ 值，增加[基础点 $\xrightarrow[覆盖性]{重叠性}$ 查询点]，使多基础点可由同一查询点联系
低基础节点出度：为了解决上述挑战 $1$ ，目的在于提高二分图上的搜索效率
边方向的考虑：不进行双向连接，避免二分图搜索时要去检查邻居的邻居( $N_q^2$ )
预处理: T1 -> X1, X2, X3 (Nq=3)
边构建: T1 -> X1, X2, X3 T1 <- X1T1 <- X2T1 <- X3
$\textbf{3.2.2. }$ 阶段 $\textbf{2}$ : 领域感知投影
1️⃣一些分析

优化动机：二分图内存消耗高(额外存储了查询节点)，搜索路径长(需要额外经过查询结点)
关于投影：
目的：移除二分图中的查询结点，并保留从查询分布获得的邻近关系
方式：最简单的可将查询点所连的全部基础点全连接(度数太高)，优化方法如领域感知投影

2️⃣投影过程：
预处理：
遍历查询点：获得与查询点相连的最邻近基础点
查询Q -> {B1, B2, B3, B4, B5}  (Q连接了5个基础节点)
选择中心点：即查询点的 $\text{1-NN}$ 点，作为 $\text{Pivot}$
查询Q -> {B1, B2, B3, B4, B5}  (Q连接了5个基础节点)👆pivot
排序基础结点：将余下 $N_q\text{-NN}$ 点，按与 $\text{Pivot}$ 的距离排序
感知投影：
连接：让中心点与余下点建立连接
B1 -> B2 (最近)
B1 -> B3 (次近)
B1 -> B4 (较远)
B1 -> B5 (最远)
过滤：保证与 $\text{Pivot}$ 连接方向的多样性

条件含义操作
$\text{Dist}(X,Y)\text{<}\text{Dist}(\text{Pivot},Y)$ 该方向已有连接则筛掉 $Y$ (不与 $\text{Pivot}$ 建立连接)
$\text{Dist}(X,Y)\text{>}\text{Dist}(\text{Pivot},Y)$ 代表新的搜索方向则保留 $Y$ (可与 $\text{Pivot}$ 建立连接)

填充：当 $\text{Pivot}$ 的出度小于度数限制，则又重新连接之前过滤掉的结点
$\textbf{3.2.3. }$ 连通性增强

1️⃣为何要增强：仅依赖于二分图的覆盖范围，投影图的连通性还太低，对 $\text{GreedySearch}$ 不友好

2️⃣增强的方法：

检索：从基础集的 $\text{Medoid}$ 开始，对每个基础点执行 $\text{BeamSearch}$ 得到最邻近(作为候选点)
连边：在不超过度数限制的前提下，让该基础点连接一定数量的候选点作
$\textbf{3.3. RoarGraph}$ 性能的验证

$\textbf{3.3.1. }$ 实验设置

1️⃣数据集

数据集描述查询集索引集
$\text{Text-to-Image}$ 流行基准数据集，含图像和文本查询向量官方 $1\text{w}$ 条余下不重叠数据
$\text{LAION}$ 数百万对图像 $-$ 替代文本对采样 $1\text{w}$ 条余下不重叠数据
$\text{WebVid}$ 素材网站获取的字幕和视频对采样 $1\text{w}$ 条余下不重叠数据

2️⃣超参数设置

模型超参数列表
$\text{HNSW}$ $M\text{=}32$ , $\text{efConstruction}\text{=}500$
$\text{NSG}$ $R\text{=}64$ , $C\text{=}L\text{=}500$
$\tau\text{-MNG}$ $R\text{=}64$ , $C\text{=}L\text{=}500$ , $\tau\text{=}0.01$
$\text{RobustVamana}$ $R\text{=}64$ , $L\text{=}500$ , $\alpha\text{=}1.0$
$\text{RoarGraph}$ $N_q\text{=}100$ (最近邻候选数量), $M\text{=}35$ (出度约束), $L\text{=}500$ (候选集大小)

3️⃣性能指标： $\text{Recall@k}$ 和 $\text{QPS}$ (检索速度)

$\textbf{3.3.2. }$ 实验结果

1️⃣ $\text{QPS}$ 与召回： $\text{RoarGraph}$ 最优(超过 $\text{RobustVamana}$ )， $\text{HNSW/NSG}$ 差不多, $\tau\text{-MNG}$ 最差

2️⃣跳数与召回： $\text{RoarGraph}$ 跳数显著减少，且随 $\text{Recall@}$ 的 $k$ 增大，减少趋势下降

3️⃣消融实验：对比了二分图 $/$ 投影图 $/$ 完整图，可见通过邻域感知投影显著提升性能

4️⃣查询集规模：即查询集大小占基础集大小比重对索引性能的影响；可见起始模型对规模并不敏感

5️⃣在 $\text{ID}$ 负载上的性能： $\text{RoarGraph}$ 依旧能打，和 $\text{HNSW}$ 相当

6️⃣索引开销成本：使用 $10\%$ 数据可大幅降低构建成本，同时保持搜索性能

$\quad$

$\textbf{3.4. RoarGraph}$ 的一些讨论

1️⃣运用场景：结合大量历史查询数据，用多模态深度学习模型生成嵌入，部署在大型检索 $/$ 推荐系统

2️⃣更新机制：

初始搜索：
结点查询：将新插入下新基础节点 $v$ 作为查询，在基础数据集中搜索其最邻近
结点筛选：要求最邻近满足，曾在图构建过程中与至少一个查询点连接过的基础点
反向回溯：对该最邻近点，回溯到与其曾建立过连接的距离最近的查询点 $q$

子图构建：
二分子图：将 $q\xleftrightarrow{}N_{\text {out}}\text{∪}v$ 整合为二分子图
邻域投影：将 $v$ 作为 $\text{Pivot}$ 按同样的方式，生成投影图

3️⃣删除操作：采用墓碑标记法 $\text{Tombstones}$ ，即被删结点任参与路由，但排除在搜索结果中

方向	操作
查询点 $\text{→}$ 基础点	查询点 $\xrightarrow{连接}$ 查询点的 $N_q\text{-NN}$ 基础点
基础点 $\text{→}$ 查询点	查询点 $\xleftarrow{连接}$ 查询点的 $1\text{-NN}$ 基础点，查询点 $\xrightarrow{断连}$ 查询点的 $1\text{-NN}$ 基础点

条件	含义	操作
$\text{Dist}(X,Y)\text{<}\text{Dist}(\text{Pivot},Y)$	该方向已有连接	则筛掉 $Y$ (不与 $\text{Pivot}$ 建立连接)
$\text{Dist}(X,Y)\text{>}\text{Dist}(\text{Pivot},Y)$	代表新的搜索方向	则保留 $Y$ (可与 $\text{Pivot}$ 建立连接)

数据集	描述	查询集	索引集
$\text{Text-to-Image}$	流行基准数据集，含图像和文本查询向量	官方 $1\text{w}$ 条	余下不重叠数据
$\text{LAION}$	数百万对图像 $-$ 替代文本对	采样 $1\text{w}$ 条	余下不重叠数据
$\text{WebVid}$	素材网站获取的字幕和视频对	采样 $1\text{w}$ 条	余下不重叠数据

模型	超参数列表
$\text{HNSW}$	$M\text{=}32$ , $\text{efConstruction}\text{=}500$
$\text{NSG}$	$R\text{=}64$ , $C\text{=}L\text{=}500$
$\tau\text{-MNG}$	$R\text{=}64$ , $C\text{=}L\text{=}500$ , $\tau\text{=}0.01$
$\text{RobustVamana}$	$R\text{=}64$ , $L\text{=}500$ , $\alpha\text{=}1.0$
$\text{RoarGraph}$	$N_q\text{=}100$ (最近邻候选数量), $M\text{=}35$ (出度约束), $L\text{=}500$ (候选集大小)

文献分享：RoarGraph——跨模态的最邻近查询

文章目录 1. \textbf{1. } 1. 导论 1.1. \textbf{1.1. } 1.1. 研究背景 1.2. \textbf{1.2. } 1.2. 本文的研究 1.3. \textbf{1.3. } 1.3. 有关工作 2. \textbf{2. } 2. 对 OOD \textbf{OOD} OOD负载的分析与验证 2.1. \textbf{2.1. } 2.1. 初步的背景及其验证 2.1.1. \textbf{2…...

编程日记 2025/1/6 4:24:20

故事可视化AI

i68,爱六八,链接你我他 StoryWeaver故事可视化通过知识增强的角色定制技术，实现高质量的故事可视化论文链接:https://arxiv.org/pdf/2412.07375项目仓库:https://github.com/Aria-Zhangjl/StoryWeaver由厦门大学多媒体可信感知与高效计算教育部重点实验室和网易伏…...

编程日记 2025/1/6 4:23:19

【机器学习篇】从新手探寻到算法初窥：数据智慧的开启之门

文章目录【机器学习篇】从新手探寻到算法初窥：数据智慧的开启之门前言一、什么是机器学习？二、机器学习的基本类型1. 监督学习（Supervised Learning）2. 无监督学习（Unsupervised Learning）3. 半监督学习&a…...

编程日记 2025/1/6 4:20:14

ffmpeg八大开发库

‌FFmpeg八大库‌是指FFmpeg项目中最重要的八个库，它们各自承担不同的功能，共同构成了FFmpeg的强大功能。以下是这八大库的详细介绍： ‌libavcodec‌：负责音频和视频的编解码。它支持多种编解码器，如H.264、AAC、MP3、…...

编程日记 2025/1/6 4:19:13

【ArcGISPro/GeoScenePro】解决常见的空间参考和投影问题

修复空间参考缺失的图像数据 https://arcgis.com/sharing/rest/content/items/535efce0e3a04c8790ed7cc7ea96d02d/data 查看属性坐标查看属性范围范围值并不是零或接近于零。这意味着栅格具有范围，因此其已正确进行...

编程日记 2025/1/6 4:18:12

Linux上安装配置单节点zookeeper

直接先去官网下载安装包， https://downloads.apache.org/zookeeper/ 选择合适的版本，然后上传至服务器解压： tar -zxvf apache-zookeeper-3.9.3-bin.tar.gz创建data和logs目录 mkdir data mkdir logs配置环境变量： vim /etc/p…...

编程日记 2025/1/6 4:16:11

现代光学基础-1

总结自老师的讲义 yt1 目录光纤通信系统组成部分三大里程碑技术实例分析激光器定义自振荡器的特性组成输出特性应用领域受激辐射、自然辐射与吸收 LASER的定义受激辐射的特点光与物质的相互作用能量守恒与材料特性净增益条件谐振器定义组成部分性能描述 F-P谐振器&am…...

编程日记 2025/1/6 4:12:07

pytorch中nn.Conv2d详解及参数设置原则

文章目录基础参数1. in_channels (输入通道数)2. out_channels (输出通道数)3. kernel_size (卷积核大小)4. stride (步幅)5. padding (填充)6. dilation (膨胀)7. groups (分组卷积)8. bias (偏置) 如何设置参数？1. **in_channels 和 out_channels（输入…...

编程日记 2025/1/6 4:04:58

T-SQL语言的正则表达式

T-SQL语言的正则表达式在现代数据库管理系统中，SQL（结构化查询语言）被广泛用于数据的操作与管理。对数据的查询、插入、更新和删除几乎是每一个数据库管理系统中的基本功能。T-SQL（Transact-SQL）是微软对SQL的扩展&a…...

编程日记 2025/1/6 4:03:56

UDP_TCP

目录 1. 回顾端口号2. UDP协议2.1 理解报头2.2 UDP的特点2.3 UDP的缓冲区及注意事项 3. TCP协议3.1 报头3.2 流量控制2.3 数据发送模式3.4 捎带应答3.5 URG && 紧急指针3.6 PSH3.7 RES 1. 回顾端口号在 TCP/IP 协议中，用 “源IP”， “源端口号”…...

编程日记 2025/1/6 4:02:55

Python 中常见的数据结构之二推导式

Python 中常见的数据结构之二推导式使用推异式列表推导式字典推导式集合推导式使用推异式推导式是一种从已存在的序列中快速构建列表(list)、集合(set) 和字典(dictionary)方式。Python 支持 3 种不同类型的推导式： 列表推导式；字典推导式&#xf…...

编程日记 2025/1/6 4:01:52

STM32 拓展低功耗案例3：待机模式（hal）

配置PA0的两种方式： 第一种第二种复制寄存器代码然后对其进行修改 mian.c /* USER CODE BEGIN Header */ /********************************************************************************* file : main.c* brief : Main program body…...

编程日记 2025/1/6 3:54:46

【开源社区openEuler实践】探索 Yocto-Meta-OpenEuler：嵌入式开发的强大基石

title: 探索 Yocto-Meta-OpenEuler：嵌入式开发的强大基石 date: ‘2024-11-19’ category: blog tags: Yocto-Meta-OpenEuler嵌入式系统开源项目定制化开发 sig: EmbeddedTech archives: ‘2024-12’ author:way_back summary: Yocto-Meta-OpenEuler 为嵌入式系统开…...

编程日记 2025/1/6 3:53:44

C++ hashtable

文章目录 1. 基本概念2. 哈希函数3. 哈希冲突及解决方法开放定址法链地址法再哈希法建立公共溢出区4. 哈希表的操作实现5. 内存管理及优化时间复杂度理想情况（无哈希冲突或冲突极少）一般情况（考虑哈希冲突及解决方法）综合来看以…...

编程日记 2025/1/6 3:48:39

JS (node) 的 ACM 模式 + debug方法 (01背包为例)

文章目录 JS 的 ACM 模式输入处理 JS dubug (01背包为例)动态输入在本地通过 Node.js 运行和调试硬编码 Hard CodingVS Code JS 的 ACM 模式在 JavaScript 中，ACM 模式一般通过 Node.js 的 readline 模块实现。输入处理使用 readline 模块监听输入。将每行输…...

编程日记 2025/1/6 3:47:38

vue设计与实现-框架设计

权衡的艺术命令式和声明式视图层框架通常分为命令式和声明式，各有优缺。jquery是一种命令式框架。命令式框架关注过程，而声明式框架关注结果。对于vue来说，过程被vue封装了，所以vue内部是命令式的，但vue暴露给用户…...

编程日记 2025/1/6 3:44:34

Stable Diffusion和Midjourney有什么区别？

Stable Diffusion 和 Midjourney 主要有以下区别： 目录费用与可访问性设备要求安装与使用学习成本图像生成效果可控性与定制性私密性费用与可访问性 Stable Diffusion：开源免费，任何人都可以免费下载并自行部署使用&#xf…...

编程日记 2025/1/6 3:35:23

即插即用，无痛增强模型生成美感！字节跳动提出VMix:细粒度美学控制，光影、色彩全搞定

文章链接：https://arxiv.org/pdf/2412.20800 代码地址：https://github.com/fenfenfenfan/VMix 项目地址：https://vmix-diffusion.github.io/VMix/ 亮点直击分析并探索现有模型在光影、色彩等细粒度美学维度上生成图像的差异，提出…...

编程日记 2025/1/6 3:28:15

面向对象分析和设计OOA/D，UML，GRASP

目录什么是分析和设计？ 什么是面向对象的分析和设计？ 迭代开发 UML 用例图交互图基于职责驱动设计 GRASP 常见设计原则什么是分析和设计？ 分析，强调是对问题和需求的调查研究，不是解决方案。例如&#x…...

编程日记 2025/1/6 3:27:13

【每日学点鸿蒙知识】广告ID、NFC手机充值、CSS支持语法、PC与模拟器交互、SO热更新等

1、HamonyOS 样机获取成功返回Oaid为00000000-0000-0000-0000-000000000000？ 请求授权时需要触发动态授权弹窗,看一下是不是没有触发授权弹窗。可以参考以下代码以及文档： // ets import identifier from ohos.identifier.oaid; import hilog from oh…...

编程日记 2025/1/6 3:25:11

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…...

编程新知 2026/2/7 23:18:39

微信小程序之bind和catch

这两个呢，都是绑定事件用的，具体使用有些小区别。官方文档： 事件冒泡处理不同 bind：绑定的事件会向上冒泡，即触发当前组件的事件后，还会继续触发父组件的相同事件。例如，有一个子视图绑定了b…...

编程新知 2026/2/5 5:05:56

Appium+python自动化（十六）- ADB命令

简介 Android 调试桥(adb)是多种用途的工具，该工具可以帮助你你管理设备或模拟器的状态。 adb ( Android Debug Bridge)是一个通用命令行工具，其允许您与模拟器实例或连接的 Android 设备进行通信。它可为各种设备操作提供便利，如安装和调试…...

编程新知 2026/1/21 18:20:51

JDK 17 新特性

#JDK 17 新特性 /**************** 文本块 *****************/ python/scala中早就支持，不稀奇 String json “”" { “name”: “Java”, “version”: 17 } “”"; /**************** Switch 语句 -> 表达式 *****************/ 挺好的&#xff…...

编程新知 2026/1/29 5:34:29