当前位置: 首页 > article >正文

​​【信息科学与工程学】【数据科学】数据科学领域 第十二篇 大数据主要算法08

大数据算法531-540编号算法名称算法类型算法/模型名称算法逐步推理思考的数学方程式/核心逻辑关联知识复杂度数据类型应用场景和应用方法531局部线性嵌入​无监督学习局部线性嵌入1. 算法目标保持数据局部线性结构将高维数据映射到低维空间。2. 局部重建权重计算对每个数据点x_i找到其k个最近邻N(i)。最小化重建误差min_W Σ_ix_i - Σ{j∈N(i)} W{ij} x_j²约束Σ{j∈N(i)} W{ij}1。通过求解局部协方差矩阵C{jk}(x_i-x_j)ᵀ(x_i-x_k)然后解线性方程组Σ_k C{jk} W_{ik}1得到权重。3. 低维嵌入计算固定权重W寻找低维表示{y_i}最小化Φ(Y)Σ_i532拉普拉斯特征映射​无监督学习拉普拉斯特征映射1. 构建邻接图用k近邻或ε邻域构建图边权重W_{ij}exp(-x_i-x_j²/t)或简单二值权重。2. 计算拉普拉斯矩阵度矩阵D为对角阵D{ii}Σ_j W{ij}。拉普拉斯矩阵LD-W。3. 广义特征值问题求解LfλDf的广义特征值问题。取最小的d个非零特征值对应的特征向量f₁,...,f_d。4. 低维嵌入第i个样本的低维坐标为(y_i1,...,y_id)(f₁(i),...,f_d(i))。5. 数学原理最小化目标函数Σ{i,j} W{ij}533高斯混合模型​无监督学习高斯混合模型1. 模型定义p(xθ)Σ_{k1}^K π_k N(xμ_k,Σ_k)其中π_k为混合系数Σ_k π_k1N为高斯分布。2. 隐变量引入隐变量zz_k∈{0,1}Σ_k z_k1表示样本属于哪个分量。完全数据似然p(x,zθ)Π_k π_k^{z_k} N(xμ_k,Σ_k)^{z_k}。3. EM算法E步计算后验γ(z_{nk})p(z_k1534谱聚类​无监督学习谱聚类1. 构建相似度矩阵计算样本间相似度S_{ij}exp(-x_i-x_j²/2σ²)或k近邻。2. 构建拉普拉斯矩阵常用对称归一化拉普拉斯L{sym}I-D^{-1/2}SD^{-1/2}或随机游走归一化L{rw}I-D^{-1}S。3. 特征分解计算L的前k个最小特征值对应的特征向量u₁,...,u_k构成矩阵U∈ℝ^{n×k}。4. 行归一化将U的行归一化得到矩阵Tt{ij}u{ij}/(Σ_j u{ij}²)^{1/2}。5. K-means聚类对T的行向量用k-means聚类得到簇划分C₁,...,C_k。6. 数学原理谱聚类最小化图割问题。RatioCut目标min{A₁,...,A_k} Σ{i1}^k cut(A_i,Āi)/535主成分分析​无监督学习主成分分析1. 数据中心化x_i x_i - μ其中μ1/n Σ_i x_i。2. 协方差矩阵C1/n Σ_i x_i x_iᵀ 1/n XᵀX假设X每行一个样本。3. 特征值分解Cv_i λ_i v_iλ₁≥λ₂≥...≥λ_d。特征向量v_i为主成分方向。4. 降维取前k个特征向量构成投影矩阵W[v₁,...,v_k]∈ℝ^{d×k}。降维后数据YXW∈ℝ^{n×k}。5. 最大方差解释PCA最大化投影后方差max_W tr(WᵀCW) s.t. WᵀWI。解为C的前k个特征向量。6. 最小重建误差最小化重建误差X-XWWᵀ_F²同样得到相同解。7. 奇异值分解XUΣVᵀ则主成分V的前k列得分矩阵UΣ的前k列。536独立成分分析​无监督学习独立成分分析1. 问题模型观测信号xAs其中s为独立源信号A为混合矩阵。目标找到分离矩阵W使yWx近似s。2. 预处理中心化x白化zVx使E[zzᵀ]IV通常为协方差矩阵的特征值分解得到。3. 独立性度量使用负熵近似J(y)∝[E(G(y))-E(G(v))]²其中v为标准高斯G为非二次函数如tanh。4. FastICA算法- 初始化权重向量w。- 更新w←E{zg(wᵀz)}-E{g(wᵀz)}w其中g为G的导数。- 正交化w←w/w若多个分量用Gram-Schmidt正交化。- 重复直到收敛。5. 数学原理最大化非高斯性作为独立性度量。中心极限定理表明混合信号更高斯分离信号应非高斯。537t-分布随机邻域嵌入​无监督学习t-SNE1. 高维相似度对高维数据点x_i,x_j计算条件概率p_{j|i}exp(-x_i-x_j²/2σ_i²)/Σ_{k≠i}exp(-538自编码器​无监督学习自编码器1. 网络结构编码器f_θ: ℝ^d→ℝ^h解码器g_φ: ℝ^h→ℝ^dhd。2. 目标函数最小化重建误差L(θ,φ)1/n Σ_ix_i-g_φ(f_θ(x_i))²。3. 编码过程h_if_θ(x_i)σ(Wx_ib)σ为激活函数。4. 解码过程x̂_ig_φ(h_i)σ(Wh_ib)。5. 正则化为防止恒等映射可加稀疏约束L_sparseΣ_j KL(ρ539深度信念网络​无监督学习深度信念网络1. 结构多层受限玻尔兹曼机堆叠。2. RBM能量函数E(v,h)-aᵀv-bᵀh-vᵀWh其中v为可见层h为隐层W为权重a,b为偏置。3. 联合概率p(v,h)exp(-E(v,h))/ZZ为配分函数。4. 条件概率p(h_j1|v)σ(b_jΣ_i W{ij}v_i)p(v_i1|h)σ(a_iΣ_j W{ij}h_j)。5. 对比散度训练- 输入v⁽⁰⁾计算h⁽⁰⁾~p(h|v⁽⁰⁾)。- 采样h⁽⁰⁾计算v⁽¹⁾~p(v|h⁽⁰⁾)。- 计算h⁽¹⁾~p(h|v⁽¹⁾)。- 更新参数ΔWη(v⁽⁰⁾h⁽⁰⁾ᵀ-v⁽¹⁾h⁽¹⁾ᵀ)类似更新a,b。6. 逐层训练训练第一层RBM后其隐层作为下一层RBM的可见层重复。最后用反向传播微调。生成模型、对比散度、RBMO(n * 2^{vh}) 精确计算CD近似二值数据场景图像生成、特征学习、协同过滤。方法逐层无监督预训练有监督微调。540生成对抗网络​无监督学习生成对抗网络1. 博弈框架生成器G(z;θ_g)映射噪声z到数据空间判别器D(x;θ_d)输出x为真实数据的概率。2. 目标函数min_G max_D V(D,G)E{x~p_data}[log D(x)]E{z~p_z}[log(1-D(G(z)))]。3. 判别器更新最大化V梯度上升∇{θ_d} 1/m Σ_i [log D(x⁽ⁱ⁾)log(1-D(G(z⁽ⁱ⁾)))]。4. 生成器更新最小化log(1-D(G(z)))梯度下降∇{θ_g} 1/m Σ_i log(1-D(G(z⁽ⁱ⁾)))。实践中用最大化log D(G(z))避免梯度消失。5. 最优解当p_gp_data时达到纳什均衡此时D(x)1/2。6. 损失函数生成器损失L_G-E{z~p_z}[log D(G(z))]判别器损失L_D-E{x~p_data}[log D(x)]-E_{z~p_z}[log(1-D(G(z)))]。7. 训练技巧使用Adam优化器标签平滑小批量判别等。生成模型、博弈论、最小最大博弈O(n * (d_g d_d))图像、文本等场景图像生成、数据增强、风格迁移。方法生成器和判别器对抗训练生成器学习数据分布。大数据算法551-560关联规则、序列模式、图模式挖掘编号算法名称算法类型算法/模型名称算法逐步推理思考的数学方程式/核心逻辑关联知识复杂度数据类型应用场景和应用方法551GCT算法​关联规则挖掘广义闭合项集树算法1. 基本思想通过构建闭合项集树来挖掘频繁闭合项集。2. 闭合项集定义项集X是闭合的当且仅当不存在X的超集Y使得support(Y) support(X)。3. 闭包运算closure(X) {i ∈ I |support(X ∪ {i}) support(X)}。闭合项集X满足closure(X) X。4. 算法步骤- 扫描数据库计算所有频繁1-项集的支持度。- 构建闭合项集树根节点为空集每个节点表示一个闭合项集。- 从根节点开始对每个节点X考虑添加一个项ii不在X中且大于X中所有项计算Y closure(X ∪ {i})。如果Y是闭合的且频繁则将Y作为X的子节点并记录支持度。- 递归构建子树。5. 剪枝利用闭合项集的性质如果一个项集不是闭合的则不需要扩展其超集。6. 数学原理所有闭合项集构成了一个完备格可以通过闭包运算生成。闭合项集、闭包运算、格结构O(2^m) 最坏m为项数事务数据场景频繁闭合项集挖掘用于压缩频繁项集表示。方法通过闭包运算构建闭合项集树避免生成大量非闭合项集。552CARMA​关联规则挖掘连续关联规则挖掘算法1. 算法目标在数据流中挖掘关联规则适应数据分布的变化。2. 滑动窗口使用时间窗口W只考虑窗口内的事务。3. 潜在频繁项集维护一个潜在频繁项集集合PL包含所有可能在未来成为频繁的项集。对每个项集X维护其支持度计数count(X)和最大可能误差max_error(X)。4. 更新策略新事务到达时更新PL中所有子项集的计数。旧事务过期时减少相应计数。同时更新max_error(X) count(X) 新事务数自X加入PL后。5. 剪枝如果一个项集X的max_error(X) min_sup * |W|则从PL中删除。6. 规则生成定期检查PL中的项集如果count(X) ≥ min_sup * |W|则输出X为频繁项集并生成规则。7. 数学公式设当前窗口大小为N最小支持度阈值s则频繁条件为count(X) ≥ sN。max_error(X) count(X) Δ其中Δ是自X加入PL后进入窗口的事务数。数据流挖掘、滑动窗口、误差边界O(PL) 每事务553WAP-Tree​序列模式挖掘Web访问模式树1. 树结构WAP-Tree将序列数据库压缩存储在一棵树中。每个节点包含项名、计数和子节点指针。根节点为空。2. 构建树扫描序列数据库对每个序列按顺序插入到树中共享相同前缀的路径合并节点计数增加。3. 头表维护一个项头表包含每个项的支持度和指向树中第一个节点的指针。4. 条件模式基对每个项i通过头表遍历树收集从根到i的路径形成条件序列数据库但只包含i的前缀。5. 条件树用条件序列数据库构建条件WAP-Tree递归挖掘。6. 算法步骤- 扫描数据库删除非频繁项序列按支持度降序排列。- 构建WAP-Tree。- 对每个频繁项i构建i的条件模式基然后构建条件WAP-Tree递归挖掘。7. 数学优化WAP-Tree的规模通常远小于原数据库特别是当序列共享大量前缀时。前缀树、条件模式基、序列压缩O(nL) 构建树n为序列数L为平均长度Web访问序列场景Web日志挖掘、用户点击流分析。方法将序列数据库压缩到树中通过递归投影挖掘模式。554TS-PrefixSpan​序列模式挖掘带时间约束的PrefixSpan1. 时间约束引入最大间隔max_gap、最小间隔min_gap和窗口大小window。2. 投影调整在构建投影数据库时需要考虑时间约束。给定前缀α在序列β中寻找α的投影时需要检查时间戳是否满足约束。3. 投影定义设α (a1, a2, ..., ak)在序列β中α的投影位置是一组时间戳(t1, t2, ..., tk)满足- 对于每个iai在时间ti出现。- t1 t2 ... tk。- 对于每个iti1 - ti 在 [min_gap, max_gap] 内或者如果ai和ai1在同一个项集中则间隔为0。- 整个α的持续时间 ≤ window如果指定。4. 投影数据库对每个序列找出所有满足约束的投影取投影位置之后的后缀作为投影序列。5. 递归挖掘在投影数据库上递归挖掘更长的序列模式。6. 支持度计算一个序列在数据库中的支持度是包含该序列满足时间约束的序列数。时间约束、投影调整、序列模式比PrefixSpan复杂取决于约束带时间戳的序列场景生物序列分析、带有时间间隔的事件序列。方法在PrefixSpan基础上加入时间约束挖掘符合时间关系的序列模式。555SPIRIT算法​序列模式挖掘基于正则表达式的序列模式挖掘1. 问题定义给定一个正则表达式R在序列数据库中挖掘满足R的频繁序列模式。2. 正则表达式例如R A(B|C)D表示以A开头D结尾中间是B或C的任意序列。3. 算法思想利用R对搜索空间进行剪枝。只有可能扩展为满足R的序列才被考虑。4. 自动机构建将R转换为一个非确定性有限自动机NFA或确定性有限自动机DFA。5. 状态跟踪对数据库中的每个序列跟踪自动机状态。在挖掘过程中每个候选序列对应自动机的一个状态集。6. 候选生成从频繁1-序列开始只生成那些在自动机状态下可能转移的项作为扩展。7. 支持度计算计算每个候选序列的支持度即有多少序列的自动机运行可以到达接受状态。8. 剪枝*如果一个序列对应的状态集不包含任何接受状态则剪枝。正则表达式、有限自动机、约束挖掘取决于正则表达式的复杂性序列数据场景模式匹配、生物序列模式发现、日志分析。方法将用户提供的正则表达式作为约束引导序列模式挖掘。556gSpan算法​图模式挖掘图模式挖掘1. 问题在图数据库中挖掘频繁子图模式。2. DFS编码将图表示为DFS编码即通过深度优先搜索遍历图得到的边序列。每个边表示为五元组(i, j, l_i, l_e, l_j)其中i, j为节点序号l_i, l_e, l_j为节点i的标签、边标签、节点j的标签。最小DFS编码作为图的规范表示。3. 子图扩展通过添加边来扩展子图。右扩展在DFS树中新边的节点序号都小于等于最大节点序号且新边连接到最右路径上的节点。前向扩展添加新节点。4. 搜索空间通过DFS编码树组织搜索空间。每个节点对应一个子图模式其子节点通过边扩展得到。5. 剪枝利用支持度进行剪枝。如果一个子图不频繁则其超图也不频繁。6. 支持度计算使用嵌入列表embedding list记录子图在数据库每个图中的匹配位置。支持度是包含该子图的图的数量。7. 算法步骤- 找出所有频繁边1-边子图。- 对每个频繁边以其最小DFS编码为根进行深度优先搜索扩展挖掘更大的频繁子图。- 利用最小DFS编码进行同构检测避免重复生成相同子图。子图挖掘、DFS编码、最小DFS编码指数级但实际中可处理中等规模图图数据场景化学化合物分析、社交网络模式挖掘。方法通过DFS编码将图映射为序列利用序列模式挖掘的思想进行子图挖掘。557CloseGraph算法​图模式挖掘闭合频繁子图挖掘1. 闭合子图子图g是闭合的如果不存在g的超图g使得support(g) support(g)。2. 算法基础基于gSpan但在挖掘过程中检查闭合性。3. 闭合检查对每个发现的频繁子图g检查是否存在g的超图g使得support(g) support(g)。如果存在则g不是闭合的。4. 剪枝如果一个子图不是闭合的则其扩展子图也不可能是闭合的因为支持度不会增加可以剪枝。5. 算法步骤- 使用gSpan挖掘频繁子图但保留所有发现的频繁子图及其支持度。- 在挖掘过程中对每个新发现的频繁子图g检查已发现的闭合子图集中是否有g的子图与g支持度相同如果有则g不是闭合的。- 如果g是闭合的则将其加入闭合子图集并移除那些被g包含且支持度相同的子图。6. 优点闭合子图集通常比所有频繁子图集小得多且保留了支持度信息。闭合子图、gSpan扩展、剪枝同gSpan但输出更少图数据场景压缩频繁子图挖掘结果如蛋白质相互作用网络。方法在gSpan基础上只输出闭合频繁子图减少冗余。558SPIN算法​图模式挖掘基于投影的图模式挖掘1. 投影思想类似PrefixSpan将图数据库投影到频繁子图上递归挖掘。2. 投影定义给定一个频繁子图g在数据库图G中g的投影是G中与g同构的子图位置。投影数据库是g在所有数据库图中的投影的集合。3. 扩展在投影数据库中通过添加边扩展g。新边必须连接到g的节点后向扩展或新节点前向扩展。4. 支持度计算在投影数据库中计算扩展子图的支持度。5. 算法步骤- 找出所有频繁边。- 对每个频繁边e构建e的投影数据库。- 在投影数据库中递归扩展子图挖掘更大的频繁子图。6. 剪枝如果一个子图不频繁则其所有扩展都不频繁。7. 优点投影数据库通常比原数据库小提高了效率。图投影、递归扩展、支持度计数取决于投影数据库大小图数据场景频繁子图挖掘特别是稠密图。方法通过投影将图数据库分解在子图上进行扩展。559GASTON算法​图模式挖掘图/树/路径挖掘的统一框架1. 层次结构将图模式分为路径、树、图三个层次逐层挖掘。2. 算法步骤- 挖掘频繁路径路径是最简单的图结构通过扩展边生成路径。- 挖掘频繁树在路径的基础上通过添加边形成树但避免形成环。- 挖掘频繁图在树的基础上通过添加边形成图允许形成环。3. 扩展操作路径扩展在路径的一端添加新边。树扩展在树的节点上添加新边连接到新节点或现有节点但不能形成环。图扩展在图的节点上添加新边可以形成环。4. 支持度计算使用嵌入列表记录模式在数据库中的匹配支持度计算为包含该模式的图的数量。5. 剪枝使用支持度进行剪枝如果一个模式不频繁则其扩展也不频繁。6. 优点先挖掘简单结构再逐步复杂化可以减少同构检查的次数。路径、树、图、层次挖掘指数级但实际中高效图数据场景化学信息学、XML文档挖掘。方法从简单到复杂挖掘图模式提高效率。560Subdue算法​图模式挖掘基于压缩的子结构发现1. 评价标准使用最小描述长度MDL原则。一个好的子结构应该能压缩数据库的描述长度。2. 描述长度数据库的描述长度L(D) L(S) L(D|S)其中L(S)是子结构的描述长度L(D|S)是用子结构描述数据库的剩余部分的长度。3. 算法目标寻找能最小化L(D)的子结构。4. 算法步骤- 从所有单节点子结构开始计算描述长度增益。- 选择增益最大的子结构将其作为候选模式。- 扩展候选模式通过添加相邻的边或节点扩展子结构计算扩展后的增益。- 选择增益最大的扩展重复直到增益不再增加或达到规模限制。- 用发现的子结构压缩数据库然后递归地在压缩后的数据库中寻找新的子结构。5. 扩展方式后向扩展添加连接到子结构内部节点的边。前向扩展添加连接到子结构边界节点的边和新节点。6. 数学公式增益 L(D) - L(S) - L(D|S)。最小描述长度、压缩、子结构扩展启发式多项式时间图数据场景图数据压缩、模式发现、知识发现。方法基于MDL原则寻找能压缩数据库的频繁子结构。大数据算法深度学习、推荐系统、强化学习编号算法名称算法类型算法/模型名称算法逐步推理思考的数学方程式/核心逻辑关联知识复杂度数据类型应用场景和应用方法571Transformer​深度学习/推荐系统Transformer模型1. 自注意力机制给定查询矩阵Q、键矩阵K、值矩阵V注意力计算为Attention(Q,K,V)softmax(QK^T/√d_k)V其中d_k为键的维度。2. 多头注意力MultiHead(Q,K,V)Concat(head_1,...,head_h)W^O其中head_iAttention(QW_i^Q, KW_i^K, VW_i^V)。3. 位置编码PE(pos,2i)sin(pos/10000^{2i/d_model})PE(pos,2i1)cos(pos/10000^{2i/d_model})其中pos为位置i为维度索引。4. 前馈网络FFN(x)max(0,xW_1b_1)W_2b_2。5. 编码器层由多头自注意力和前馈网络组成每层有残差连接和层归一化xLayerNorm(xMultiHead(x,x,x))xLayerNorm(xFFN(x))。6. 解码器层比编码器多一个编码器-解码器注意力层且自注意力层是掩码的防止看到未来信息。7. 输出层线性变换加softmax得到输出概率分布。自注意力、位置编码、残差连接O(n^2·d) 自注意力序列数据场景机器翻译、文本生成、序列推荐。方法完全基于注意力机制并行计算可捕捉长距离依赖。572BERT​深度学习/推荐系统双向编码表示Transformer1. 输入表示Input Token Embedding Segment Embedding Position Embedding。2. 掩码语言模型随机掩盖输入序列中15%的token其中80%用[MASK]替换10%用随机token替换10%保持不变。模型预测被掩盖的token。3. 下一句预测二分类任务判断句子B是否是句子A的下一句。4. 损失函数L L_MLM L_NSP其中L_MLM是交叉熵损失L_NSP是二分类交叉熵。5. 微调在特定任务上将BERT的输出[CLS]位置的表示或序列表示输入任务特定的层进行端到端微调。6. 预训练任务MLM损失L_MLM -∑_{i∈M} log P(x_ix_{\M})其中M是被掩盖的位置集合。双向编码、掩码语言模型、迁移学习预训练O(n^2·d·L)L为层数文本数据573GPT​深度学习/推荐系统生成式预训练Transformer1. 模型架构使用Transformer解码器掩码自注意力确保只能看到左侧上下文。2. 预训练最大化似然L ∑_i log P(x_ix{i-k},...,x{i-1}; Θ)其中k为上下文窗口大小。3. 微调在标注数据集C上最大化似然L(C) ∑_{(x,y)} log P(yx)。通常将语言模型损失与辅助损失结合L_total L_C λ·L_ML其中L_ML是语言模型损失。4. 文本生成自回归生成每一步基于已生成序列生成下一个token。5. 零样本/少样本学习通过设计提示prompt让模型完成任务无需或只需少量示例。自回归、生成模型、提示学习预训练O(n^2·d·L)574MoE​深度学习/推荐系统混合专家模型1. 模型架构由多个专家网络和一个门控网络组成。给定输入x门控网络输出权重g(x)每个专家网络输出y_i最终输出y ∑i g_i(x)·E_i(x)。2. 门控网络通常使用softmaxg(x) softmax(W_g x)。3. 稀疏门控为了计算效率只激活top-k个专家。设激活的专家索引为TopK(g(x))则输出y ∑{i∈TopK(g(x))} g_i(x)·E_i(x)。4. 负载均衡引入辅助损失确保专家负载均衡。设每个batch中每个专家的负载为f_i ∑{x∈B} g_i(x)辅助损失L_balance ∑i f_i·log f_i。5. 总损失L L_task α·L_balance。6. 参数共享专家之间可共享部分参数如底层嵌入。条件计算、专家网络、负载均衡计算与激活的专家数相关大规模模型场景大规模推荐系统、语言模型需要处理多样化输入。方法将大模型分解为多个专家每个输入只激活部分专家平衡计算和模型容量。575DPR​深度学习/推荐系统双塔检索模型1. 模型架构查询编码器E_Q和文档编码器E_D将查询q和文档d分别映射为向量v_q E_Q(q)和v_d E_D(d)。2. 相似度sim(q,d) v_q^T v_d。3. 训练目标对比学习给定查询q正样本文档d^负样本文档d^-使用InfoNCE损失L -log exp(sim(q,d^)) / [exp(sim(q,d^)) ∑_{d^-} exp(sim(q,d^-))]。4. 负采样使用批量负采样同一个batch中的其他文档作为负样本和难负例挖掘。5. 索引用FAISS等工具为文档向量构建索引实现快速近似最近邻搜索。6. 训练技巧使用in-batch负采样、温度参数τ调节softmax平滑度。双塔模型、对比学习、近似最近邻训练O(batch_size·d)检索O(log N)查询-文档对场景搜索引擎、推荐系统召回阶段。方法将查询和文档编码为向量用向量相似度匹配适合大规模检索。576ColBERT​深度学习/推荐系统上下文化晚期交互BERT1. 模型架构使用BERT编码查询和文档得到每个token的嵌入。查询Q的嵌入矩阵E_Q∈ℝ^{m×d}文档D的嵌入矩阵E_D∈ℝ^{n×d}。2. 相似度计算对查询的每个token嵌入q_i计算与文档所有token嵌入的最大相似度然后求和S(Q,D) ∑{i1}^m max{j1}^n q_i^T d_j。3. 训练使用对比学习与DPR类似但相似度计算不同。4. 索引为文档的每个token嵌入建立索引检索时对查询的每个token进行最大相似度计算然后聚合。5. 压缩可使用量化或降维减少索引大小。6. 优点比双塔模型更精细的交互比交叉编码器更快。细粒度交互、最大相似度聚合、对比学习索引O(n·d)检索O(m·n·d)但优化查询-文档对场景搜索引擎、开放域问答需要细粒度匹配。方法在token级别进行交互平衡了精度和速度。577Poly-Encoder​深度学习/推荐系统多编码器1. 模型架构用Transformer编码候选文档用另一个Transformer编码查询但查询编码器输出多个向量通过多个可学习的编码向量称为code。2. 编码候选文档编码为向量c。查询编码用m个可学习的编码向量code与查询的token嵌入进行注意力聚合得到m个查询向量q_1,...,q_m。3. 交互计算每个查询向量与候选文档向量的注意力权重α_i softmax(q_i^T c)然后用这些权重对查询向量加权求和得到最终的查询表示q ∑_i α_i q_i。4. 相似度sim(q,c) q^T c。5. 训练对比学习类似DPR。6. 优点比双塔模型更强大比交叉编码器更快适合召回和粗排。多向量表示、注意力聚合、对比学习编码O((nm)·d^2)交互O(m·d)查询-文档对场景对话系统、推荐系统需要中等复杂度的交互。方法用多个向量表示查询与候选文档进行轻量级交互。578Deep Q-Network​强化学习/推荐系统深度Q网络1. Q学习Q(s,a) r γ max{a} Q(s,a)。用神经网络近似Q函数参数θ。2. 损失函数L(θ) E{(s,a,r,s)}[(r γ max_{a} Q(s,a;θ^-) - Q(s,a;θ))^2]其中θ^-为目标网络参数。3. 经验回放存储转移(s,a,r,s)到回放缓冲区训练时随机采样打破相关性。4. 目标网络使用另一个网络参数θ^-计算目标Q值定期更新θ^-θ。5. 探索使用ε-greedy策略以ε概率随机选择动作否则选择最大Q值的动作。6. 训练步骤- 初始化回放缓冲区D容量N。- 用随机权重初始化Q网络目标网络权重θ^-θ。- 每个episode初始化状态s。- 每个时间步以ε概率选择随机动作a否则aargmax_a Q(s,a;θ)。执行a得到r,s存储(s,a,r,s)到D。从D中采样一批数据用损失函数更新θ。每C步更新θ^-θ。Q学习、经验回放、目标网络训练取决于环境交互状态-动作-奖励场景游戏AI、机器人控制、动态推荐。方法用深度网络近似Q函数通过经验回放和目标网络稳定训练。579Policy Gradient​强化学习/推荐系统策略梯度1. 目标最大化期望回报J(θ)E_τ[R(τ)]其中τ为轨迹R(τ)为累积奖励。2. 策略梯度定理∇θ J(θ)E_τ[∑{t0}^{T-1} ∇_θ log π_θ(a_ts_t) Q^{π_θ}(s_t,a_t)]其中Q^{π_θ}是状态-动作值函数。3. REINFORCE算法使用蒙特卡洛采样估计Q值∇θ J(θ) ≈ ∑t ∇_θ log π_θ(a_ts_t) R_t其中R_t是t步后的累积奖励。4. 基线为减少方差引入基线b(s)常用状态值函数V(s)。∇θ J(θ) ≈ ∑t ∇_θ log π_θ(a_ts_t) (R_t - b(s_t))。5. 演员-评论家用神经网络近似策略演员和价值函数评论家。演员更新用策略梯度评论家更新用时序差分误差。6. 优势函数A(s,a)Q(s,a)-V(s)用估计的优势函数代替Q值。蒙特卡洛、基线、演员-评论家580PPO​强化学习/推荐系统近端策略优化1. 目标函数L(θ)E_t[min(r_t(θ)A_t, clip(r_t(θ),1-ε,1ε)A_t)]其中r_t(θ)π_θ(a_ts_t)/π_{θ_old}(a_ts_t)A_t是优势函数估计。2. 优势估计使用广义优势估计GAEA_t ∑{l0}^{∞} (γλ)^l δ{tl}其中δ_t r_t γV(s_{t1}) - V(s_t)。3. 价值函数损失L_V(θ) (V_θ(s_t) - V_t^{target})^2其中V_t^{target}是目标价值。4. 熵奖励增加策略熵鼓励探索L_total L_PPO - c_v L_V c_e H(π_θ)其中H是熵。5. 训练步骤- 用当前策略收集一批轨迹。- 计算优势估计和价值目标。- 对目标函数进行多轮小批量随机梯度上升。- 更新价值函数网络。6. 裁剪限制策略更新幅度确保新策略不偏离旧策略太远。信赖域、裁剪、广义优势估计每次迭代需收集完整轨迹以上是10个深度学习、推荐系统和强化学习算法的详细描述。接下来可以继续补充其他领域的算法如无监督学习、关联规则等。您希望继续补充哪些算法

相关文章:

​​【信息科学与工程学】【数据科学】数据科学领域 第十二篇 大数据主要算法08

大数据算法(531-540)编号算法名称算法类型算法/模型名称算法逐步推理思考的数学方程式/核心逻辑关联知识复杂度数据类型应用场景和应用方法531局部线性嵌入​无监督学习局部线性嵌入1. 算法目标:保持数据局部线性结构,将高维数据映…...

996合法性及全球工时调查:软件测试从业者的专业审视与未来展望

一场围绕代码与工时的全球对话当深夜的写字楼灯火通明,测试工程师仍在与一行行代码和层出不穷的Bug鏖战时,“996”早已不是某个行业或某个国家的孤立现象。它像一张无形的网,从中国的互联网大厂蔓延至硅谷的初创公司,将全球数以百…...

Go语言的runtime.GC生产环境

Go语言的runtime.GC生产环境解析 Go语言以其高效的垃圾回收机制(GC)闻名,尤其在生产环境中,runtime.GC的表现直接影响程序的稳定性和性能。本文将深入探讨Go语言runtime.GC在生产环境中的关键特性,帮助开发者更好地理…...

第7篇:抽象基类(ABC)与接口设计

为什么需要抽象基类? 在大型系统中,我们经常需要定义一组接口,要求子类必须实现某些方法。抽象基类(Abstract Base Class, ABC)正是为此而生。它可以: 定义抽象方法(没有实现的方法),强制子类实现。 禁止实例化不完整的类。 提供部分通用实现。 定义抽象基类 Python…...

测试工程师消亡论:人类堡垒——在自动化洪流中重铸价值高地

浪潮中的迷思在软件技术日新月异的演进中,一股名为“测试工程师消亡论”的思潮,如同幽灵般在行业上空徘徊。它伴随着自动化工具、人工智能乃至智能测试体的每一次重大突破而愈演愈烈。从自动化脚本替代重复劳动,到AI生成测试用例,…...

AI失业倒计时:2026岗位灭绝

站在质效革命的十字路口2026年,并非一个遥远的科幻节点,而是软件测试行业结构性变革的临界点。当AI从“辅助工具”进化为驱动测试流程的“基础架构”,一场关于岗位定义、核心价值与生存逻辑的深度重构正在悄然发生。对每一位软件测试从业者而…...

普通人也能部署的AI视频创作平台,3天上线一个AI短剧创作平台

零基础快速搭建指南,让AI帮你搞定视频创作温馨提示:文末有资源获取方式最近很多朋友问我:不懂技术能不能做个AI视频创作平台?答案是肯定的。今天就分享一套方案,普通人花3天时间就能上线属于自己的AI短剧创作平台。为什…...

AI短剧智能创作系统源码在哪里下载?

温馨提示:文末有资源获取方式最近不少做短视频的朋友问我,有没有能自动生成对话脚本、辅助创作的智能系统。其实市面上已经有类似工具了,只是很多人不知道去哪里找。今天分享一个我找到的资源。功能亮点实测下来,这套系统主要有这…...

微信AI智能客服源码 – 在哪里获取?怎么搭建?有什么好处?一篇讲透

温馨提示:文末有资源获取方式企业做客户服务,最头疼的问题无非几个:深夜咨询没人回、重复问题反复答、人工成本压不住。一套能724小时在线的AI智能客服系统,确实能解决不少实际问题。在哪里获取?目前市面上成熟的AI智能…...

实战部署AI智能客服源码系统 附带获取方式与搭建避坑指南

温馨提示:文末有资源获取方式近期帮客户部署了一套企业级的AI智能客服源码系统,过程颇有心得。这套系统基于PHP开发,完美解决了传统客服响应慢、无法7x24小时在线的痛点。下面把部署要点和避坑经验整理成列表,供大家参考。一、系统…...

Pixel手机玩机实战:从boot.img解包到Magisk修补的完整Root指南(附AIK-Linux工具避坑点)

Pixel手机深度Root指南:从boot.img解包到Magisk修补全流程 在Android玩机圈里,Google Pixel系列一直被视为"开发者友好型"设备的代表。作为原生Android的标杆,Pixel手机不仅拥有纯净的系统体验,更因其开放的Bootloader解…...

CSS 悬停箭头跳动问题的根源与稳定解决方案

按钮悬停时通过 :after 伪元素显示 font awesome 箭头,但鼠标移出瞬间箭头会短暂下移再消失——这是因 :hover 中意外触发 display: flex 导致布局重排所致,只需统一基础态与悬停态的 display 行为并强化垂直对齐即可彻底消除抖动。 按钮悬停时通过…...

如何用CoolProp在7天内掌握免费热力学物性计算?

如何用CoolProp在7天内掌握免费热力学物性计算? 【免费下载链接】CoolProp Thermophysical properties for the masses 项目地址: https://gitcode.com/gh_mirrors/co/CoolProp 还在为热力学计算中的物性数据发愁吗?面对昂贵的商业软件许可费&…...

StreamCap:开源自动化直播录制解决方案的技术实现与实践

StreamCap:开源自动化直播录制解决方案的技术实现与实践 【免费下载链接】StreamCap Multi-Platform Live Stream Automatic Recording Tool | 多平台直播流自动录制客户端 基于FFmpeg 支持监控/定时/转码 项目地址: https://gitcode.com/gh_mirrors/st/StreamC…...

别再乱删了!深入理解Adobe正版服务(AGSService)运行机制与安全移除指南

深入解析Adobe正版服务运行机制与安全处置方案 当你在深夜赶稿时突然弹出的红色警告窗口打断了创作流程,或是重要演示前跳出的正版验证提示打乱了节奏——这些由Adobe Genuine Software Integrity Service(简称AGSService)引发的突发状况&…...

手把手教你用MogFace人脸检测模型-large:从部署到检测全流程指南

手把手教你用MogFace人脸检测模型-large:从部署到检测全流程指南 1. 快速上手:MogFace是什么,为什么值得一试? 如果你正在寻找一个“靠谱”的人脸检测工具,那么MogFace-large绝对是一个绕不开的名字。简单来说&#…...

权力的本质,是他人对你的想象:神秘感,正是权力最廉价也最有效的燃料

权力的玻璃墙:为什么我们永远隔着一层看不见的距离 你有没有过这样的经历? 在公司待了三年,你连大老板的声音都没听过几次。他永远在那间关着门的独立办公室里,进出有秘书提前开路,开会只和总监以上的人说话。你对他的全部了解,来自于年会台上模糊的身影、内部邮件里的…...

Harness:2026年AI架构师必争的“系统层”战场!

最近多看几篇 Agent 文章,就会反复遇到同一个词:Harness。 但这个词越讲越糊。 有人把它理解成工具系统。有人把它理解成 Prompt 外面那层壳。也有人把它理解成多 Agent 编排、Memory、Sandbox、Hooks、Skills 这些东西的总和。 这些说法都沾边&#…...

AI正重构你的工作!这20个职业短期内难被替代,普通人如何提前布局?

近期多份权威报告指出,AI将重构而非替代人类工作。AI将冲击标准化内容生产、规则化数据分析和流程化客服支持等重复性岗位,同时催生人机协同管理、情感与关系型工作等新需求。AI难以替代共情、道德判断等能力突出的职业,如心理治疗师、法官、…...

赞电子商务歌(全文·完整版·深度解析)【乖乖数学】

赞电子商务歌(全文完整版深度解析)【乖乖数学】 作者:乖乖数学 时间:20260422 赞电子商务歌(全文完整版深度解析) 作者:乖乖数学(抖音名) 定位:七言古风文明史…...

基于全域数学的宇宙螺旋场统一结构研究【乖乖数学】

基于全域数学的宇宙螺旋场统一结构研究【乖乖数学】 作者:乖乖数学 时间:20260422根据您提供的文档《基于全域数学的宇宙螺旋场统一结构研究》,我为您总结其核心内容如下: 一、核心目标 该研究旨在打破物理学、化学和生物学之间的…...

Qualcomm QCX216 LTE Cat1 bis物联网调制解调器技术解析

1. Qualcomm QCX216 LTE Cat1 bis物联网调制解调器深度解析在物联网设备爆炸式增长的今天,低功耗、高性价比的无线连接方案成为行业刚需。Qualcomm最新推出的QCX216 LTE Cat1 bis调制解调器芯片,正是瞄准了这一市场空白。作为一线物联网方案开发者&#…...

量子纠错解码器:速度与精度的动态平衡方案

1. 量子纠错解码器的核心挑战 在构建实用化容错量子计算机的道路上,量子纠错(QEC)技术扮演着关键角色。作为QEC系统的核心组件,实时解码器负责持续处理量子设备产生的纠错数据(称为"症候群")&…...

Beelink SER5迷你主机评测:性能与扩展性解析

1. 硬件开箱与配置解析 Beelink SER5作为一款搭载AMD Ryzen 5 5600H处理器的迷你主机,其硬件配置在同类产品中颇具竞争力。整机尺寸仅为12611342mm(4.964.451.65英寸),采用金属外壳设计,既保证了散热性能又兼顾了美观度…...

如何在Windows上免费转换7种音频格式:FlicFlac终极指南

如何在Windows上免费转换7种音频格式:FlicFlac终极指南 【免费下载链接】FlicFlac Tiny portable audio converter for Windows (WAV FLAC MP3 OGG APE M4A AAC) 项目地址: https://gitcode.com/gh_mirrors/fl/FlicFlac 还在为不同设备间的音频格式兼容性问…...

1×1卷积:深度学习中的通道操作利器

1. 为什么我们需要11卷积?在深度学习模型设计中,参数量和计算复杂度一直是工程师们需要平衡的关键因素。2014年,Google的研究团队在Inception网络中首次引入了11卷积的概念,这个看似简单的操作实则蕴含着精妙的设计思想。我第一次…...

LosslessCut:3个核心功能重塑你的视频剪辑工作流

LosslessCut:3个核心功能重塑你的视频剪辑工作流 【免费下载链接】lossless-cut The swiss army knife of lossless video/audio editing 项目地址: https://gitcode.com/gh_mirrors/lo/lossless-cut 还在为视频剪辑的繁琐流程和画质损失而烦恼吗&#xff1f…...

Linux proc sysfs与devfs 虚拟文件系统解析

Linux_proc_sysfs与devfs_虚拟文件系统解析 本文说明 Linux 中三类常见伪文件系统(内存中由内核呈现、不占用块设备上常规文件空间)的定位与差异:proc、sysfs,以及已基本退出主流的 devfs 及其替代路径。读者具备基础 Shell 与系…...

Flutter 鸿蒙应用AR功能集成实战:多平台AR框架+模拟模式,打造增强现实体验

Flutter 鸿蒙应用AR功能集成实战:多平台AR框架模拟模式,打造增强现实体验 欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.csdn.net📄 文章摘要 本文为 Flutter for OpenHarmony 跨平台应用开发任务 41 实战教程&a…...

FEBio生物力学模拟中缓存性能优化策略

1. 缓存性能对FEBio生物力学模拟的影响机制在生物力学有限元分析领域,FEBio作为主流仿真工具,其性能表现与底层硬件架构的匹配度密切相关。通过gem5仿真平台对6种典型FEBio工作负载(ar、co、dm、ma、rj、tu)的测试数据显示&#x…...