当前位置: 首页 > article >正文

群论与张量积:构建等变神经网络的核心原理与实践

1. 项目概述当AI遇见数学的优雅如果你在深度学习的海洋里游过泳大概率听过“卷积神经网络CNN在处理图像时具有平移不变性”这种说法。这听起来很酷但你是否想过这种“不变性”从何而来它仅仅是卷积操作的一个巧合特性还是背后有一套更深刻、更普适的数学语言在支撑更进一步我们能否设计出对旋转、缩放甚至更复杂变换也“免疫”的神经网络这正是“从对称性到等变性”这个主题试图回答的核心问题。简单来说这个项目探讨的是如何将数学中一个古老而优美的分支——群论与现代人工智能的核心——深度学习进行一场深刻的联姻。我们不再满足于让网络“经验性”地获得某些性质而是希望从第一性原理出发通过数学来“规定”网络应该具备怎样的对称性。这里的“对称性”是广义的可以是物理定律在时空变换下的不变性也可以是分子结构在旋转下的不变性甚至是棋盘游戏规则在棋子置换下的不变性。而“等变性”则是比“不变性”更一般、更强大的概念它要求网络的输出能随着输入的变化而进行一种“协调一致”的变换。想象一下你要训练一个模型来预测一个蛋白质分子的能量。一个理想的模型应该具备这样的性质当你把整个分子在三维空间中旋转一个角度后模型预测的能量值应该保持不变不变性而模型预测的、与方向相关的力或偶极矩等向量输出也应该同步地旋转相同的角度等变性。传统网络很难保证这一点它们可能会将旋转后的分子误认为是一个全新的样本。而基于群论与张量积原理构建的等变神经网络其结构本身就被数学所约束天生具备这些正确的变换性质。这意味着我们需要更少的训练数据因为模型无需从数据中费力学习这些基础对称性获得更好的泛化能力并且其预测结果在物理上或几何上是自洽的。这不仅仅是理论上的空中楼阁。从AlphaFold2革命性地预测蛋白质结构到材料科学中发现新催化剂再到机器人感知中对三维点云的鲁棒处理等变神经网络正成为AI赋能科学发现AI for Science领域最强大的引擎之一。它要求我们跳出堆叠层数和调参的范式回归到数学的本质去设计网络的“灵魂”。接下来我将带你深入这个迷人的交叉领域拆解其核心思想、数学工具与实现细节。2. 核心思想对称性如何编码进神经网络2.1 从直观对称性到抽象“群”我们首先需要将直觉中的“对称”转化为数学中精确的“群”。2.1.1 什么是“对称”一个操作而非状态对称不是一个静态的属性而是一个“操作”或“变换”。说一个正方形是“对称的”实际上是指存在一系列操作比如旋转0°、90°、180°、270°以及关于几条轴线的翻转使得在这些操作之后正方形看起来和原来一模一样。这些操作的集合连同“先做操作A再做操作B”这种组合规则就构成了一个数学结构——群。一个群G必须满足四个条件封闭性两个操作组合后仍是群内操作、结合律、存在单位元一个“什么都不做”的操作、每个操作都存在逆操作能抵消该操作的效果。以二维平面的旋转为例所有绕原点旋转的角度θ构成了一个群称为旋转群SO(2)。旋转90°就是一个群元素它的逆操作是旋转-90°或270°。2.1.2 网络层的变换表示论登场现在我们考虑神经网络中的一层。假设输入是一个向量x经过一层线性变换权重矩阵W和激活函数得到输出y。如果我们对输入施加一个对称变换g例如旋转输入变成了ρ_in(g)x这里ρ_in(g)就是一个矩阵它描述了在输入空间里变换g是如何作用在向量x上的。这个将群元素g映射为矩阵ρ(g)的映射就称为群的表示。一个核心问题是当输入变换后输出会怎样我们最希望看到两种情况不变性输出完全不变。即y f(x) f(ρ_in(g)x)。这对于分类任务如图像分类无论猫在图片的左边还是右边它都是猫是终极目标。等变性输出以一种协调的方式同步变换。即存在输出空间的表示ρ_out(g)使得f(ρ_in(g)x) ρ_out(g) f(x)。这对于预测向量场如物理力场、速度场或几何结构至关重要。传统全连接层是“盲目”的它不保证任何等变性。卷积神经网络在平移变换下是等变的严格说是“协变的”这是因为卷积核的权重共享机制在数学上恰好与平移群的表示相匹配。而我们要做的是将这种“恰好匹配”推广到任意群。2.2 等变性的实现基石张量积与克莱布什-戈登系数如何系统性地构建一个保证等变性的线性层答案是使用张量积和克莱布什-戈登Clebsch-Gordan系数。2.2.1 张量积组合特征的变换规则在深度学习中我们经常需要组合不同特征。例如将上一层的多个特征图拼接或相加。在群表示下这些特征可能属于不同的“表示空间”。张量积⊗提供了一种将两个表示空间V和W组合成一个更大空间V⊗W的方法。关键在于新空间在群变换下的行为是由原始两个空间的表示共同决定的。如果V的变换矩阵是ρ_V(g)W的是ρ_W(g)那么在张量积空间V⊗W中变换矩阵是ρ_V(g) ⊗ ρ_W(g)这是克罗内克积。然而这个张量积表示通常是“可约的”意味着它可以被分解为多个“不可约表示”的直和。不可约表示是构建群表示的“原子”或基本构件就像基本粒子一样。2.2.2 克莱布什-戈登系数张量积的分解指南克莱布什-戈登系数正是描述了张量积分解的“配方”。它告诉我们如何将张量积空间V⊗W中的向量投影到各个不可约表示子空间上。在物理中这对应着角动量耦合在等变网络中这对应着如何组合特征才能保持变换规则清晰。一个等变线性层L其核心约束是必须与群作用“交换”ρ_out(g) L L ρ_in(g)。舒尔引理告诉我们满足这种交换性的线性映射其矩阵形式在不可约表示基下具有非常特殊的结构——它本质上是多个克莱布什-戈登系数张成的空间中的元素。这意味着等变层的可学习权重不再是任意的矩阵而是被约束在由CG系数定义的一个低维子空间里。权重矩阵的每个“块”都对应着从输入不可约表示到输出不可约表示的一种特定耦合方式。实操心得理解这一点是跨越理论到实践的关键。你不再学习一个完整的权重矩阵W∈R^(m×n)而是学习一组系数{k_j}然后通过CG系数将这些系数“膨胀”成实际的权重矩阵W Σ_j k_j * CG_j。这极大地减少了参数数量并将对称性硬编码进了网络结构。3. 核心架构等变神经网络的构建模块理解了数学原理我们来看如何用它们像搭乐高一样构建网络。以处理三维点云或分子的SE(3)-等变网络特殊欧几里得群包含旋转和平移为例。3.1 输入与特征类型不可约表示下的标量、向量与高阶张量在三维空间中最基本的不可约表示是类型-0 (l0)标量。在旋转下不变。例如原子的电荷、质量、元素类型。类型-1 (l1)向量。在旋转下像普通三维向量一样变换。例如力、速度、偶极矩。类型-2 (l2)无迹对称张量。在旋转下有更复杂的变换规则。例如四极矩、应力张量。类型-l (l2)更高阶的球谐张量。网络的每一层其输入和输出都不是单一的特征图而是一个特征“场”的集合。例如一个特征可能包含(类型-0标量, 类型-1向量, 类型-2张量)三个部分每个部分都有自己的通道数。这被称为o3.Irreps对象以e3nn库为例。3.2 核心层设计3.2.1 等变线性层 (Linear)这是最基础的层。如前所述它的权重矩阵由CG系数约束。在实现中你需要指定输入和输出的不可约表示类型Irreps。层内部会自动计算所有允许的(l_in, l_out)耦合并为每个耦合分配一个可学习的权重标量。前向传播时根据输入特征的类型通过CG系数进行缩并得到等变的输出。3.2.2 等变激活函数 (Activation)这是一个难点。标准的ReLU等逐点激活函数会破坏等变性。解决方案是门控非线性。Tensor Product Nonlinearity将特征分为两部分(可门控部分, 门控部分)。通过张量积将两者耦合产生新的不可约表示特征然后用一个以门控部分为输入的标量函数如Sigmoid去调制门控新特征。这个过程本身是等变的。Norm-based Activation计算每个不可约表示特征的范数标量旋转不变然后用一个MLP处理这些范数产生标量增益乘回原特征。这保持了特征的变换类型。3.2.3 等变张量积层 (Tensor Product)这是网络的“灵魂”负责特征间的交互。它显式地计算两个特征流之间的张量积并按CG系数分解到指定的输出类型。它可以用于模拟原子间的相互作用如两个原子的特征相互作用产生作用于第三个原子的消息。其参数化方式通常是通过一个MLP根据输入特征或原子间距离来生成张量积的耦合系数。3.2.4 等变归一化 (Norm Pooling / Batch Norm)等变版本的池化或批归一化需要小心处理。全局池化通常取每个不可约表示特征的范数得到旋转不变的标量。等变批归一化则是对每个通道、每个不可约表示类型单独计算统计量均值、方差因为不同类型在旋转下行为不同不能混在一起归一化。3.3 一个简单的SE(3)-等变网络流程示例假设我们要预测一个分子中每个原子所受的力向量类型-1。输入编码每个原子i有初始特征原子类型编码为类型-0标量、位置类型-1向量但位置本身不是平移等变的通常处理相对位置。构建邻接图基于原子距离构建局部邻域。等变卷积/消息传递 a. 对于边(i, j)计算相对位置向量r_ij类型-1。 b. 将r_ij用球谐函数Y^l_m投影得到一组球谐特征类型-l这是旋转等变的。 c. 将中心原子i的特征h_i和邻居原子j的特征h_j与球谐特征进行等变张量积生成一条从j到i的“消息”m_ij。这个过程是等变的。 d. 对所有邻居的消息进行等变聚合求和更新原子i的特征。多层堆叠重复步骤3多次让信息在图中传播。输出头最后将每个原子的高阶特征通过一个等变线性层映射到目标输出类型如类型-1的力。由于网络始终是等变的因此当整个分子被旋转后输入的相对位置向量r_ij会同步旋转经过所有等变操作最终输出的力也会同步旋转相同的角度——这就是等变性的保证。注意事项平移不变性的处理通常是通过始终使用相对坐标r_ij并且在消息聚合等操作中不引入绝对位置来实现的。力的预测还需要满足能量守恒即力是势能的负梯度。这可以通过将网络构造成直接预测标量能量E然后通过自动微分求力F_i -∇_i E来实现这样自动保证了力的旋转等变性和平移不变性。4. 实现细节与工具链理论很优美但实现需要可靠的库。以下是当前主流的工具栈。4.1 主流框架与库e3nn (PyTorch)这是该领域的先驱和事实标准。它提供了o3.Irreps核心数据类型以及一整套等变线性层、张量积、球谐函数、网络示例。它的API相对底层但非常灵活和强大。是进行研究和实现新想法的首选。DeePMD-kit / TensorFlow专注于分子动力学其嵌入网络部分使用了等变思想但进行了高度优化和定制更适合大规模分子模拟生产环境。NequIP基于e3nn构建提出了目前最先进的等变网络架构之一在分子势能预测上取得了SOTA结果。其代码是学习如何构建完整等变网络模型的优秀范例。SE(3)-Transformers / DiffDock将等变性与注意力机制结合用于蛋白质-配体对接等任务。对于初学者强烈建议从e3nn开始并结合NequIP的代码进行学习。4.2 关键参数与配置解析构建一个等变网络你需要做出以下关键设计选择4.2.1 不可约表示的选择 (Irreps)这是网络容量的核心。例如”128x0e 64x1o”表示有128个偶标量类型-0和64个奇向量类型-1。e(偶)和o(奇)代表在空间反演宇称下的行为。选择多大的“l”和多宽的通道数取决于任务的复杂性。预测能量可能只需要l0预测力需要l1预测极化率可能需要l0,1,2。通常从较小的l_max如2开始。4.2.2 球谐函数截断l_max在将相对方向r_ij投影到球谐特征时需要决定用到几阶球谐函数。l_max越大对方向的分辨率越高但计算量和参数也会急剧增加复杂度~O(l_max^3)。对于分子系统l_max2或3通常足够。4.2.3 张量积的路径控制并非所有输入-输出类型的耦合都是必要的。e3nn允许通过irreps_in1, irreps_in2, irreps_out和筛选规则来精确控制哪些耦合路径是激活的这可以大幅减少计算量。4.2.4 归一化与初始化等变网络的初始化至关重要。由于权重结构特殊不能直接用标准初始化。e3nn提供了专用的初始化方法如uniform。等变批归一化也需要使用库中提供的特殊层。4.3 一个简单的代码片段示例以下是一个使用e3nn构建一个简单等变层的概念性代码import torch import e3nn.o3 as o3 from e3nn.nn import FullyConnectedNet # 1. 定义输入和输出的不可约表示 irreps_in o3.Irreps(16x0e 8x1o) # 16个标量8个向量 irreps_out o3.Irreps(32x0e 16x1o) # 32个标量16个向量 # 2. 创建一个等变线性层 linear o3.Linear(irreps_inirreps_in, irreps_outirreps_out) # 3. 创建一个等变张量积层用于特征交互 # 首先定义一个计算耦合权重的MLP tp o3.FullyConnectedTensorProduct( irreps_in1irreps_in, irreps_in2irreps_in, # 例如自交互 irreps_outirreps_out, internal_weightsFalse, shared_weightsFalse, ) # 需要一个权重生成网络例如基于距离标量 weight_net FullyConnectedNet([1, 16, 64, tp.weight_numel], torch.relu) # 在前向传播中 # x: 输入特征 shape [batch, node, irreps_in.dim] # scalar_feat: 例如原子间距离 shape [batch, edge, 1] def forward(x, scalar_feat): # 等变线性变换 h linear(x) # 生成张量积的权重 weights weight_net(scalar_feat) # 执行等变张量积这里简化了实际需要边索引等 h tp(h, h, weightweights) return h5. 实战挑战与调优经验纸上得来终觉浅在实际项目中你会遇到一系列教科书上不会提的问题。5.1 常见问题与排查清单问题现象可能原因排查与解决方案训练损失震荡或不下降学习率过高初始化不当等变性约束导致梯度流异常。1. 使用e3nn提供的专用初始化。2. 将学习率调至非常低如1e-4开始尝试。3. 使用梯度裁剪。4. 验证网络等变性见下。模型输出完全为零或常数激活函数饱和或选择不当最后一层输出类型设置错误。1. 检查门控激活函数的门控信号是否正常。2. 确保输出层的Irreps与任务目标匹配如预测力必须是”n x 1o”。3. 检查是否有层意外地将特征归一化为零。计算速度极慢内存占用高l_max设置过高张量积路径未优化使用了密集的邻接图。1. 降低l_max从1或2开始。2. 使用e3nn的TensorProduct时仔细筛选耦合路径。3. 使用截断距离构建稀疏的原子邻接图而非全连接。4. 使用torch_geometric等图神经网络库高效处理稀疏消息传递。无法复现论文结果不可约表示配置、隐藏层维度、l_max等超参数未对齐数据预处理或分割方式不同。1. 仔细阅读论文附录和官方代码。2. 核心是Irreps配置、球谐函数阶数、网络深度。3. 检查是否使用了相同的特征编码如原子嵌入。等变性数值测试失败实现中存在bug使用了非等变的操作如误用绝对坐标。必须进行等变性测试随机生成旋转矩阵R计算output_rotated model(rotate_inputs(data, R))和rotate_outputs(model(data), R)两者应几乎相等误差在1e-5量级。从数据加载器开始逐层检查。5.2 性能与精度调优心得从小开始逐步放大先从l_max1很小的隐藏层如”32x0e16x1o”和浅层网络2-3层开始。确保模型能过拟合一个小数据集并且等变性测试通过。然后再逐步增加容量。关注标量通路在许多科学任务中标量信息如原子类型、距离是基础。确保你的网络有足够强大的标量特征提取和交互能力。门控激活函数中的标量门控网络可以设计得复杂一些如2层MLP。残差连接至关重要等变网络也可以很深。在消息传递层或块之间添加残差连接能极大改善训练稳定性和性能。可以使用o3.Linear将输入Irreps映射到输出Irreps来实现等变残差。谨慎使用高阶表示l2以上的高阶张量计算开销大且不一定带来显著收益。除非任务明确需要如预测极化率张量否则优先通过堆叠更多层和使用标量/向量交互来提升表达能力。利用预训练与迁移在大型数据集如QM9上预训练一个通用的等变原子势能模型然后在下游小数据集上进行微调往往比从头训练效果更好。等变特征本身就具有很好的可迁移性。5.3 等变性的验证不可或缺的一步编写一个简单的测试函数是开发过程中最重要的实践。def test_equivariance(model, batch, rtol1e-4, atol1e-5): 测试模型在随机旋转下的等变性 model.eval() with torch.no_grad(): # 1. 正常前向传播 out model(batch) # 2. 生成一个随机旋转矩阵 R o3.rand_matrix() # 3. 旋转输入数据注意只旋转向量类型的特征如位置、力 batch_rotated rotate_batch(batch, R) # 需要自定义此函数 out_rotated model(batch_rotated) # 4. 旋转原始输出 out_rotated_by_R rotate_output(out, R) # 需要自定义此函数 # 5. 比较 diff (out_rotated - out_rotated_by_R).abs().max().item() if diff atol or torch.allclose(out_rotated, out_rotated_by_R, rtolrtol, atolatol): print(f等变性测试通过最大误差: {diff:.2e}) return True else: print(f等变性测试失败最大误差: {diff:.2e}) return False这个测试应该在模型架构发生任何更改后运行确保等变性的核心承诺没有被破坏。从对称性到等变性将群论与张量积原理融入AI设计是一场从“数据驱动”到“第一性原理数据驱动”的范式转变。它要求开发者具备更深的数学直觉但回报是更强大、更数据高效、更可信的模型。最初的实现可能会让你感到棘手调试等变性错误也充满挑战但一旦你掌握了这套“语言”你便获得了一种全新的、更本质的视角来理解和构建智能系统。这不仅仅是解决了一个工程问题更是让AI模型学会了尊重物理世界的基本法则。

相关文章:

群论与张量积:构建等变神经网络的核心原理与实践

1. 项目概述:当AI遇见数学的优雅 如果你在深度学习的海洋里游过泳,大概率听过“卷积神经网络(CNN)在处理图像时具有平移不变性”这种说法。这听起来很酷,但你是否想过,这种“不变性”从何而来?它…...

CANN/hcomm pre-commit 使用指导

pre-commit 工具使用指导 【免费下载链接】hcomm HCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。 项目地址: https://gitcode.com/cann/hcomm 概述 pre-commit 是一个 Git Hooks 框架&#xff0…...

第 2 章 C++ 基础语法

第 2 章 C++ 基础语法 目录介绍 2.1 C++快速介绍 2.1.1 C++语言介绍 2.1.2 C++的特点 2.1.3 C++标准库 2.1.4 C++应用领域 2.1.5 C++的版本 2.1.6 综合案例与思考 2.2 C++编译器...

口碑好的四川别墅电梯哪家专业

在选择别墅电梯时,许多业主都会把“口碑”作为重要的参考标准。毕竟电梯是日常频繁使用的家庭设备,它既要承载家人的安全,也要融入家的氛围。在四川本地,有一家深耕别墅电梯多年的企业——四川西子奥通电梯有限公司,凭…...

通过curl命令诊断大模型API连接与返回问题

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 通过curl命令诊断大模型API连接与返回问题 当你在集成大模型服务时遇到问题,无论是调用失败、返回异常还是响应缓慢&am…...

泰山派3M-RK3576-镜像烧录-成品镜像烧录

【立创泰山派3-RK3576开发板】成品镜像烧录 什么是成品镜像 简单来说就是一个 .img 就是完整的系统镜像,烧录这一个就可以完整的运行系统,这样的镜像叫做成品镜像。 这样的镜像体积都比较大,但胜在烧录方便。 例如:update.img…...

对比多个模型 API 供应商后我为何选择 Taotoken 作为主用平台

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 对比多个模型 API 供应商后我为何选择 Taotoken 作为主用平台 作为个人开发者,在构建需要集成大语言模型能力的应用时&…...

AI应用上线前必做的5项安全验证:基于SITS2026标准的CI/CD嵌入式检测清单

更多请点击: https://intelliparadigm.com 第一章:SITS2026标准的演进逻辑与AI原生安全范式转型 SITS2026并非对传统信息安全标准的简单迭代,而是以AI系统全生命周期为锚点,重构信任边界、责任归属与验证机制的范式跃迁。其核心驱…...

CANN/ops-fft快速安装指南

环境部署 【免费下载链接】ops-fft ops-fft 是 CANN (Compute Architecture for Neural Networks)算子库中提供 FFT 类计算的基础算子库,采用模块化设计,支持灵活的算子开发和管理。 项目地址: https://gitcode.com/cann/ops-ff…...

机电系统开发中的接口控制文档(ICD)与工具链构建

1. 接口控制文档(ICD)深度解析 接口控制文档(Interface Control Document, ICD)是机电系统开发中确保各组件协同工作的核心规范文件。与单纯定义单一组件功能的技术规格书不同,ICD专门规范不同系统单元之间的交互规则。…...

数据资源:中国极端高温热浪人口暴露数据集(2000、2010、2020)

中国极端高温热浪人口暴露数据集(2000、2010、2020) 为解决气象栅格数据与社会经济行政单元存在的尺度错位问题,本研究整合MERRA-2再分析资料与多源人口普查数据,研发了中国极端高温热浪人口暴露数据集(2000、2010、20…...

Arm Neoverse V2处理器指令异常与性能优化解析

1. Arm Neoverse V2处理器指令异常深度解析在现代处理器架构设计中,指令执行异常是工程师们必须面对的挑战之一。Arm Neoverse V2作为面向基础设施的高性能处理器,其微架构设计在追求极致性能的同时,也不可避免地会遇到各种边界条件下的执行异…...

Ollama+OpenClaw一键重启脚本使用说明

OllamaOpenClaw一键重启脚本使用说明 Windows 一键清理端口、杀死残留进程、重启 Ollama OpenClaw 服务,开箱即用 📥 配套文件 你可以搭配本说明文档,使用配套的一键重启脚本,无需手动操作,双击即可完成服务重启。 …...

CANN/cannbot-skills Attention-Only模板

Attention-Only Scope 模板 【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。 项目地址: https://gitcode.com/cann/cannbot-skills 本模板提供仅将 Attention 模块纳入 Super…...

CANN HIXL KV缓存池化传输

HIXL、Mooncake与vLLM的KV Cache池化与传输 【免费下载链接】cann-learning-hub CANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。 项目地址: https://gitcode.com/cann/cann-learnin…...

CANN双三次抗锯齿上采样算子

aclnnUpsampleBicubic2dAA 【免费下载链接】ops-cv 本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-cv 📄 查看源码 产品支持情况 产品是否支持Ascend 950PR/Ascend 950…...

终极鼠标性能测试指南:3步精准评估您的设备表现

终极鼠标性能测试指南:3步精准评估您的设备表现 【免费下载链接】MouseTester 项目地址: https://gitcode.com/gh_mirrors/mo/MouseTester 想要知道您的鼠标是否真的物有所值?MouseTester——这款专业级鼠标性能测试工具,为您提供精确…...

CANN/ops-math填充算子文档

aclnnInplaceFillScalar 【免费下载链接】ops-math 本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-math 📄 查看源码 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atla…...

苹果手机扣图片换背景用什么工具?2026年最实用的免费抠图方案

最近有很多小伙伴问我,用苹果手机怎样才能快速扣图换背景。说实话,这个问题我也被问过不少次,尤其是在做证件照、商品摄影或者简单的图片编辑时,一款好用的抠图工具真的能省不少事儿。今天我就把自己用过的各种方案都整理出来&…...

CANN学习中心仓技能集合

Skills - CANNBot 技能集合 【免费下载链接】cann-learning-hub CANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。 项目地址: https://gitcode.com/cann/cann-learning-hub 本目…...

Windows系统opencl.dll文件丢失无法启动程序解决

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…...

如何两台atlas-a2服务器物理机,基于vllm-ascend部署qwen3.5 397b-w8a8-mtp大模型

配置 两台8*64的昇腾910b4服务器物理机,未做任何虚拟化,已经通过交换机进行互联 模型和镜像下载 模型: https://modelscope.cn/models/Eco-Tech/Qwen3.5-35B-A3B-w8a8-mtp 镜像(不是openeuler系统就下不带openeuler的&#xff…...

CANN/ops-math裁剪算子下限函数

aclnnClampMin 【免费下载链接】ops-math 本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-math 📄 查看源码 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练…...

CANN/catlass Block Mmad基础模板

Block Mmad基础模板 【免费下载链接】catlass 本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。 项目地址: https://gitcode.com/cann/catlass 代码位置 [TOC] BlockMmad 功能说明 block层级mmad计算,非TLA实现&am…...

CANN/cann-recipes-infer:在昇腾Atlas A2/A3环境上适配SANA-Video模型的推理

在昇腾Atlas A2/A3环境上适配SANA-Video模型的推理 【免费下载链接】cann-recipes-infer 本项目针对LLM与多模态模型推理业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-infer SANA-Video模型是一…...

CANN/ge SetInitParam函数文档

SetInitParam 【免费下载链接】ge GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前…...

Q2夏季热门选品指南——Shopee东南亚站点适用

看了TikTokShop东南亚发的Q2的选品指南,感觉咱们做Shopee虾皮的也可以用,分享一下,大家可以也可以参考看看效果怎么样。Q2就是4-6月这个期间,夏季东南亚肯定是温度很高的,而且这期间节假日多,所以眼镜防晒这…...

Blender骨骼次级动画插件WiggleBone:原理、参数与实战指南

1. 项目概述与核心价值如果你在寻找一个能让你在3D建模或游戏开发中,为骨骼动画添加“灵魂”的工具,那么detomon/wigglebone这个项目绝对值得你花时间深入研究。简单来说,它是一个为 Blender 设计的插件,专门用来模拟骨骼的次级动…...

3个关键步骤:用Video DownloadHelper CoApp彻底解决视频下载难题

3个关键步骤:用Video DownloadHelper CoApp彻底解决视频下载难题 【免费下载链接】vdhcoapp Companion application for Video DownloadHelper browser add-on 项目地址: https://gitcode.com/gh_mirrors/vd/vdhcoapp 还在为无法下载网页视频而烦恼吗&#x…...

CANN/hixl HIXL接口文档

HIXL接口 【免费下载链接】hixl HIXL(Huawei Xfer Library)是一个灵活、高效的昇腾单边通信库,面向集群场景提供简单、可靠、高效的点对点数据传输能力。 项目地址: https://gitcode.com/cann/hixl 产品支持情况 产品是否支持Ascend …...