当前位置: 首页 > article >正文

CANN/hccl故障诊断定位思路

定位思路【免费下载链接】hccl集合通信库Huawei Collective Communication Library简称HCCL是基于昇腾AI处理器的高性能集合通信库为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl应知应会在故障定位之前请确保您已熟悉HCCL相关基本概念及故障定位辅助功能。对于HCCL来说故障码会涵盖大部分常见问题如果报错中未包含故障码信息或故障码信息为EI9999可能为较为少见的故障场景或HCCL内部问题请基于实际的CANN日志和代码进行分析如果无法解决请联系技术支持。对于没有清晰首报错的问题大集群故障定位时需要梳理每个rank的行为通过rank之间的依赖关系找到根节点。面对这个难题HCCL提供了建链根节点定位能力和集群心跳能力并会在常见问题中给出诊断结果相关原理请参见建链失败定位思路、集群心跳机制 。本文档适用场景如下本文档对HCCL的实现机制的描述仅用于解释各类故障模式机理辅助分析故障现象和定位原因。如果在运行机制方面的内容和该机制相关介绍文档不符请优先参考运行机制对应文档。本文档中的部分CANN日志示例随着版本更新内容会有所调整用户可重点关注日志中的关键信息如有较大的差异请以实际的日志信息为准。当业务发生HCCL异常时在CANN日志中会有HCCL组件的报错日志信息若在CANN日志中没有发现HCCL组件的报错日志需排查是否有其他组件的报错信息若无报错请注意训练脚本本身有无异常、是否存在core dump或进程卡住等异常情况。故障诊断相关环境变量HCCL_CONNECT_TIMEOUT、HCCL_EXEC_TIMEOUTHCCL在建链阶段和执行阶段的超时时间建议HCCL_CONNECT_TIMEOUT配置的时间小于HCCL_EXEC_TIMEOUT配置的时间以保证复杂场景下能够正确的上报首报错信息以区分异常业务进程被阻塞的原因是本端还是远端。HCCL_ENTRY_LOG_ENABLEHCCL算子级入参记录开关如果集群行为一致性问题无法通过其他手段锁定异常原因时可以使能此环境变量记录不同rank上的集合通信行为通过卡间横向比对辅助找到行为差异引入点。HCCL_DEBUG_CONFIGHCCL模块级日志开关进行算子开发调试时可以通过此配置分析算子内部的算法选择、任务编排等日志信息。该环境变量仅支持以下产品Atlas A3 训练系列产品/Atlas A3 推理系列产品Atlas A2 训练系列产品/Atlas A2 推理系列产品HCCL_DFS_CONFIGHCCL高级故障探测配置能力详见环境变量说明建议保持默认值。该环境变量仅支持以下产品Atlas A3 训练系列产品/Atlas A3 推理系列产品Atlas A2 训练系列产品/Atlas A2 推理系列产品HCCL相关日志说明HCCL的日志信息会记录在CANN日志中CANN的相关日志说明请参考《日志参考》。当HCCL报错时会在CANN日志的debug目录下打印关键的故障信息同时在使用部分训练框架的业务场景下HCCL也会在业务的日志中打印关键的报错信息HCCL在CANN日志的run目录下会默认记录一些关键运行日志如通信域的初始化与析构默认打印、通信算子的下发需开启HCCL_ENTRY_LOG_ENABLE环境变量等关键日志示例如下通信域初始化Entry-HcclGetRootInfo:rootInfo[0x7fffcd65f130], deviceLogicId[0] Entry-HcclCommInitRootInfoConfigInner:ranks[16], rank[0], rootinfo: host ip[127.10.0.1] port[60000] nicDeploy[1] identifier[group_name_0], deviceLogicId[0]ranks通信域大小。rank当前rank在通信域内的rank编号。rootinforoot节点的信息。identifier通信域名。通信域析构Entry-HcclCommDestroy: op_base comm destroy begin通信算子下发需开启HCCL_ENTRY_LOG_ENABLE环境变量Entry-HcclAllReduce: tag[AllReduce_127.10.0.1%eth1_30000_0_1736576907435382], sendBuf[0x12e7bf550000], recvBuf[0x12e7bf550000], count[531260224], dataType[float32], op[sum], localRank[0], streamId[5],comm[0x331c9c00], deviceLogicId[0]tag通信算子标识符。sendBuf输入数据地址指针。recvBuf输出数据地址指针。count数据量。dataType数据类型。opreduce计算类型。localRank本端rank号。streamId通信算子执行流。comm通信域指针。deviceLogicid通信算子下发的设备逻辑ID。为了方便快速检索和识别通信域及本端的相关信息HCCL提供了快速检索关键字Communicator Key Info和LocalRank Key Info。例如执行grep -r Communicator Key Info得到以下信息run/plog/plog-858941_20251210195327204.log:[INFO] HCCL(858941,all_reduce_test):2025-12-10-19:53:28.131.350 [hccl_communicator_attrs.cc:327] [858941][Communicator Key Info]identifier[127.0.0.1%enp_60000_0_1765367607599032] rankSize[8] serverNum[1] moduleNum[1] superPodNum[0] multiModuleDiffDeviceNumMode[0] multiSuperPodDiffServerNumMode[0]通信域关键信息identifier[通信域名]、rankSize[通信域大小]、serverNum[通信域内节点数]、moduleNum[通信域内模组个数]、superPodNum[通信域内超节点个数]、multiModuleDiffDeviceNumMode[是否模组间卡数不一致]、multiSuperPodDiffServerNumMode[是否超节点间节点数不一致]信息中“1”表示是“0”表示否。例如执行grep -r LocalRank Key Info得到以下信息run/plog/plog-858941_20251210195327204.log:[INFO] HCCL(858941,all_reduce_test):2025-12-10-19:53:28.131.357 [hccl_communicator_attrs.cc:330] [858941][LocalRank Key Info]userRank[6] hostIp[127.0.0.1] devicePhyId[6] server[127.0.0.1] deviceIp[0.0.0.0] superPodId[0] useSuperPodMode[0] isStandardCard[0]本端关键信息userRank[通信域内的Rank号]、hostIp[host侧Ip]、devicePhyId[物理Id]、server[节点信息]、deviceIp[device侧Ip]、superPodId[超节点Id]、useSuperPodMode[是否为超节点模式]、isStandardCard[是否为标卡场景]信息中“1”表示是“0”表示否。如果想要查询已经配置成功的环境变量其配置及实际生效值会被打印在CANN日志的run/plog目录下。针对Atlas 推理系列产品、Atlas 训练系列产品、Atlas A2 训练系列产品/Atlas A2 推理系列产品、Atlas A3 训练系列产品/Atlas A3 推理系列产品可以通过检索HCCL_ENV的关键字查询每个进程的环境变量实际生效值例如执行grep -r HCCL_ENV run/plog/plog-_xxx_.log得到以下信息[INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.881.877 [externalinput.cc:598] [1595259][HCCL_ENV] HCCL_CONNECT_TIMEOUT set by default to [120]s [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.881.882 [externalinput.cc:558] [1595259][HCCL_ENV] HCCL_EXEC_TIMEOUT set by default to [1836]s [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.881.886 [externalinput.cc:663] [1595259][HCCL_ENV] HCCL_INTRA_PCIE_ENABLE set by default to [1], HCCL_INTRA_ROCE_ENABLE set by default to [0] [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.881.890 [externalinput.cc:742] [1595259][HCCL_ENV] environmental variable PROFILING_MODE and GE profiling option is not set, default: false [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.881.895 [externalinput.cc:833] [1595259][HCCL_ENV] HCCL_WHITELIST_DISABLE set by environment to [0] [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.881.912 [externalinput.cc:880] [1595259][HCCL_ENV] HCCL_IF_IP is not set [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.881.915 [externalinput.cc:936] [1595259][HCCL_ENV] HCCL_SOCKET_IFNAME set by default to [EmptyString] [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.881.917 [externalinput.cc:903] [1595259][HCCL_ENV] HCCL_SOCKET_FAMILY is not set and is used by default [AF_INET] [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.881.920 [externalinput.cc:865] [1595259][HCCL_ENV] HCCL_IF_BASE_PORT set by default to [60000] [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.881.988 [externalinput.cc:1170] [1595259][HCCL_ENV] HCCL_RDMA_TC set by default to [132] [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.881.991 [externalinput.cc:1205] [1595259][HCCL_ENV] HCCL_RDMA_SL set by default to [4] [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.882.058 [externalinput.cc:1250] [1595259][HCCL_ENV] HCCL_RDMA_TIMEOUT set by default to [20] [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.882.064 [externalinput.cc:1284] [1595259][HCCL_ENV] HCCL_RDMA_RETRY_CNT set by default to [7] [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.882.069 [externalinput.cc:1370] [1595259][HCCL_ENV] HCCL_BUFFSIZE set by environment to [1]M [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.882.072 [externalinput.cc:621] [1595259][HCCL_ENV] HCCL_DETERMINISTIC set by default to [false] [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.882.074 [externalinput.cc:1395] [1595259][HCCL_ENV] HCCL_DIAGNOSE_ENABLE set by default to [0] [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.882.077 [externalinput.cc:1484] [1595259][HCCL_ENV] HCCL_ENTRY_LOG_ENABLE set by default to [0] [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.882.081 [externalinput.cc:1505] [1595259][HCCL_ENV] HCCL_INTER_HCCS_DISABLE is not set, default value is FALSE. [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.882.090 [externalinput.cc:1569] [1595259][HCCL_ENV] environmental variable HCCL_OP_EXPANSION_MODE is [HOST], aicpuUnfold[0], aivMode[0], enableFfts[1] [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.882.096 [externalinput.cc:1420] [1595259][HCCL_ENV] HCCL_RDMA_QPS_PER_CONNECTION is set to default value [1] [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.882.099 [externalinput.cc:1454] [1595259][HCCL_ENV] HCCL_MULTI_QP_THRESHOLD is set to default value [512]KB [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.882.116 [externalinput.cc:1724] [1595259][HCCL_ENV][ParseRetryEnable] HCCL_OP_RETRY_ENABLE set by environment variable to [L0:0,L1:0,L2:0]. [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.882.120 [externalinput.cc:1736] [1595259][HCCL_ENV] HCCL_OP_RETRY_PARAMS is not set, default value MaxCnt is [1], HoldTime is [5000]ms, IntervalTime is [1000]ms [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.882.123 [externalinput.cc:1778] [1595259][HCCL_ENV] HCCL_LOGIC_SUPERPOD_ID set by environment to [0] [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.882.125 [externalinput.cc:525] [1595259][HCCL_ENV] HCCL_RDMA_PCIE_DIRECT_POST_NOSTRICT set by default to [EmptyString], rdmaFastPost is [0] [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.882.128 [externalinput.cc:791] [1595259][HCCL_ENV][Parse][MultiQpSrcPortConfigPath]environmental variable HCCL_RDMA_QP_PORT_CONFIG_PATH is empty [INFO] HCCL(1595259,alltoall_test):2026-01-06-15:38:29.882.131 [externalinput.cc:1800] [1595259][HCCL_ENV] HCCL_DEBUG_CONFIG is not set, debugConfig set by default to 0x0针对Ascend 950PR/Ascend 950DT可通过检索关键字“base_config”查询当前已设置的环境变量。[INFO] HCCL(229424,python3.8):2025-12-23-22:31:40.239.170[base_config.cc:33][229424][Init][EnvVarParam]Env config HCCL_IF_IP is not set. Default value is used. [INFO] HCCL(229424,python3.8):2025-12-23-22:31:40.239.176[base_config.cc:33][229424][Init][EnvVarParam]Env config HCCL_IF_BASE_PORT is not set. Default value is used. [INFO] HCCL(229424,python3.8):2025-12-23-22:31:40.239.181[base_config.cc:33][229424][Init][EnvVarParam]Env config HCCL_SOCKET_IFNAME is not set. Default value is used. [INFO] HCCL(229424,python3.8):2025-12-23-22:31:40.239.187[base_config.cc:33][229424][Init][EnvVarParam]Env config HCCL_WHITELIST_DISABLE is not set. Default value is used. [INFO] HCCL(229424,python3.8):2025-12-23-22:31:40.239.192[base_config.cc:33][229424][Init][EnvVarParam]Env config HCCL_HOST_SOCKET_PORT_RANGE is not set. Default value is used. [INFO] HCCL(229424,python3.8):2025-12-23-22:31:40.239.197[base_config.cc:33][229424][Init][EnvVarParam]Env config HCCL_SOCKET_FAMILY is not set. Default value is used. [INFO] HCCL(229424,python3.8):2025-12-23-22:31:40.239.206[base_config.cc:33][229424][Init][EnvVarParam]Env config HCCL_CONNECT_TIMEOUT is parsed.快速定位定界思路确认是否为HCCL相关的异常报错。HCCL针对常见的报错场景会在业务打屏日志中上报错误信息及故障信息若在业务日志中存在EI****或EJ****的故障码则可根据对应的故障信息排查故障或结合CANN日志中的报错信息对相关章节进行排查故障码列表可见HCCL相关故障码。除了打屏的故障码信息HCCL在CANN日志中会打印HCCL组件的ERROR级别日志因此若在CANN日志中没有发现HCCL组件的报错日志需排查是否有其他组件的报错信息若无报错请注意训练脚本本身有无异常、是否存在core dump或进程卡住等其他异常收集全量CANN日志。由于HCCL集合通信是一个通信域下全局的协同行为某个节点上有HCCL的异常报错往往是因为在等待某个对端超时此时需要结合对端的日志信息一起排查问题的根因。对于HCCL问题的定位定界需要收集集群下所有节点的CANN日志包括debug目录和run目录的日志。确认当前报错阶段并根据不同阶段进行排查。HCCL业务存在三个阶段分别是通信域初始化、参数面建链和通信算子执行由于不同阶段使用的硬件资源、通信拓扑和同步方式有明显差异因此可先确认当前HCCL报错所在的阶段再根据不同的阶段找到对应的章节做进一步排查。HCCL在常见的报错场景增加了多级检索关键字可以根据报错日志中的关键字快速识别当前报错阶段并根据报错信息做进一步排查和定位。多级检索关键字详见HCCL多级检索关键字如下日志表明在算子执行阶段发生了超时报错且当前的算子展开方式为HOST模式[ERROR] HCCL(858209,all_reduce_test):2025-12-10-19:52:32.589.097 [task_exception_handler.cc:27] [858274][TaskExecStage][Timeout][HOST]Task run failed, base information is streamID:[1740], taskID[23], tag[AllReduce_127.0.0.1%enp_60000_0_1765367469951573], AlgType(level 0-1-2):[fullmesh-ring-NHR].注意多级检索关键字功能仅在CANN 8.5.0版本及后续版本支持对于不支持的版本或没有检索到关键字的场景可根据其他方法判断当前的报错阶段。HCCL提供了通信域创建接口和通信算子接口且接口均为同步下发异步执行。因此可分为以下几个场景若业务在调用通信域创建接口失败时或在报错日志中有topoinfo、ranktable关键字打印可参考通信域初始化阶段章节进一步排查。若业务在调用通信算子接口失败时或在报错日志中有transport关键字打印可参考参数面建链阶段章节进一步排查。若业务创建通信域接口和通信算子下发均成功而是在触发流同步时有HCCL的算子执行失败或在报错日志中有TaskExceptionHandler、FFTS run failed、Task run failed关键字打印可参考任务下发执行阶段章节做进一步排查。除此三个阶段的关键信息外若在业务的打屏日志中有明确的错误码信息如EI0001可直接根据错误码在后续内容中找到对应的故障码并进一步排查。HCCL多级检索关键字一级关键字二级检索关键字故障场景InitGroupStageEnvConfig通信域初始化阶段环境变量配置异常RanktableConfig通信域初始化阶段rankTable文件读取失败RanktableCheck通信域初始化阶段rankTable集群信息校验失败RanktableDetect通信域初始化阶段集群信息探测失败Resource通信域初始化节点资源初始化失败InitChannelStageParameterConflict参数面建链阶段参数一致性校验失败VersionConflict参数面建链阶段HCCL版本不一致校验失败Timeout参数面建链阶段超时报错TaskExecStageInvalidArgument算子执行阶段入参校验失败Not Supported算子执行阶段不支持场景Timeout算子执行阶段执行超时RunFailed算子执行阶段执行失败HeartbeatAbnormal算子执行阶段发现心跳异常事件HCCL相关故障码故障码故障码说明EI0001环境变量配置异常EI0002通信算子执行超时EI0003集合通信算子入参校验失败EI0004rankTable文件加载失败EI0005参数一致性校验失败EI0006通信算子参数面建链超时EI0007资源初始化失败EI0008HCCL版本不一致校验失败EI0011QP内存资源申请失败EI0012算子执行时发生SDMA任务异常EI0013算子执行时发生ROCE CQE ERROR异常EI0014集群信息校验失败EI0015通信域集群信息协商阶段超时EI0019通信域创建阶段server节点端口绑定失败或参数面建链阶段端口绑定失败【免费下载链接】hccl集合通信库Huawei Collective Communication Library简称HCCL是基于昇腾AI处理器的高性能集合通信库为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

CANN/hccl故障诊断定位思路

定位思路 【免费下载链接】hccl 集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案 项目地址: https://gitcode.com/cann/hccl …...

CANN学习中心CMake配置详解

CMake 配置详解 【免费下载链接】cann-learning-hub CANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。 项目地址: https://gitcode.com/cann/cann-learning-hub CMakePresets.js…...

MRCV开源工具库:用AI潜在表示与神经网络重塑音乐创作与声音设计

1. MRCV:当AI遇见声音,一个开源工具库如何重塑音乐创作作为一名在音频编程和音乐技术领域摸爬滚打了十多年的从业者,我见证了从简单的MIDI音序器到复杂的物理建模合成器的演变。但最近几年,最让我感到兴奋的,无疑是人工…...

感知-通信-计算一体化:破解边缘AI资源困局的核心架构

1. 项目概述:为什么我们需要感知-通信-计算一体化?在智能家居里,你对着智能音箱说句话,它几乎瞬间就能回应;在自动驾驶汽车上,摄像头和雷达捕捉到的路况信息,需要立刻被分析并做出驾驶决策。这些…...

CANN/runtime设备同步内存复制示例

5_d2d_sync_memory_copy 【免费下载链接】runtime 本项目提供CANN运行时组件和维测功能组件。 项目地址: https://gitcode.com/cann/runtime 描述 本样例展示了Device内的内存复制,使用aclrtMemcpy内存复制接口。 产品支持情况 本样例支持以下产品&#x…...

FPGA加速的VAE在粒子物理模拟中的应用与优化

1. 项目概述粒子物理实验中的蒙特卡洛模拟是理解探测器响应、优化重建算法和评估系统不确定性的关键环节。传统基于Geant4的完整探测器模拟虽然精度高,但计算成本极其昂贵——在大型强子对撞机(LHC)实验中,模拟任务消耗了约80%的计…...

CANN/ge ES代码生成器工具

ES (Eager Style) Generator 【免费下载链接】ge GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch…...

CANN SHMEM工具调测指南

SHMEM搭配工具算子调测指导 【免费下载链接】shmem CANN SHMEM 是面向昇腾平台的多机多卡内存通信库,基于OpenSHMEM 标准协议,实现跨设备的高效内存访问与数据同步。 项目地址: https://gitcode.com/cann/shmem msprof shmem后续会适配msprof算子…...

CANN/shmem Pre-commit使用指南

Pre-commit 代码检查使用指南 【免费下载链接】shmem CANN SHMEM 是面向昇腾平台的多机多卡内存通信库,基于OpenSHMEM 标准协议,实现跨设备的高效内存访问与数据同步。 项目地址: https://gitcode.com/cann/shmem 介绍 本项目使用 pre-commit 框…...

多智能体系统协同韧性:从概念到量化评估的工程实践

1. 项目概述:从“各自为战”到“协同共生”的韧性挑战在人工智能的演进浪潮中,多智能体系统正从实验室走向现实世界的复杂场景。无论是自动驾驶车队的协同调度、工业机器人的集群作业,还是在线游戏中的NPC协作,其核心都是多个自主…...

为你的OpenClaw智能体工作流配置Taotoken作为模型供应商

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 为你的OpenClaw智能体工作流配置Taotoken作为模型供应商 基础教程类,面向使用OpenClaw框架构建AI智能体工作流的开发者…...

WarcraftHelper:魔兽争霸3终极优化指南,5步实现高分辨率与高帧率体验

WarcraftHelper:魔兽争霸3终极优化指南,5步实现高分辨率与高帧率体验 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 你是否还…...

WatchGuard Agent多漏洞深度解析:从本地提权到SYSTEM,安全代理为何成为内网最大后门?

引言:当守护者变成入侵者——安全行业最讽刺的悖论 2026年5月6日,全球知名网络安全厂商WatchGuard在其官方安全公告中紧急发布了一批针对Windows终端安全代理的高危漏洞修复补丁。这则看似普通的安全公告,却在全球政企安全圈引发了轩然大波—…...

AIAS信息模型:构建工业AI与自动化系统融合的标准化蓝图

1. 项目概述:为什么我们需要一个“AI自动化系统说明书”?在工厂车间里,一台冲压机正在不知疲倦地工作。工程师小王最近为它部署了一个AI模型,用来预测驱动皮带的磨损状态,目标是实现预测性维护,减少非计划停…...

CANN Runtime API 参考

Runtime API 参考 【免费下载链接】runtime 本项目提供CANN运行时组件和维测功能组件。 项目地址: https://gitcode.com/cann/runtime 1. 概述 2. 初始化与去初始化 3. 运行时配置 4. Device管理 5. Context管理 6. Stream管理 7. Event管理 8. Notify管理 9. Cn…...

医疗影像AI落地实战:从AGI大模型到临床小模型的对齐与轻量化

1. 项目概述:当AGI遇见医疗影像,从“实验室巨兽”到“临床利器”的必经之路如果你最近关注人工智能,尤其是通用人工智能(AGI)的进展,一定会被ChatGPT、GPT-4、Segment Anything Model (SAM)这些“大模型”的…...

能量阀工厂

在当今工业领域,能量阀对于众多系统的高效运行起着至关重要的作用。天津水阀机械有限公司作为一家专业的能量阀工厂,凭借其深厚的技术实力、卓越的产品质量和广泛的市场应用,在行业中占据着重要地位。下面,让我们一同深入了解这家…...

AI赋能非洲农业:技术落地挑战与可持续路径实践

1. 项目概述:当AI遇见非洲田野最近几年,我一直在关注技术如何真正落地到传统行业,尤其是那些最需要效率提升的领域。非洲农业,这个常常被外界贴上“落后”标签的庞大系统,恰恰是人工智能技术最具想象力的试验场。这不是…...

AI赋能敏捷开发:从需求到部署的智能化实践与效率革命

1. 项目概述:当敏捷遇上AI,一场效率革命正在发生在软件开发的战场上,敏捷方法论早已不是新鲜词汇。Scrum站会、看板墙、用户故事、冲刺规划……这些实践在过去二十年里重塑了无数团队的交付节奏。然而,作为一名在敏捷转型和一线开…...

CANN/pyasc昇腾SoftMax算子API文档

asc.language.adv.softmax 【免费下载链接】pyasc 本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。 项目地址: https://gitcode.com/cann/pyasc asc.language.adv.softmax(dst: …...

从零实现扩散模型:数学原理与PyTorch实战图像生成

1. 项目概述与核心价值最近几年,AI图像生成领域最让人兴奋的突破,莫过于扩散模型(Diffusion Models)的崛起。从DALLE 2、Midjourney到Stable Diffusion,这些能根据一句话就生成惊艳图片的工具,其核心引擎都…...

FPGA-MPSoC边缘AI加速实战:从模型量化到硬件部署全解析

1. 项目概述:为什么要在边缘用FPGA-MPSoC做AI加速?这几年,但凡跟AI沾边的项目,无论是自动驾驶里识别一个突然窜出来的行人,还是工厂质检摄像头判断一个零件的瑕疵,大家挂在嘴边的都是“实时性”和“低功耗”…...

AI赋能结直肠癌诊断:从多模态数据融合到临床落地的技术实践

1. 项目概述:当AI遇见结直肠癌诊断作为一名在医疗影像和数字病理领域摸爬滚打了十多年的从业者,我亲眼见证了技术如何一步步改变临床诊断的图景。今天想和大家深入聊聊一个既前沿又接地气的领域:AI在结直肠癌诊断中的应用。这不仅仅是“计算机…...

当AI开始「嫌贫爱富」

GPT-5.5涨价三倍,SpaceX花600亿美元买一个编程工具。这两个新闻放在一起,揭示了一个被大多数人忽略的事实—— 不是AI越来越便宜,是AI市场正在剧烈撕裂。 如果你最近关注AI新闻,可能会有一种错觉:AI正在变得越来越便宜、越来越亲民。 DeepSeek V4开源免费,国产大模型卷出…...

pyasc向下取整函数

asc.language.adv.floor 【免费下载链接】pyasc 本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。 项目地址: https://gitcode.com/cann/pyasc asc.language.adv.floor(dst: Loca…...

「AI最强联盟」正在悄悄解体

微软和OpenAI结束独家云合作的那天,没有吵架,没有声明,只有一份平静的公告。 但这可能是2026年最被低估的AI信号—— 不是因为感情破裂,而是因为利益已经大到无法用「独家」锁住。 如果你关注AI新闻,可能会有一种错觉:微软和OpenAI仍然是天作之合。 微软投了130亿美元,…...

Scrapy-Pinduoduo:构建高可用电商数据采集系统的技术实现方案

Scrapy-Pinduoduo:构建高可用电商数据采集系统的技术实现方案 【免费下载链接】scrapy-pinduoduo 拼多多爬虫,抓取拼多多热销商品信息和评论 项目地址: https://gitcode.com/gh_mirrors/sc/scrapy-pinduoduo 在电商竞争日益激烈的市场环境下&…...

HoRain云--汇编语言数组操作全解析

🎬 HoRain云小助手:个人主页 🔥 个人专栏: 《Linux 系列教程》《c语言教程》 ⛺️生活的理想,就是为了理想的生活! ⛳️ 推荐 前些天发现了一个超棒的服务器购买网站,性价比超高,大内存超划算!…...

基于Spring Boot的餐厅订餐系统的设计与实现毕设源码

博主介绍:✌ 专注于Java,python,✌关注✌私信我✌具体的问题,我会尽力帮助你。一、研究目的本研究旨在构建一个基于Spring Boot框架的餐厅订餐系统以解决传统餐饮服务模式中存在的信息传递效率低下、订单处理流程繁琐以及顾客体验不均衡等问题。随着移动…...

向量数据库基准测试实战:从原理到选型,科学评估性能

1. 向量数据库基准测试:为什么我们需要它,以及如何用好它如果你正在为你的AI应用(比如RAG、推荐系统或者图像搜索)挑选一个向量数据库,你大概率会面临一个幸福的烦恼:选择太多了。Qdrant、Weaviate、Milvus…...