当前位置: 首页 > article >正文

CANN/PyPTO精度调试指南

精度调试【免费下载链接】pyptoPyPTO发音: pai p-t-oParallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto简介当PyPTO算子执行后无功能告警或报错但输出数据不符合预期时可基于以下方法进行精度问题的定界和定位。精度问题主要来源于两个方面功能错误硬件静默故障、软件静默功能问题、公式实现错误引起的明显数据错误或误差。计算误差数据类型、算法切分、累积、公式近似差异等引起的明显数据误差。整体流程确认问题合法性确认问题判定方式是否合理经验判断与实验证明。误差阈值是否使用合理例如存在bfloat16等低精度数据类型的算子使用了float32的误差阈值。计算路径较深的算子使用了小算子的误差阈值。对于不合理部分根据经验进行修正若问题消失则完成精度调试。确认问题可稳定复现。重复执行多轮输出数据一致且为异常值。更换其它环境多轮输出仍旧一致且为异常值。若无法稳定复现则明确为功能问题建议中止精度调试。基础预检基础预检为指导性说明指出常见但易被忽视的高概率出错问题。如果用户或调试人员确认相应检查项无误可以跳过这些步骤。借助asys工具检查硬件问题。使用硬件自检工具排除硬件安装问题。使用硬件压测工具排除硬件故障。检查软件问题。基于安装指导确认软件版本正确。执行项目中example用例确认结果正确。检查用户侧是否引入问题。多方评审算子代码确认计算过程与算法原型一致。数据类型、计算类型与竞品实现一致若无竞品实现需由提供算子实现方案的设计人员完成类型确认。若无法确认则分析后续发现的问题点时需额外分析是否为用户侧引入。规避已知问题精度调试前应确保已规避当前软件存在的已知问题详细请参见已知问题。缩小问题规模缩小问题规模通常是一个可选步骤旨在简化问题提高复现和定位的效率。缩小问题规模后需能复现同样问题然后继续进行后续的工具自检或人工调试对于缩小后出现新问题的情况建议尝试其它缩小方法以复现原始问题不建议将新问题纳入关键定位流程。然而在某些情况下缩小问题规模是必选步骤例如对于较大的模型主机内存不足导致自检工具无法执行。文件存储空间过小导致自检工具无法保存中间计算数据。其它分析流程或工具的耗时超过主观容忍范围甚至无法执行等阻塞式情况。通常通过以下方法缩小问题规模减少子图数量和大小。例如减少loop的次数或减少cube/vector Tiling块的个数即增大TileShape的大小。裁剪模型。例如调小模型的Shape规格如batch_size、seq_len等。采用二分法移除尾部计算。按模型计算的顺序采用二分法移除靠近尾部的计算并将断开的输出加入算子的输出列表。执行算子并观察、分析新的输出列表如果数据正常无 inf/nan、无主观认为随机的值、或与参考基准数据误差较小则返回上步继续二分操作。如果数据存在异常则将代码恢复到本次移除前的状态作为最新的候选问题场景。如果裁剪后的模型规模已经很小可以停止二分操作并选择最新的候选问题场景进行后续的定位。工具自检和分析工具简介PyPTO在计算图编译的各Pass阶段拥有完整的中间表示可翻译成第三方计算代码并在其它计算单元例如Host CPU上模拟计算过程。该工具通过模拟计算结果与基准数据的误差对比可以检测算子异常或者某个Pass的处理结果是否存在异常并定位首个出现异常的计算节点。主要特性及使用场景Tensor Graph校验用于校验算子代码、框架前端处理的正确性。基于用户提供的基准golden输入输出数据与Tensor Graph模拟计算的最终结果对比检测整体计算的正确性。常用于以下情况当用户存在可用的算子基准golden输入、输出数据时可先使能粗检特性粗略排除算子代码、框架前端处理是否引入差异。Pass阶段校验用于自检Pass的正确性。基于各Pass模拟计算的结果对比检测Pass正确性及异常计算节点。常用于以下情况当用户算子精度刚刚出现问题且没有明确方向可先使能自检特性排除Pass处理阶段是否引入潜在错误。当用户大致明确某个Pass出问题时使能自检特性获取该Pass及前序Pass的模拟计算中间数据对比数据找出潜在出问题的计算操作。中间结果分析指定单个计算结果保存到文件或者以可读形式打印到输出、日志。当Tensor Graph校验失败时可使用pass_verify_print/pass_verify_save特性打印、保存模拟计算的中间数据对比数据找出潜在出问题的计算操作。使用约束当前精度调试工具存在以下限制完整计算流表示仅保存在pass运行上下文中无法使用检测功能不支持上板执行的中间数据检查仅支持前端及pass的检查。不支持特定pass特定pass例如SubgraphToFunction属于中间的优化过程缺少完整计算信息工具内部做自动跳过处理。不支持pass间的自动对比校验需人工进行数据对比。不支持程序退出后在任意运行环境构造并模拟计算。需在算子编译期间所对应的主机CPU及进程上构造并模拟计算。不支持基于昇腾AI处理器调用Ascend C构造并模拟计算。不支持基于GPU构造并模拟计算。不支持包含GATHER_IN_UB和GATHER_IN_L1两个operation的校验。如ExpandFunction校验结果出现B200BU报错则该场景仅在InferDynShape后校验结果有效。inplace的op目前只确保pass24及以后的pass校验通过。环境准备最新 master 分支代码及 0.1.1 之后版本不含 0.1.1 版本支持在运行时在线编译精度工具所需 C 二进制不需重新编译安装 PyPTO, 但需确认在线编译所需的构建工具符合以下要求- cmake 3.16.3 - make - g 9.4.0早期PyPTO源码需要重新编译并安装PyPTO后才能使用该工具。确认GCC安装并升级到9.4.0或更高版本。重新通过源码编译安装PyPTO。主要区别是在编译安装命令中增加选项 --no-build-isolation其他操作请参见编译安装。python3 -m pip install . --verbose --no-build-isolation工具使用操作步骤开启精度调试开关。参考样例为hello_world.py。... verify_options { enable_pass_verify: True, pass_verify_save_tensor: True, ... } pypto.frontend.jit(verify_optionsverify_options) def add_kernel( input0: pypto.Tensor((1, 4, 1, 64), pypto.DT_FP32), input1: pypto.Tensor((1, 4, 1, 64), pypto.DT_FP32), out: pypto.Tensor((1, 4, 1, 64), pypto.DT_FP32), ): pypto.set_vec_tile_shapes(1, 4, 1, 64) out[:] input0 input1 ...verify_options 参数说明参数名类型默认值说明enable_pass_verifyboolFalse总体使能开关决定所有pass_verify_*选项和接口是否生效。必须设置为True才能使其他参数生效pass_verify_save_tensorboolFalse是否将模拟计算数据存盘。设置为True时会在{work_path}/output/output_*/目录下生成verify_*目录pass_verify_save_tensor_dirstr{RUNNING_DIR}/output/output_{TS}检测结果及数据的保存路径。可指定绝对路径pass_verify_pass_filterList[str]空配置待自检的Pass名称列表。不指定则默认校验特定pass指定all则校验所有pass指定[]不校验pass只校验tensor_graphpass_verify_error_tolList[float][1e-3, 1e-3]精度对比的容差配置。第一个值为相对误差容差rtol第二个值为绝对误差容差atol设置 golden 数据可选如果需要进行tensor_graph验证需要设置 golden 数据... def test_add(): shape (1, 16, 1, 64) input_data0 torch.rand(shape, dtypetorch.float) input_data1 torch.rand(shape, dtypetorch.float) torch_add torch.add(input_data0, input_data1) # 设置golden数据 pypto.set_verify_golden_data(goldens[None, None, torch_add]) input_data0 input_data0.to(npu) input_data1 input_data1.to(npu) out torch.empty(shape, dtypetorch.float, devicenpu) add(input_data0, input_data1, out) ...set_verify_golden_data 接口说明函数原型set_verify_golden_data(in_out_tensorsNone, goldensNone)参数说明参数名类型说明in_out_tensorsList[Union(pypto.Tensor, torch.Tensor)]将用户可选执行算子时实际的输入、输出列表按照相同位置对应地设置到检测工具。jit 调用模式下该选项不需设置goldensList[Union(pypto.Tensor, torch.Tensor)]将用户已有的计算基准数据golden输出设置到工具中做对比检测。该列表与算子输入、输出参数列表的长度一致、位置对应。若相应位置设置为 None表示跳过该位置的数据对比。注意torch.Tensor 的 device 属性需为 CPU不支持 NPU约束说明该函数需设置pypto.set_verify_options(enable_pass_verifyTrue)后生效执行修改后用例。python3 examples/00_hello_world/hello_world.py打印类似以下输出指示对应的自检结果为通过PASS、未通过FAIL(ED)或跳过校验NO_COMPARE2025-mm-dd HH:MM:SS:xxx V | tensor_graph Verify for 3 data view list index 0 result NO_COMPARE 2025-mm-dd HH:MM:SS:xxx V | tensor_graph Verify for 3 data view list index 1 result NO_COMPARE 2025-mm-dd HH:MM:SS:xxx V | tensor_graph Verify for 3 data view list index 2 result PASS 2025-mm-dd HH:MM:SS:xxx V | function_TENSOR_loop_0_Unroll1_PATH0_hiddenfunc0_8.pass_00_RemoveRedundantReshape Verify result PASS 2025-mm-dd HH:MM:SS:xxx V | function_TENSOR_loop_0_Unroll1_PATH0_hiddenfunc0_8.pass_01_AutoCast Verify result PASS 2025-mm-dd HH:MM:SS:xxx V | function_TENSOR_loop_0_Unroll1_PATH0_hiddenfunc0_8.pass_02_InferMemoryConflict Verify result PASS ... 2025-mm-dd HH:MM:SS:xxx V | function_TENSOR_loop_0_Unroll1_PATH0_hiddenfunc0_8.pass_34_InsertSync Verify result PASS 2025-mm-dd HH:MM:SS:xxx V | function_TENSOR_loop_0_Unroll1_PATH0_hiddenfunc0_8.pass_35_MixSubgraphSplit Verify result PASS 2025-mm-dd HH:MM:SS:xxx V | function_TENSOR_loop_0_Unroll1_PATH0_hiddenfunc0_8.pass_36_CodegenPreproc Verify result PASS执行结束后在${work_path}/output/output_*/目录*代表时间戳下生成verify_*目录存放检测结果文件与日志。├── tensor_graph # 保存前端初始计算图模拟计算后的中间数据作为基础数据 │ ├── *.data │ └── ... ├── verify_graph_data_metainfo.csv # 结果报告保存中间数据元信息及对应数据文件名 ├── verify_graph_result_brief.csv # 精度比对摘要PASS/FAIL/NO_COMPARE、误差统计等 ├── verify_graph_result_brief.log # 精度比对异常详情失败项、异常路径、错误明细 ├── interpreter.log # interpreter 模块拆分日志默认记录 ERROR / EVENT ├── Pass_{PASS_SEQ}_{PASS_NAME} # 保存中间pass计算图模拟计算后的中间数据作为待测数据 │ ├── *.data │ └── ...其中verify_graph_result_brief.log和interpreter.log位于同一个verify_*目录下verify_graph_result_brief.log偏向校验结果摘要与异常明细对比失败、异常路径。interpreter.log偏向 interpreter 执行过程中的拆分日志当前默认仅 ERROR/EVENT 落盘。后续处理建议。对于tensor_graph校验结果中标记FAIL的情况建议多方评审检查PyPTO前端代码的正确性。在前端代码无明显异常的前提下可使用pass_verify_print和pass_verify_save保存/打印中间结果进行进一步分析详见步骤7。对于tensor_graph校验结果通过Pass阶段校验结果中标记FAIL的情况建议建议收集相关结果信息并提交ISSUE进行处理。使用pass_verify_print和pass_verify_save分析中间结果可选。使用场景当Tensor Graph校验失败时可使用这两个接口打印、保存模拟计算的中间数据对比数据找出潜在出问题的计算操作。重要说明pass_verify_print和pass_verify_save保存的是tensor graph 验证阶段模拟计算的结果这些结果是在主机 CPU 上通过模拟执行计算图得到的与实际在 NPU 上板执行的结果可能存在差异主要用于算法逻辑验证使用示例pypto.frontend.jit(verify_optionsverify_options) def add_kernel( input0: pypto.Tensor((1, 4, 1, 64), pypto.DT_FP32), input1: pypto.Tensor((1, 4, 1, 64), pypto.DT_FP32), out: pypto.Tensor((1, 4, 1, 64), pypto.DT_FP32), ): pypto.set_vec_tile_shapes(1, 4, 1, 64) # 保存中间结果到文件 pypto.pass_verify_save(input1, input1_by_pass_verify) # 打印中间结果到控制台 pypto.pass_verify_print(input0) out[:] input0 input1 def add(input_data0, input_data1, out): add_kernel(input_data0, input_data1, out) def test_add(): shape (1, 4, 1, 64) input_data0 torch.rand(shape, dtypetorch.float, devicenpu) input_data1 torch.rand(shape, dtypetorch.float, devicenpu) out torch.empty(shape, dtypetorch.float, devicenpu) add(input_data0, input_data1, out) ...执行修改后用例python3 examples/00_hello_world/hello_world.py控制台输出示例input0:64x64xFP16/64x64xFP16 [[0.03955 0.6094 0.1519 ... 0.7339 0.8789 0.8662] [0.6284 0.01465 0.6333 ... 0.2422 0.03516 0.8423] [0.231 0.02686 0.6055 ... 0.7466 0.2529 0.2231] ... [0.3477 0.4243 0.05273 ... 0.9287 0.1138 0.5083] [0.05273 0.9941 0.4985 ... 0.8345 0.8613 0.188] [0.3184 0.8047 0.833 ... 0.7734 0.2578 0.1392]]生成的文件结构执行结束后在{work_path}/output/output_*/目录*代表时间戳下生成tensor/目录├── tensor/ │ ├── input1_by_pass_verify.data # 保存的指定模拟计算数据格式为Tensor数据的直接内存转储 │ ├── input1_by_pass_verify.csv # 模拟计算数据的元数据包括数据类型、shape信息后续数据处理建议根据元数据信息使用常用的torch.from_file()、numpy.load()等接口打开数据文件并转换为可解析的数值再进一步进行通常开发者使用的数据分析方法例如检查异常数据的偏移规律、异常数据的值特征inf/nan/zero 等。上板执行tensor dump1. 功能概述支持在上板执行时dump leaf function的输入输出数据用于精度问题定位支持和模拟计算结果对比分析。2. 启用方式import os # 设置环境变量启用上板dump, 或者执行前单独设置环境变量export PTO_DATADUMP_ENABLEtrue os.environ[PTO_DATADUMP_ENABLE] true # 配置验证选项 pypto.frontend.jit( runtime_options{run_mode: pypto.RunMode.NPU}, verify_options{ enable_pass_verify: True, pass_verify_save_tensor: True } ) def kernel(...): ...3. Dump 数据输出路径output/output_*/dump_tensor_*/device_{deviceId}/ └── {taskId}_{seqNo}_{callopMagic}_{rootHash}_{funcHash}_{rawMagic}_{timeStamp}_{dataType}_{input/output}{index}.tdump4. 数据处理工具工具位置tools/verifier/parse_dump_tensors.py主要功能解析 dump 的二进制数据.tdump 文件提取 tensor 数据为 .data 文件自动合并分片 tensor 为完整的 raw tensor针对多个 task 处理同一 raw tensor 的场景支持 codegen pass tensor 对比验证需配合enable_pass_verify使用使用方法# 基本用法未使能enable_pass_verify 不进行验证 python3 tools/verifier/parse_dump_tensors.py \ --dump_tensor_path output/output_20260101120000/dump_tensor_20260101120000/device_0 # 带验证的用法需先开启 enable_pass_verify 并运行算子 python3 tools/verifier/parse_dump_tensors.py \ --dump_tensor_path output/output_20260101120000/dump_tensor_20260101120000/device_0 \ --verify_path output/output_20260101120000/verify_20260101120000参数说明参数必需/可选说明默认值--dump_tensor_path必需dump 数据目录路径指向device_x目录无--verify_path可选verify 结果目录路径包含 verify_graph_data_metainfo.csv不对比验证输出文件output/output_*/dump_tensor_*/device_0/ ├── *.data # 提取的 tensor 数据文件 ├── raw_{rawMagic}_{dataType}_{ioflag}.data # 合并后的 raw tensor如有分片 └── ../ # 上级目录生成对比结果报告 └── verify_task_result_cmp~{timestamp}.csv # 对比验证结果报告verify_task_result_cmp~{timestamp}.csv 字段说明字段前缀说明B前缀表示上板 dump 的原始数据A前缀表示验证数据来自 pass verifyAB前缀表示对比验证结果基础信息字段字段说明BtaskId任务 IDROOT_CALL:opmagic算子调用 magic 标识ROOT_CALL:rawmagic原始 tensor magic 标识Bvalidshapetensor 实际 shapeBoffsettensor 在 raw tensor 中的偏移BrawShape原始完整 tensor 的 shapeBtensorAddrtensor 内存地址Bdatatype数据类型字符串如 FP32、INT8IO_FLAG输入/输出标记input/outputBseqNo序列号BTIMESTAMP时间戳BfuncIdFunction IDROOT_FUNC:hashRoot Function hash 值FUNC:hashFunction hash 值验证对比字段启用 --verify_path 时字段说明APHASE_NAME验证数据的阶段名称如 Pass_36_CodegenPreprocAFILENAME验证数据文件路径Adatatype验证数据的数据类型Avalidshape验证数据的 shapeABRESULT对比结果PASS、FAIL、NO_CMPerror_count误差元素数量对比失败时error_rate误差元素占比对比失败时max_abs_error最大绝对误差对比失败时max_rel_error最大相对误差对比失败时mean_abs_error平均绝对误差对比失败时mean_rel_error平均相对误差对比失败时result_reason未对比原因NO_CMP 时如 unsupported dtype: BOTTOM对比验证流程数据匹配通过ROOT_CALL:opmagic、ROOT_CALL:rawmagic、IO_FLAG、Boffset匹配上板数据与验证数据容差配置根据数据类型自动选择容差FP32/FP64标准容差rtol1e-3, atol1e-3FP16/BF16/FP8放宽容差rtol1e-2, atol1e-2Shape 处理自动处理 shape 不一致的对比取公共部分不支持类型HF4、HF8、BOTTOM 等类型标记为 NO_CMPRaw Tensor 合并说明当多个 task 处理同一个 raw tensor 的不同分片时脚本会自动按ROOT_CALL:rawmagic分组根据Boffset和Bvalidshape计算切片位置合并所有分片数据到完整 raw tensor生成的文件命名为raw_{rawMagic}_{dataType}_{ioflag}.data算子级别的输入输出tensor dump1. 功能概述支持整网中算子级别的输入输出上板dump的能力。2. 启用方式在脚本运行目录下创建 acl.json 文件内容如下{ dump:{ dump_path:/your/path, dump_mode:all, dump_debug:off, dump_op_switch:on } }在要执行的用例 test.py 中添加如下配置import torch import torch_npu torch.npu.init_dump() torch.npu.set_dump(acl.json)3. Dump 数据输出路径数据输出路径就是 acl.json 里面配置的 dump_path在该路径下会生成如下文件/your/path └── 20260415084134/0 └── TENSOR_batchmatmul_3d_kernel.TENSOR_batchmatmul_3d_kernel.29.46.1776242496294291调用 CANN 已有的工具解析该文件命令如下python3 /${CANN_PACKAGE_PATH}/Ascend/cann-9.0.0/tools/operator_cmp/compare/msaccucmp.py convert -d /your/path/20260415084134/0 -out /your/path/20260415084134/0/out解析后生成如下 npy 文件/your/path └── 20260415084134/0 ├── out/ │ ├── TENSOR_batchmatmul_3d_kernel.TENSOR_batchmatmul_3d_kernel.29.46.1776242496294291.input.0.npy │ ├── TENSOR_batchmatmul_3d_kernel.TENSOR_batchmatmul_3d_kernel.29.46.1776242496294291.input.1.npy │ └── TENSOR_batchmatmul_3d_kernel.TENSOR_batchmatmul_3d_kernel.29.46.1776242496294291.input.2.npy └── TENSOR_batchmatmul_3d_kernel.TENSOR_batchmatmul_3d_kernel.29.46.1776242496294291【免费下载链接】pyptoPyPTO发音: pai p-t-oParallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

CANN/PyPTO精度调试指南

精度调试 【免费下载链接】pypto PyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。 项目地址: https://gitcode.com/cann/pypto 简介 当PyPTO算子执行后无功能告警或报错,但输出数据不符合预期时&#x…...

Qt5 super module多媒体模块详解:音频、视频、3D图形处理技术

Qt5 super module多媒体模块详解:音频、视频、3D图形处理技术 【免费下载链接】qt5 Qt5 super module 项目地址: https://gitcode.com/gh_mirrors/qt/qt5 Qt5 super module是一个功能强大的跨平台应用开发框架,其中的多媒体模块为开发者提供了全面…...

专业级抖音资源自动化采集方案:douyin-downloader企业级部署指南

专业级抖音资源自动化采集方案:douyin-downloader企业级部署指南 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fall…...

baffle.js自定义配置完全指南:字符集、速度、排除字符的深度优化

baffle.js自定义配置完全指南:字符集、速度、排除字符的深度优化 【免费下载链接】baffle A tiny javascript library for obfuscating and revealing text in DOM elements. :astonished: 项目地址: https://gitcode.com/gh_mirrors/ba/baffle baffle.js是一…...

在 Node.js 后端服务中接入 Taotoken 多模型 API 的实践

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 在 Node.js 后端服务中接入 Taotoken 多模型 API 的实践 为后端服务添加 AI 能力,例如智能客服或内容生成,…...

Input Overlay:免费开源直播输入显示插件终极指南

Input Overlay:免费开源直播输入显示插件终极指南 【免费下载链接】input-overlay Show keyboard, gamepad and mouse input on stream 项目地址: https://gitcode.com/gh_mirrors/in/input-overlay 在游戏直播、教学演示或技术分享中,观众最常问…...

CANN/Ascend C 基于语言扩展层C API编程

基于语言扩展层C API编程 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地址: https:…...

CANN/asc-devkit HCCL算法分析器指南

Algorithm Analyzer User Guide 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地址: …...

CANN/asc-devkit最新管理器模块

latest_manager Module Description 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地…...

如何选择最佳身份验证技能:Awesome Agent Skills中Auth0、Firebase Auth与Better Auth全面指南

如何选择最佳身份验证技能:Awesome Agent Skills中Auth0、Firebase Auth与Better Auth全面指南 【免费下载链接】awesome-agent-skills A curated collection of 1000 agent skills from official dev teams and the community, compatible with Claude Code, Codex…...

10分钟打造专业级科研图表:SciencePlots终极美化指南

10分钟打造专业级科研图表:SciencePlots终极美化指南 【免费下载链接】SciencePlots Matplotlib styles for scientific plotting 项目地址: https://gitcode.com/gh_mirrors/sc/SciencePlots 还在为科研论文中的图表不够专业而烦恼吗?SciencePlo…...

3步解锁Beyond Compare 5专业版:Python密钥生成器终极指南

3步解锁Beyond Compare 5专业版:Python密钥生成器终极指南 【免费下载链接】BCompare_Keygen Keygen for BCompare 5 项目地址: https://gitcode.com/gh_mirrors/bc/BCompare_Keygen 还在为Beyond Compare 5的30天试用期而烦恼吗?想免费使用这款强…...

科研绘图革命:3步让Matplotlib图表达到期刊发表标准

科研绘图革命:3步让Matplotlib图表达到期刊发表标准 【免费下载链接】SciencePlots Matplotlib styles for scientific plotting 项目地址: https://gitcode.com/gh_mirrors/sc/SciencePlots 想象一下这样的场景:你花了数周时间收集数据、编写分析…...

清华大学打造实时交互视频生成新方案:让AI“边想边说“不再卡顿

这项由清华大学与人民大学联合开展的研究,于2026年5月以预印本形式发布,论文编号为arXiv:2605.15141,有兴趣深入了解的读者可通过该编号查询完整论文。研究团队来自清华大学和生数科技(ShengShu),与人民大学…...

CANN/asc-devkit RTC运行时编译指南

RTC 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地址: https://gitcode.com/cann/a…...

终极AMD Ryzen性能调优指南:5分钟掌握SMUDebugTool免费调试神器

终极AMD Ryzen性能调优指南:5分钟掌握SMUDebugTool免费调试神器 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: h…...

深度技术解析:Lenovo Legion Toolkit 高级性能调优与系统集成指南

深度技术解析:Lenovo Legion Toolkit 高级性能调优与系统集成指南 【免费下载链接】LenovoLegionToolkit Lightweight Lenovo Vantage and Hotkeys replacement for Lenovo Legion laptops. 项目地址: https://gitcode.com/gh_mirrors/le/LenovoLegionToolkit …...

Windows Defender移除终极指南:如何彻底禁用微软安全组件提升系统性能30%

Windows Defender移除终极指南:如何彻底禁用微软安全组件提升系统性能30% 【免费下载链接】windows-defender-remover A tool which is uses to remove Windows Defender in Windows 8.x, Windows 10 (every version) and Windows 11. 项目地址: https://gitcode.…...

Python金融数据引擎:重构通达信数据获取的技术范式

Python金融数据引擎:重构通达信数据获取的技术范式 【免费下载链接】mootdx 通达信数据读取的一个简便使用封装 项目地址: https://gitcode.com/GitHub_Trending/mo/mootdx 在量化投资和金融数据分析领域,数据获取一直是开发者面临的首要挑战。传…...

DLSS Swapper完整指南:3分钟掌握游戏性能优化终极技巧

DLSS Swapper完整指南:3分钟掌握游戏性能优化终极技巧 【免费下载链接】dlss-swapper 项目地址: https://gitcode.com/GitHub_Trending/dl/dlss-swapper DLSS Swapper是一款革命性的开源工具,专门为PC游戏玩家设计,让你能够轻松管理、…...

QQ空间数据备份指南:三步骤永久保存你的数字青春

QQ空间数据备份指南:三步骤永久保存你的数字青春 【免费下载链接】QZoneExport QQ空间导出助手,用于备份QQ空间的说说、日志、私密日记、相册、视频、留言板、QQ好友、收藏夹、分享、最近访客为文件,便于迁移与保存 项目地址: https://gitc…...

华硕笔记本终极控制神器:G-Helper轻量化替代方案完整指南

华硕笔记本终极控制神器:G-Helper轻量化替代方案完整指南 【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Zenbook,…...

DownGit:3分钟掌握GitHub文件下载的终极指南,无需克隆整个仓库!

DownGit:3分钟掌握GitHub文件下载的终极指南,无需克隆整个仓库! 【免费下载链接】DownGit github 资源打包下载工具 项目地址: https://gitcode.com/gh_mirrors/dow/DownGit 你是否曾经为了下载GitHub上的一个配置文件,却被…...

Cobalt Strike 完整安装指南,含网盘资源与Java配置

Cobalt Strike安装教程 说明: 本教程仅用于学习与研究,请勿用于非法用途。 kali安装java环境参考(如有侵权联系删除) https://blog.csdn.net/weixin_54499207/article/details/144985879?sharetypeblog&shareId144985879&…...

QMCDecode:三步快速解密QQ音乐加密音频的免费工具

QMCDecode:三步快速解密QQ音乐加密音频的免费工具 【免费下载链接】QMCDecode QQ音乐QMC格式转换为普通格式(qmcflac转flac,qmc0,qmc3转mp3, mflac,mflac0等转flac),仅支持macOS,可自动识别到QQ音乐下载目录,默认转换结…...

3分钟搞定M3U8视频下载:免费开源工具的终极懒人包

3分钟搞定M3U8视频下载:免费开源工具的终极懒人包 【免费下载链接】N_m3u8DL-CLI-SimpleG N_m3u8DL-CLIs simple GUI 项目地址: https://gitcode.com/gh_mirrors/nm3/N_m3u8DL-CLI-SimpleG 还在为下载在线视频发愁吗?那些藏在网页里的M3U8格式视频…...

Python爬虫实战:从零编写一个健壮的静态页面抓取器!

㊗️本期内容已收录至专栏《Python爬虫实战》,持续完善知识体系与项目实战,建议先订阅收藏,后续查阅更方便~ ㊙️本期爬虫难度指数:⭐⭐⭐ (进阶) 🉐福利: 一次订阅后,专栏内的所有文…...

工业设备数据采集太难?这款.NET8边缘网关,轻松搞定多协议对接

🌈前言如今工业数字化、智能化转型脚步越来越快,工厂现场各类 PLC、仪表、传感器设备型号繁杂,通信协议五花八门,设备数据采集难、协议对接繁琐、多设备统一管控麻烦,一直是很多制造企业、工控从业者头疼的实际问题。市…...

Python爬虫实战:构建博物馆藏品数字档案(列表到详情深度采集)

㊗️本期内容已收录至专栏《Python爬虫实战》,持续完善知识体系与项目实战,建议先订阅收藏,后续查阅更方便~ ㊙️本期爬虫难度指数:⭐⭐⭐ (进阶) 🉐福利: 一次订阅后,专栏内的所有文…...

AI不是产品,是技术,Apple想明白了

一个让我愣住的观点前几天刷 HackerNews,看到一篇被顶到榜首的文章,标题很短,就一句话,AI is a technology, not a product。不是因为这个观点多新奇,而是因为一个显而易见的事实,居然需要有人专门写一篇文…...