当前位置: 首页 > article >正文

别急着加内存!PyTorch报错‘DefaultCPUAllocator: not enough memory’的另类解法(附一键修复脚本)

别急着加内存PyTorch报错‘DefaultCPUAllocator: not enough memory’的另类解法当你看到PyTorch抛出RuntimeError: DefaultCPUAllocator: not enough memory时第一反应可能是检查任务管理器——然后发现物理内存明明还剩大半这个报错就显得格外荒谬。这种矛盾现象在Windows平台尤为常见本文将揭示其背后的系统级原因并提供三种无需升级硬件的解决方案。1. 为什么空闲内存充足却报错任务管理器显示的可用内存只是故事的一半。现代操作系统采用虚拟内存机制程序实际使用的是虚拟地址空间而非直接操作物理内存。当PyTorch尝试分配内存时Windows会检查两个关键参数提交限制Commit Limit物理内存 页面文件(pagefile.sys)的总和已提交内存Committed Memory所有程序已申请的内存总量即使物理内存充足如果页面文件设置过小导致提交限制接近已提交内存内存分配仍会失败。这就是为什么你看到RuntimeError: [enforce fail at ..\c10\core\impl\alloc_cpu.cpp:72] data.DefaultCPUAllocator: not enough memory: you tried to allocate 58982400 bytes关键点Windows默认的页面文件管理策略可能无法适应深度学习任务突发的大内存需求2. 三种解决方案对比方案操作复杂度是否需要重启适用场景调整页面文件设置中等需要长期稳定使用使用系统管理工具简单需要快速临时解决修改PyTorch配置复杂不需要技术专家/特定环境2.1 方案一手动调整页面文件推荐按WinR输入sysdm.cpl打开系统属性切换到高级→性能设置→高级→虚拟内存取消勾选自动管理选择自定义大小初始大小物理内存的1.5倍最大值物理内存的3倍点击设置后重启生效# 查看当前页面文件配置管理员权限运行 wmic pagefile list /format:list2.2 方案二使用PowerShell一键修复# 以管理员身份运行 $physMem (Get-CimInstance Win32_PhysicalMemory | Measure-Object -Property Capacity -Sum).Sum /1MB Set-MMAgent -MemoryCompression $false Disable-MMAgent -PageCombining $pageFile Get-WmiObject Win32_PageFileSetting $pageFile.InitialSize [int]($physMem * 1.5) $pageFile.MaximumSize [int]($physMem * 3) $pageFile.Put()注意此脚本会禁用内存压缩功能以提升稳定性可能略微增加内存占用2.3 方案三修改PyTorch内存分配策略在代码开头添加import os os.environ[PYTORCH_CUDA_ALLOC_CONF] max_split_size_mb:128 os.environ[OMP_NUM_THREADS] 4 # 根据CPU核心数调整这种方法通过限制内存碎片化来缓解问题但可能影响性能。3. 深度技术解析当PyTorch分配内存时底层经历了这些步骤内存申请通过malloc()或mmap()向OS申请虚拟地址空间提交检查Windows内核检查提交限制物理映射立即为小分配映射物理内存Working Set大内存采用按需分页Demand Paging常见误区误区1可用物理内存可分配内存误区2禁用页面文件能提升性能误区332位程序只受4GB限制实际案例在一台64GB内存的工作站上默认页面文件设置(1-2GB)导致ResNet50训练报错调整后问题消失。4. 进阶排查指南如果上述方法无效可能需要检查内存碎片化import torch print(torch.cuda.memory_summary()) # 即使使用CPU也有效系统内存策略# 检查内存压缩状态 Get-MMAgent | Select-Object MemoryCompression第三方软件冲突安全软件的实时扫描功能虚拟化软件的内存气球驱动一个容易忽略的细节某些主板BIOS中的Memory Remap功能如果关闭会导致OS无法正确使用全部物理内存。5. 长效预防措施监控工具配置使用Performance Monitor跟踪\Memory\% Committed Bytes In Use设置警报阈值在80%开发环境优化# 数据加载最佳实践 dataset torch.utils.data.TensorDataset(x, y) loader torch.utils.data.DataLoader( dataset, batch_size32, pin_memoryTrue, # 减少CPU内存压力 num_workers4 # 根据CPU核心数调整 )架构级解决方案对于超大模型考虑使用梯度检查点(Gradient Checkpointing)混合精度训练可降低内存需求30%-50%我在处理一个BERT微调任务时发现即使将页面文件设置为96GB物理内存32GB在长时间训练后仍会出现此问题。最终通过将数据预处理移出训练循环并使用del显式释放中间变量才彻底解决。

相关文章:

别急着加内存!PyTorch报错‘DefaultCPUAllocator: not enough memory’的另类解法(附一键修复脚本)

别急着加内存!PyTorch报错‘DefaultCPUAllocator: not enough memory’的另类解法 当你看到PyTorch抛出RuntimeError: DefaultCPUAllocator: not enough memory时,第一反应可能是检查任务管理器——然后发现物理内存明明还剩大半,这个报错就显…...

东山精密冲刺港股:第一季营收131亿 净利11亿 市值超4000亿

雷递网 雷建平 5月20日苏州东山精密制造股份有限公司(简称:“东山精密”)日前更新招股书,准备在港交所上市。截至目前,东山精密股价为219.33元,市值约4016亿元。一旦在港股上市,东山精密将形成“AH”的格局…...

保姆级教程:在RK3568开发板上搞定ES8316声卡驱动(从DTS配置到tinymix调试全流程)

RK3568开发板ES8316声卡驱动全流程实战指南 从零开始的声音之旅 当你第一次拿到RK3568开发板,想要实现音频功能时,ES8316这颗高性能低功耗的音频编解码芯片可能会成为你的首选。但在嵌入式Linux环境下,从硬件连接到软件驱动,再到最…...

Redis对象类型与底层数据结构

一、Redis对象类型概述 1.1 Redis数据类型总览 Redis提供了丰富的数据类型,用于不同的业务场景:对象类型说明典型场景String字符串缓存、计数器、分布式锁List双向链表队列、消息队列、最新列表Hash哈希表存储对象、购物车Set无序集合好友关系、抽奖Zset…...

5个关键挑战:BiliTools跨平台架构如何应对大规模视频下载的性能瓶颈

5个关键挑战:BiliTools跨平台架构如何应对大规模视频下载的性能瓶颈 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/Bil…...

nuScenes数据集“平替”指南:Mini版够用吗?完整版、Test版到底怎么选?

nuScenes数据集选型实战指南:从Mini版到完整版的决策逻辑 第一次接触nuScenes数据集时,面对动辄几百GB的庞然大物和仅有3.9GB的mini版本,相信不少研究者都会陷入选择困难。这就像站在自助餐厅里,既想品尝所有美味,又担…...

Sora 2生成帧精度达99.7%的LUT匹配方案,DaVinci色彩科学全链路对齐指南

更多请点击: https://kaifayun.com 第一章:Sora 2与DaVinci整合的底层逻辑与技术共识 Sora 2 作为新一代视频生成基础模型,其核心能力建立在时空联合建模与长程依赖捕获之上;DaVinci 则是面向专业影视工作流的高性能非线性编辑与…...

蓝桥杯嵌入式LCD显示避坑指南:sprintf函数格式化变量显示的正确姿势

蓝桥杯嵌入式LCD显示避坑指南:sprintf函数格式化变量显示的正确姿势 在蓝桥杯嵌入式竞赛中,LCD显示是基础但至关重要的环节。许多参赛选手在实现变量动态显示时,常常因为对sprintf函数的使用不当而陷入各种"坑"中——数据显示不全、…...

2026年多Agent协作实战:用CrewAI搭建5角色AI开发团队

前言上一篇我们学习了MCP协议,掌握了AI与工具交互的标准化方法。本文将更进一步,探讨如何让多个AI Agent协同工作——就像组建一个AI开发团队,每个Agent负责不同的角色,通过协作完成复杂任务。—## 一、为什么需要多Agent协作&…...

6G通信中的HMA天线技术:原理、优势与应用

1. HMA天线技术概述在6G通信和大规模MIMO系统的发展背景下,Huygens Metasurface Antennas(HMA)技术正逐渐成为无线通信领域的研究热点。作为一名长期从事天线系统设计的工程师,我见证了从传统相控阵到现代超表面天线的技术演进历程…...

别再让PCIe性能打折扣!手把手教你用lspci和setpci调优MaxPayloadSize

PCIe性能调优实战:用lspci和setpci精准优化MaxPayloadSize 当你的NVMe固态硬盘突然降速,或者10G网卡吞吐量不及预期时,可能正遭遇PCIe链路层的隐形性能杀手。本文将带你用Linux系统自带的lspci和setpci工具,像专业工程师一样诊断和…...

RoboMaster云台控制实战:基于大疆C板与GM6020的双环PID调参心得与角度控制优化

RoboMaster云台控制实战:基于大疆C板与GM6020的双环PID调参心得与角度控制优化 1. 从电机转动到精准控制的技术跃迁 当GM6020电机第一次在开发板上转动起来时,那种成就感往往会让初学者兴奋不已。但很快就会发现,让电机简单地转动与实现云台的…...

告别手写!用Playwright Codegen录制脚本,5分钟搞定百度搜索自动化

零代码神器:Playwright Codegen 5分钟实现百度搜索全流程自动化 每次手动测试网页功能时,你是否也厌倦了重复点击、输入、验证的机械操作?对于没有编程背景的测试人员或刚接触自动化的开发者来说,Playwright Codegen就像一位隐形的…...

保姆级教程:用PlatformIO给ESP32刷Marlin固件,搞定WiFi配置和Web界面

从零构建3D打印机无线中枢:ESP32刷写Marlin固件全流程解析 当你的3D打印机突然摆脱数据线的束缚,通过手机就能随时监控打印进度、调整参数时,那种科技带来的愉悦感会瞬间抵消所有配置过程的艰辛。本文将带你用ESP32开发板打造专属无线控制模块…...

用FPGA的DDS IP核做个信号发生器:从Vivado配置到ILA抓波形实战

基于FPGA的DDS信号发生器实战:从IP核配置到硬件调试全解析 在数字信号处理领域,直接数字频率合成(DDS)技术因其频率分辨率高、切换速度快和相位连续可调等优势,已成为现代电子系统中不可或缺的核心技术。本文将带领读者完成一个完整的FPGA-ba…...

别再自己造轮子了!手把手教你用LwRB环形缓冲区搞定嵌入式数据流(附DMA零拷贝实战)

嵌入式数据流处理的终极方案:LwRB环形缓冲区深度解析与DMA实战 在嵌入式开发中,数据流处理如同空气般无处不在却又容易被忽视。从UART接收到的传感器数据,到SPI传输的图像信息,再到I2C收集的设备状态,这些数据流的处理…...

A/B测试还在用t检验?DeepSeek团队淘汰传统方法的4个关键转折点(含贝叶斯动态决策引擎实测对比)

更多请点击: https://intelliparadigm.com 第一章:A/B测试范式迁移的必然性 传统A/B测试长期依赖静态流量分配、固定实验周期与人工决策闭环,在现代高并发、多场景、实时反馈的业务系统中正面临三重结构性失配:实验吞吐量低、决策…...

HTML5语义化与现代Web标准

HTML5语义化与现代Web标准 1. 技术分析 1.1 HTML5概述 HTML5是现代Web的基础: HTML5特性语义化标签: header, footer, article多媒体支持: video, audio表单增强: date, email, number离线存储: localStorage, sessionStorage核心改进:语义化文档结构原生多媒体支持…...

5G网络切换实战:当gNB之间没有Xn接口时,N2/NGAP切换如何保证你的游戏不掉线?

5G网络无缝切换实战:无Xn接口场景下的高可靠连接方案 手游玩家小张正沉浸在激烈的团战中,突然屏幕右上角的延迟数字从30ms飙升至500ms——角色瞬间卡顿,等他重新恢复操作时,团队已经团灭。这种场景在5G时代本应成为历史&#xff0…...

Python连接Oracle报DPI-1047?别慌,手把手教你用Instant Client 11g/12c/19c搞定(附环境变量避坑指南)

Python连接Oracle报DPI-1047?手把手教你用Instant Client全版本配置指南 当你满怀期待地在Python中写下import cx_Oracle,准备连接公司数据库大展身手时,突然跳出的DPI-1047: Cannot locate a 64-bit Oracle Client library错误提示就像一盆冷…...

从DICOM到3D打印:手把手教你用3D Slicer处理医学影像全流程(含STL导出)

从DICOM到3D打印:医学影像处理全流程实战指南 在数字化医疗时代,将CT、MRI等医学影像转化为可触摸的3D打印模型,正在成为临床教学、手术规划和医患沟通的革命性工具。这套技术链条中最关键的桥梁,正是开源的3D Slicer平台——它能…...

免费额度哪家强?ESP32玩家实测八大国产大模型API(含通义千问、Kimi、DeepSeek)

ESP32开发者指南:八大国产大模型API横向评测与实战选型 当ESP32遇上大语言模型,会擦出怎样的火花?在物联网设备上直接运行AI交互功能,已经成为越来越多开发者的新选择。但面对众多国产大模型API,如何选择最适合ESP32项…...

异构计算与实时控制:FET536-C国产核心板的架构解析与工业应用实践

1. 项目概述:为什么FET536-C是国产嵌入式的新选择?最近,飞凌嵌入式联合全志科技发布的FET536-C全国产核心板,在圈子里引起了不小的讨论。作为一名在工业控制和嵌入式设备开发领域摸爬滚打了十几年的工程师,我对这类“全…...

告别手动调时!用ESP8266+STM32F103ZET6打造自动校时RTC时钟(附完整代码)

基于ESP8266与STM32的智能时钟系统:从NTP同步到RTC校时的全链路实践 在物联网和嵌入式系统开发中,精确的时间同步往往是许多应用的基础需求。无论是数据记录、事件触发还是用户界面显示,一个"永不走时"的时钟系统都能显著提升产品的…...

保姆级教程:在Windows上用Python连接CoppeliaSim远程API(附避坑指南)

从零开始掌握CoppeliaSim与Python的远程控制:Windows环境实战指南 在机器人仿真领域,CoppeliaSim(原V-REP)因其强大的功能和友好的用户界面而广受欢迎。对于希望将Python的灵活性与CoppeliaSim的仿真能力结合的研究者和工程师来说…...

Linux网络编程实战:从Socket基础到高并发服务器设计

1. 项目概述:从套接字到应用,理解网络编程的基石当我们谈论Linux下的应用开发,尤其是那些需要与外界通信的程序时,“网络编程”是一个绕不开的核心技能。而“Internet Domain应用编程”这个听起来有些学术的标题,实际上…...

ARMv8-A架构LDP与LDR内存加载指令详解

1. A64指令集内存加载指令概述在ARMv8-A架构的A64指令集中,LDP(Load Pair)和LDR(Load Register)是两类最基础且关键的内存加载指令。作为从事ARM架构开发多年的工程师,我经常需要在底层系统编程和性能优化中…...

从MVC到DDD:微服务架构下应对业务复杂性的实战演进

1. 从“造到飞起”到“稳如老狗”:一个老码农的架构心路干了十几年开发,带过不少团队,也趟过无数坑。要说这些年最大的感受是什么,那就是:变化是常态,混乱是必然,而架构的价值,就是在…...

别再只读原始值了!MPU6050数据滤波与姿态解算入门:用STM32实现简易角度估算

从原始数据到稳定姿态:MPU6050滤波与解算实战指南 当你第一次成功读取MPU6050的原始数据时,可能会被那些不断跳动的数值弄得手足无措。这些看似杂乱的数据背后,隐藏着设备在三维空间中的运动秘密。本文将带你超越基础的数据读取,探…...

别再只会拖模块了!用Simulink S-Function把C++算法集成到模型里的保姆级教程

从零实现Simulink与C的深度集成:以PID控制器为例的工程实践指南 在工业自动化和控制系统的开发中,Simulink因其直观的图形化建模能力而广受欢迎。然而,当面对复杂的算法实现或需要复用现有C代码库时,单纯依赖图形化模块往往显得力…...