当前位置: 首页 > article >正文

《流畅的Python》读书笔记07(补充03): 对象引用、可变性和垃圾回收 - 深复制循环引用内存安全机制解析

Python的copy.deepcopy()函数在处理循环引用时通过内部的备忘录memo字典机制来打破无限递归确保复制过程能够正确终止。这个memo字典本身的设计就考虑了内存管理的安全性在正常情况下不会导致内存泄漏。其核心机制是备忘录字典的生命周期与单次深复制调用绑定在复制完成后该字典会被自动回收。一、memo字典的生命周期与作用域管理deepcopy()函数将memo字典作为参数在其内部递归调用链中传递。该字典仅在单次深复制操作期间存在操作结束后由于没有外部引用指向它它会被Python的垃圾回收器正常回收。import copy import sys def track_memory(obj_name, obj): 追踪对象引用计数和内存地址 print(f{obj_name}: id{id(obj):#x}, refcount{sys.getrefcount(obj)-1}) # 示例观察单次深复制过程中的memo original_list [1, 2, 3] original_list.append(original_list) # 创建对自己的循环引用 print(开始深复制过程追踪...) # 模拟一次深复制调用 result copy.deepcopy(original_list) # 深复制完成后尝试访问内部的memo是不可能的因为它是一个局部变量 # 以下代码会引发AttributeError证明memo已不可访问 try: # 尝试访问不存在的属性说明memo已随函数调用结束而销毁 _ result.__memo__ except AttributeError: print(深复制完成后内部的memo字典已不可访问说明其生命周期已结束。) # 验证复制结果保持了循环引用结构 print(f原对象自我引用: {original_list[-1] is original_list}) # True print(f副本对象自我引用: {result[-1] is result}) # True二、memo字典的键值设计弱引用与ID映射备忘录字典使用对象的id()即内存地址作为键而非对象本身。这避免了因将对象本身作为键而意外增加其引用计数。值则是该对象对应的副本。这种id-副本的映射关系是临时的且键整数id和值新创建的副本在复制结束后只要没有外部引用都会被妥善清理。import copy import gc class DataNode: def __init__(self, value): self.value value self.ref None # 创建循环引用 node1 DataNode(Node1) node2 DataNode(Node2) node1.ref node2 node2.ref node1 # 形成双向循环引用 print(深复制前对象状态:) print(fnode1 id: {id(node1):#x}, refcount: {sys.getrefcount(node1)-1}) print(fnode2 id: {id(node2):#x}, refcount: {sys.getrefcount(node2)-1}) # 执行深复制 copied_node copy.deepcopy(node1) print( 深复制后对象状态:) print(f原node1 id: {id(node1):#x}, refcount: {sys.getrefcount(node1)-1}) print(f原node2 id: {id(node2):#x}, refcount: {sys.getrefcount(node2)-1}) print(f副本node id: {id(copied_node):#x}) # 强制垃圾回收观察对象是否被正确清理模拟memo字典释放后的场景 print( 执行垃圾回收...) collected gc.collect() print(f回收的垃圾对象数量: {collected}) # 验证原对象和副本的独立性 print(f 原对象循环引用保持: {node1.ref.ref is node1}) # True print(f副本对象循环引用保持: {copied_node.ref.ref is copied_node}) # True print(f原对象与副本不同: {copied_node is not node1}) # True三、递归复制流程与memo的更新机制在递归复制过程中算法遵循“先注册后填充”的策略这是避免无限递归和正确处理循环引用的关键。遇到新对象将其id和新创建的空壳副本存入memo。递归填充属性再逐步递归地复制该对象的内部数据到空壳副本中。遇到已记录对象直接从memo中返回已创建的副本。这个流程确保了即使在复制对象的属性时又引回了对象自身也能通过查表找到“半成品”副本并返回从而打破循环链。import copy class TreeNode: def __init__(self, name): self.name name self.children [] self.parent None # 指向父节点的引用容易形成循环 def add_child(self, child): self.children.append(child) child.parent self # 构建一个树形结构子节点通过parent指回根节点形成循环 root TreeNode(root) child1 TreeNode(child1) child2 TreeNode(child2) root.add_child(child1) root.add_child(child2) # 此时结构为root - child1, root - child2 (通过parent指针) print(开始深复制树结构...) copied_tree copy.deepcopy(root) print(f原根节点: {root.name}, 父节点: {root.parent}) # None print(f原子节点child1的父节点: {child1.parent.name if child1.parent else None}) # root print(f副本根节点: {copied_tree.name}, 父节点: {copied_tree.parent}) # None print(f副本子节点child1的父节点: {copied_tree.children[0].parent.name if copied_tree.children[0].parent else None}) # root (副本) # 验证循环引用被正确复制且无泄漏 print(f 验证独立性:) print(f原root is 副本root? {root is copied_tree}) # False print(f原child1 is 副本child1? {child1 is copied_tree.children[0]}) # False print(f副本中child1的父节点是副本root? {copied_tree.children[0].parent is copied_tree}) # True四、与Python垃圾回收机制的协同Python的垃圾回收主要基于引用计数并辅以分代回收来处理循环引用。deepcopy的memo机制与GC协同工作引用计数memo字典对键id和值副本的持有是短暂的。复制完成后如果用户没有保存对副本的引用副本的引用计数会降为0并被立即销毁。memo字典本身的引用计数在deepcopy函数返回后也降为0。分代回收对于更复杂的循环引用例如副本对象之间因复制逻辑又形成了新的循环即使引用计数不为0分代垃圾回收器也能识别并回收这些不可达的循环引用组。memo字典本身如果因为某些极端情况如自定义__deepcopy__错误地持有了它的引用而未能释放也会被分代回收器处理。import copy import gc import weakref def check_memo_leak_simulation(): 模拟并检查在一次深复制后相关对象是否被正确释放 class ComplexCyclic: def __init__(self, tag): self.tag tag self.link None # 创建一个小型循环引用对象图 obj_a ComplexCyclic(A) obj_b ComplexCyclic(B) obj_c ComplexCyclic(C) obj_a.link obj_b obj_b.link obj_c obj_c.link obj_a # A-B-C-A 循环 # 使用弱引用来追踪原对象确保不影响其引用计数 weak_ref_to_a weakref.ref(obj_a) weak_ref_to_b weakref.ref(obj_b) weak_ref_to_c weakref.ref(obj_c) print(深复制前原对象通过弱引用可访问:) print(f obj_a: {weak_ref_to_a() is not None}) print(f obj_b: {weak_ref_to_b() is not None}) print(f obj_c: {weak_ref_to_c() is not None}) # 执行深复制 copied copy.deepcopy(obj_a) # 删除对原对象的所有强引用 del obj_a, obj_b, obj_c # 强制垃圾回收 gc.collect() print( 删除强引用并GC后原对象状态:) print(f obj_a: {weak_ref_to_a() is not None}) # 应变为False print(f obj_b: {weak_ref_to_b() is not None}) # 应变为False print(f obj_c: {weak_ref_to_c() is not None}) # 应变为False # 检查副本的循环结构是否完整 print(f 副本循环结构完整性检查:) print(f copied.tag {copied.tag}) print(f copied.link.tag {copied.link.tag}) print(f copied.link.link.tag {copied.link.link.tag}) print(f copied.link.link.link is copied? {copied.link.link.link is copied}) # 应为True check_memo_leak_simulation()五、潜在风险与最佳实践尽管copy.deepcopy()内部的memo机制本身是安全的但在自定义__deepcopy__()方法时如果实现不当可能会引入内存泄漏风险。风险场景错误示例正确做法在__deepcopy__外保存memo引用将memo赋值给实例属性或全局变量memo只作为参数使用不长期保存未调用父类或默认复制逻辑自定义方法中遗漏了对部分属性的深复制使用copy.deepcopy(obj, memo)处理属性创建不必要的强引用在副本中错误地引用原对象或memo确保副本仅引用其他副本或新对象安全实现__deepcopy__的模板import copy class SafeCustomClass: def __init__(self, data, childrenNone): self.data data self.children children if children is not None else [] self._transient_cache {} # 临时缓存不应复制 def __deepcopy__(self, memo): # 1. 检查备忘录避免重复复制和无限递归 obj_id id(self) if obj_id in memo: return memo[obj_id] # 2. 创建新实例的“空壳”并立即注册到memo中 # 这是处理循环引用的关键步骤 new_obj self.__class__(self.data) memo[obj_id] new_obj # 3. 递归地深复制所有需要复制的属性 # 注意跳过不应复制的属性如_transient_cache new_obj.children [copy.deepcopy(child, memo) for child in self.children] # 4. 返回构建好的副本 return new_obj # 使用示例 obj SafeCustomClass(root, [SafeCustomClass(child)]) obj.children[0].children.append(obj) # 创建循环引用 copied copy.deepcopy(obj) print(f循环引用保持: {copied.children[0].children[0] is copied}) # True print(f临时缓存未被复制: {not hasattr(copied, _transient_cache) or copied._transient_cache {}}) # 应为True结论Python标准库中copy.deepcopy()函数使用的memo字典机制是内存安全的。其设计保证了字典本身仅在单次复制操作的生命周期内存在通过以对象ID为键、避免增加原对象引用计数并在操作结束后及时释放有效避免了内存泄漏。对于开发者而言主要风险来自于错误地实现自定义类的__deepcopy__方法。遵循“先注册空壳再递归填充”的模式并确保不长期持有对memo的引用即可安全地处理包含循环引用的复杂对象的深复制。参考来源《流畅的Python》读书笔记07: 第一部分 数据结构 - 对象引用、可变性和垃圾回收

相关文章:

《流畅的Python》读书笔记07(补充03): 对象引用、可变性和垃圾回收 - 深复制循环引用内存安全机制解析

Python的copy.deepcopy()函数在处理循环引用时,通过内部的备忘录(memo)字典机制来打破无限递归,确保复制过程能够正确终止。这个memo字典本身的设计就考虑了内存管理的安全性,在正常情况下不会导致内存泄漏。其核心机制…...

基于知识图谱InsightGraph — 让数据开口说话。

从Palantir的ontology思路出发,我们踩了一遍知识图谱的坑让数据从"分散的资产",变成"会分析、会归因的业务伙伴"💼你一定遇到过这些问题这份数据和其他系统能不能关联?问了三个人有三个答案运营问"为什么…...

【Qt学习】基本类型、日志输出、字符串、QVariant

文章目录基本数据类型日志输出Qt Creator中看日志单独控制台看日志字符串类型示例字符串拼接字符串长度QVariant示例变量相加自定义类型前文回顾: 【Qt学习】Windows上环境配置与项目初识 【Qt学习】三个窗口类、坐标系、内存回收 基本数据类型 Qt基本数据类型定义…...

如何在15分钟内搭建个人游戏串流服务器:Sunshine跨平台游戏串流终极指南

如何在15分钟内搭建个人游戏串流服务器:Sunshine跨平台游戏串流终极指南 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine 想要在任何设备上畅玩PC游戏大作吗&#xff1f…...

从游戏主机到云端:如何用Sunshine打造你的私人游戏串流服务器

从游戏主机到云端:如何用Sunshine打造你的私人游戏串流服务器 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine 你是否曾经想过,在客厅的电视上玩电脑游戏&am…...

SQLite Viewer:3分钟学会在线查看SQLite数据库的终极方案

SQLite Viewer:3分钟学会在线查看SQLite数据库的终极方案 【免费下载链接】sqlite-viewer View SQLite file online 项目地址: https://gitcode.com/gh_mirrors/sq/sqlite-viewer 想象一下,你收到一个SQLite数据库文件,需要立即查看其…...

真正的爱是接受对方本来的样子

武志红说:爱是如TA所是,而非如你所愿。真正的爱是接受对方本来的样子,而不是把对方改造成你想要的样子。爱是如TA所是意味着:你爱的是这个人本身,而不是你想象中的TA。你不需要改变对方来满足你的期望。你接受TA的优点…...

如何快速解锁QQ音乐加密音频的完整指南:QMCDecode工具终极解决方案

如何快速解锁QQ音乐加密音频的完整指南:QMCDecode工具终极解决方案 【免费下载链接】QMCDecode QQ音乐QMC格式转换为普通格式(qmcflac转flac,qmc0,qmc3转mp3, mflac,mflac0等转flac),仅支持macOS,可自动识别到QQ音乐下载目录&…...

三周、1.81倍、百亿:中国AI的压制性时刻

调用量飙升、百亿美元涌入、智能体密集落地——过去七天,中国AI正在改写全球游戏规则。与此同时,内容创作者的“AI红利窗口”也正在打开。连续三周,中国AI压住美国5月18日,OpenRouter最新数据显示,5月11日至17日当周&a…...

蚂蚁面试实录:手撕多头注意力到LoRA配置的九个坑

面试开场:写代码,别背公式蚂蚁AI应用开发岗面试一开始,面试官没有让我复述Transformer定义,而是直接说:“用PyTorch手写一个Multi-Head Attention,讲清楚Q、K、V的维度变化。”这种考察方式在蚂蚁很常见&am…...

如何3秒破解百度网盘提取码?这个智能工具让你告别繁琐搜索

如何3秒破解百度网盘提取码?这个智能工具让你告别繁琐搜索 【免费下载链接】baidupankey 项目地址: https://gitcode.com/gh_mirrors/ba/baidupankey 还在为百度网盘资源下载卡在提取码环节而烦恼吗?每次找到心仪的学习资料或工作文件&#xff0…...

国家数据局印发《2026年数字经济发展工作要点》:八项任务背后的数据治理信号

大家好,我是独孤风。5月19日,国家数据局印发《2026年数字经济发展工作要点》。这不是一份泛泛谈数字经济的文件,而是对 2026 年数字经济工作的重点部署。从文件内容看,2026 年数字经济工作的关键词并不只是“上云、用数、用 AI”&…...

Behavioral面试最致命的送命题:如何将“谈谈你最惨痛的失败”逆袭为大厂加分项

在 2026 年全球科技大厂与顶尖金融机构的校招与社招面试中,无论是硅谷某头部科技巨头、北美量化基金大厂,还是亚太 Tier-1 金融机构,Behavioral Question(行为面试,简称 BQ)在最终录用决定(Hiri…...

AArch64虚拟化调试:HDFGWTR2_EL2寄存器详解与应用

1. AArch64系统寄存器与虚拟化调试概述在Armv8/v9架构中,系统寄存器是处理器核心的控制中枢,负责管理处理器的各种关键功能和行为。AArch64架构通过异常级别(EL0-EL3)实现了严格的权限分级机制,其中EL2作为Hypervisor层…...

ARMv8-A架构TRCCCCTLR寄存器原理与应用解析

1. AArch64 TRCCCCTLR寄存器深度解析在ARMv8-A架构的调试与追踪子系统中,TRCCCCTLR(Trace Cycle Count Control Register)扮演着关键角色。作为CoreSight追踪架构的重要组成部分,该寄存器专门用于管理指令执行周期的计数阈值。当F…...

AArch64 TRCCNTCTLR寄存器详解与调试技巧

1. AArch64 TRCCNTCTLR寄存器概述在AArch64架构中,TRCCNTCTLR(Trace Counter Control Register)是嵌入式跟踪扩展(FEAT_ETE)功能的重要组成部分。作为系统调试和性能分析的核心组件,它负责控制跟踪计数器的…...

抖音无水印下载器全解析:从零构建你的个人视频收藏库

抖音无水印下载器全解析:从零构建你的个人视频收藏库 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback suppor…...

如何三步完成QQ音乐加密音频的免费解密:解决音乐格式兼容性难题

如何三步完成QQ音乐加密音频的免费解密:解决音乐格式兼容性难题 【免费下载链接】QMCDecode QQ音乐QMC格式转换为普通格式(qmcflac转flac,qmc0,qmc3转mp3, mflac,mflac0等转flac),仅支持macOS,可自动识别到QQ音乐下载目录&#xf…...

ARMv8/v9架构TRCIDR寄存器详解与调试实践

1. AArch64 TRCIDR寄存器概述在ARMv8/v9架构的调试系统中,TRCIDR(Trace ID Registers)系列寄存器扮演着关键角色。这些64位系统寄存器专门用于向软件报告处理器的跟踪单元功能特性,是调试基础设施的重要组成部分。当处理器实现了F…...

2026年最新亲测3款生成会议纪要免费工具推荐,10分钟出稿非常好用!

兄弟们,我来了。作为一个天天泡在会议室、钉钉和飞书里来回切换的职场老兵,我太懂“开会一时爽,整理火葬场”的痛苦了。这几年,各种AI录音转文字、语音转写工具层出不穷,但真正能打、能免费白嫖、还不乱收费的&#xf…...

Display Driver Uninstaller (DDU) 终极指南:显卡驱动彻底清理的完整解决方案

Display Driver Uninstaller (DDU) 终极指南:显卡驱动彻底清理的完整解决方案 【免费下载链接】display-drivers-uninstaller Display Driver Uninstaller (DDU) a driver removal utility / cleaner utility 项目地址: https://gitcode.com/gh_mirrors/di/displa…...

C++智能指针与内存管理实践

C智能指针与内存管理实践智能指针是C中自动管理动态内存的关键工具。通过RAII机制,智能指针在对象生命周期结束时自动释放内存,避免内存泄漏和悬空指针问题。std::unique_ptr提供独占所有权语义,确保同一时刻只有一个指针拥有资源。它的开销极…...

华硕笔记本性能优化神器:G-Helper轻量控制工具完全指南

华硕笔记本性能优化神器:G-Helper轻量控制工具完全指南 【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Zenbook, E…...

如何快速掌握Blender 3MF插件:3个高效配置技巧实现CAD到3D打印无缝工作流

如何快速掌握Blender 3MF插件:3个高效配置技巧实现CAD到3D打印无缝工作流 【免费下载链接】Blender3mfFormat Blender add-on to import/export 3MF files 项目地址: https://gitcode.com/gh_mirrors/bl/Blender3mfFormat 你是否在为Blender与3D打印机之间的…...

【AI】多阶段执行:分阶段完成大型任务

多阶段执行:分阶段完成大型任务📝 本章学习目标:本章介绍流程编排,让AI Agent执行更加规范可控。通过本章学习,你将全面掌握"多阶段执行:分阶段完成大型任务"这一核心主题。一、引言:…...

深耕 Harness 工程,解锁 AI Agent 开发之路

2026三掌柜赠书活动第三十一期 Harness工程:从上下文管理到Agent系统构建 目录 前言 详解Harness工程核心价值与独特优势 关于《Harness工程:从上下文管理到Agent系统构建》 编辑推荐 内容简介 作者简介 图书目录 《Harness工程:从上…...

Parsec虚拟显示驱动实战教程:5步创建完美游戏串流显示环境

Parsec虚拟显示驱动实战教程:5步创建完美游戏串流显示环境 【免费下载链接】parsec-vdd ✨ Perfect virtual display for game streaming 项目地址: https://gitcode.com/gh_mirrors/pa/parsec-vdd Parsec虚拟显示驱动(Parsec VDD)是一…...

AgentCore Memory的记忆哲学:让Agent学会“忘记”

大多数关于AI记忆的讨论都在谈“如何记住更多”。但问题不是记住,而是记住什么、忘记什么、以及当新旧信息冲突时该相信谁。假设用户第1天说“预算500美元”,第30天说“预算改成800了”,第60天用三种不同措辞说了“我喜欢Python”。没有整合能…...

哔哩下载姬DownKyi:新手也能快速上手的B站视频下载解决方案

哔哩下载姬DownKyi:新手也能快速上手的B站视频下载解决方案 【免费下载链接】downkyi 哔哩下载姬downkyi,哔哩哔哩网站视频下载工具,支持批量下载,支持8K、HDR、杜比视界,提供工具箱(音视频提取、去水印等&…...

官方证书+创作基金等你拿|“AI绘童趣·童心创科普”庆六一活动正式启动!

为庆祝六一国际儿童节,守护青少年纯真的好奇心与想象力,百度文心大模型携手海豚出版社、天津人民出版社,共同推出“文心创作周六一特辑”,面向全国青少年及社会创作者发起“AI绘童趣童心创科普”青少年科普绘本创作活动。活动以ER…...