当前位置: 首页 > article >正文

Python:深入理解set_seed——确保机器学习实验的可重复性

1. 为什么我们需要set_seed做机器学习实验时最让人头疼的就是结果不可复现。昨天跑出来的准确率是92%今天同样的代码跑出来变成了89%。这种薛定谔的准确率让很多开发者抓狂。我在实际项目中就遇到过这种情况在调试模型时每次运行结果都不一样根本没法判断是代码改得好还是运气好。这背后的罪魁祸首就是随机性。从数据集的划分、模型参数的初始化到dropout层的随机屏蔽深度学习中的很多环节都依赖随机数。如果不控制随机种子每次运行程序时这些环节都会产生不同的随机数序列导致最终结果出现波动。set_seed的作用就是给这些随机过程上锁。它通过设置一个固定的种子值确保每次运行程序时生成的随机数序列完全相同。我在Kaggle比赛中就深有体会当所有参赛者使用相同的数据和模型时能否复现baseline结果往往取决于随机种子的设置。2. 随机种子的工作原理2.1 伪随机数的秘密计算机生成的随机数其实都是伪随机数。它们看起来随机但实际上是通过确定的数学公式计算出来的。这个公式需要一个起始值也就是我们说的种子(seed)。相同的种子一定会产生相同的随机数序列这是伪随机数生成器(PRNG)的基本特性。举个例子Python内置的random模块import random random.seed(42) print(random.random()) # 总是输出0.6394267984578837 print(random.random()) # 总是输出0.025010755222666936即使你换个电脑只要种子是42这两个随机数的值就绝对不会变。我在教学时经常用这个例子让学生理解种子的决定性作用。2.2 深度学习中的随机性来源在深度学习项目中随机性主要来自以下几个方面权重初始化神经网络的参数最初都是随机设置的数据shuffle训练数据在每轮epoch前的打乱顺序dropout层随机屏蔽部分神经元数据增强如图像的随机旋转、裁剪等我曾经在一个图像分类项目中发现即使设置了numpy和torch的随机种子结果仍然有波动。后来发现是数据加载器的worker设置了多线程而每个线程都有自己的随机状态。这个坑让我明白必须设置所有可能的随机源。3. 跨框架的set_seed实现3.1 基础设置方法一个完整的set_seed函数需要覆盖所有常用的科学计算库。下面是我在项目中使用的增强版def set_seed(seed, deterministicFalse): 设置所有随机种子以确保实验可重复 参数 seed: 整数种子值 deterministic: 是否启用确定性算法可能影响性能 import os import random import numpy as np import torch # 基础库种子设置 random.seed(seed) np.random.seed(seed) os.environ[PYTHONHASHSEED] str(seed) # PyTorch设置 torch.manual_seed(seed) torch.cuda.manual_seed(seed) torch.cuda.manual_seed_all(seed) # 多GPU情况 if deterministic: torch.backends.cudnn.deterministic True torch.backends.cudnn.benchmark False # TensorFlow设置如果安装 try: import tensorflow as tf tf.random.set_seed(seed) if deterministic: tf.config.experimental.enable_op_determinism() except ImportError: pass # 数据加载器设置 os.environ[CUBLAS_WORKSPACE_CONFIG] :4096:8这个版本比基础版增加了对操作系统环境变量和数据加载器的设置覆盖了更多潜在的随机源。我在多个项目中测试过能确保真正的实验可重复性。3.2 各框架的特殊注意事项PyTorch用户要注意torch.backends.cudnn.deterministicTrue会降低性能但能确保卷积运算的确定性数据加载器的worker_init_fn需要单独设置def seed_worker(worker_id): worker_seed torch.initial_seed() % 2**32 random.seed(worker_seed) np.random.seed(worker_seed) loader DataLoader(..., worker_init_fnseed_worker)TensorFlow用户要注意在TF2.x中除了设置全局种子某些操作可能需要单独设置操作级种子使用GPU时可能需要设置TF_DETERMINISTIC_OPS1环境变量4. 实际项目中的最佳实践4.1 种子选择策略很多人习惯用42作为种子向《银河系漫游指南》致敬但在实际项目中我建议基准测试使用固定种子如42确保结果稳定最终评估使用多个种子如42,123,999验证模型鲁棒性超参调优对每组超参尝试3-5个不同种子我曾经参与过一个NLP项目发现模型在种子42下表现很好但在其他种子下波动很大。这说明模型可能过拟合了特定随机状态最终我们通过调整模型结构解决了这个问题。4.2 随机种子的局限性虽然set_seed能解决大部分复现问题但有些情况仍然难以控制硬件差异不同GPU架构可能产生细微差异并行计算多线程/多进程的随机性难以完全控制第三方库某些库可能有自己的随机源未设置遇到这种情况时我的经验是记录完整的运行环境CUDA版本、库版本等在相同硬件条件下复现对结果保留合理的误差范围4.3 项目标准化建议为了团队协作方便我建议在每个项目中在config.py中定义默认种子在main.py开头调用set_seed在实验记录中注明使用的种子值对重要实验保存完整的随机状态快照# 保存随机状态 def save_random_state(path): state { random: random.getstate(), numpy: np.random.get_state(), torch: torch.random.get_rng_state() } torch.save(state, path) # 加载随机状态 def load_random_state(path): state torch.load(path) random.setstate(state[random]) np.random.set_state(state[numpy]) torch.random.set_rng_state(state[torch])这套方法在我们团队的多个项目中验证有效特别是在模型调试和A/B测试场景下特别有用。

相关文章:

Python:深入理解set_seed——确保机器学习实验的可重复性

1. 为什么我们需要set_seed? 做机器学习实验时,最让人头疼的就是结果不可复现。昨天跑出来的准确率是92%,今天同样的代码跑出来变成了89%。这种"薛定谔的准确率"让很多开发者抓狂。我在实际项目中就遇到过这种情况:在调…...

芯片测试工程师必看:Mentor DFT OCC时钟控制器实战配置与三大设计模式详解

芯片测试工程师必看:Mentor DFT OCC时钟控制器实战配置与三大设计模式详解 在芯片测试领域,时钟控制器的设计与配置一直是工程师面临的核心挑战之一。作为DFT(Design for Testability)工程师,我们每天都需要与各种时钟…...

电解电容寿命预测:从理论公式到工程实践

1. 电解电容寿命预测的基本原理 电解电容作为电子设备中的关键元件,其寿命直接影响整机可靠性。我曾参与过多个电源项目,亲眼见过因为电容失效导致的设备故障。要理解寿命预测,首先要明白电解电容的老化机制——电解液会随着时间和温度逐渐蒸…...

ARM 架构 JuiceFS 性能优化:基于 MLPerf 的实践与调优汲

Qt是一个跨平台C图形界面开发库,利用Qt可以快速开发跨平台窗体应用程序,在Qt中我们可以通过拖拽的方式将不同组件放到指定的位置,实现图形化开发极大的方便了开发效率,本笔记将重点介绍QSpinBox数值微调组件的常用方法及灵活应用。…...

算法——暴力+优化

本质这类型题本质就是基于暴力解法,优化其时间复杂度例题首先容易想到的就是组合型动态规划,可是由于在求以i位置为结尾的最长递增子序列的时候要遍历以[0-i-1]位置为结尾最长递增子序列的长度,所以时间复杂度会达到n^2。要求以i为结尾的最长…...

QWEN-AUDIO内容创作提效:营销文案→自然语音→一键导出WAV全流程

QWEN-AUDIO内容创作提效:营销文案→自然语音→一键导出WAV全流程 1. 引言:语音创作的新时代 你有没有遇到过这样的情况:写好了精彩的营销文案,却苦于找不到合适的配音?或者需要为视频内容添加语音,但自己…...

intv_ai_mk11 GPU算力适配案例:A10显存16GB下7B模型量化部署实操

intv_ai_mk11 GPU算力适配案例:A10显存16GB下7B模型量化部署实操 1. 项目背景与挑战 在AI模型部署实践中,如何在有限GPU资源上高效运行大语言模型一直是工程难题。本文将分享在NVIDIA A10G显卡(16GB显存)上部署intv_ai_mk11&…...

Appium启动参数避坑指南:新手常犯的5个错误及解决方案

Appium启动参数避坑指南:新手常犯的5个错误及解决方案 在移动应用UI自动化测试领域,Appium作为一款开源的跨平台测试框架,凭借其强大的兼容性和灵活性赢得了众多测试工程师的青睐。然而,对于刚接触Appium的新手来说,启…...

RadioHead嵌入式无线协议栈原理与STM32实战

1. RadioHead库概述:面向嵌入式系统的面向对象无线数据链路协议栈RadioHead 是一个专为资源受限嵌入式微处理器设计的、高度可移植的面向对象无线数据链路协议栈。它并非简单的射频驱动封装,而是一套完整的、分层抽象的通信框架,覆盖从物理层…...

从错误码到精准定位:307系列基站定位实战排障指南

1. 当你的设备突然"失联":307系列基站定位排障入门 第一次用ML307A模组调试基站定位功能时,我盯着串口助手连续跳出的126错误码整整半小时。就像在玩解谜游戏,设备明明显示网络信号满格,AT指令也返回了OK,但…...

【自动驾驶】从几何到代码:车辆运动学模型的推导与Python实践

1. 车辆运动学模型基础概念 第一次接触自动驾驶车辆建模时,我被各种坐标系和参数搞得晕头转向。直到把车辆想象成小时候玩的遥控车,才突然开窍——原来我们只需要知道车子位置、朝向和速度,就能预测它下一秒会跑到哪里。这就是车辆运动学模型…...

HMC5883L磁力计驱动开发与磁场校准实战

1. HMC5883L数字罗盘传感器技术解析与嵌入式驱动开发实践1.1 器件定位与工程价值HMC5883L是由Honeywell公司推出的三轴磁阻式数字罗盘传感器,属于高精度、低功耗、IC接口的MEMS磁力计芯片。在嵌入式系统中,它并非仅用于“指南针”这一表层功能&#xff0…...

Rust的匹配中的质量辅助

Rust的匹配机制以其强大的类型安全和表达能力著称,而其中的质量辅助功能更是为开发者提供了高效且可靠的编程体验。质量辅助不仅帮助开发者在编写匹配语句时减少错误,还能通过编译器的智能提示和检查,提升代码的可读性和健壮性。无论是处理枚…...

存储那么贵,何不白嫖飞书云文件空间还

基础示例:单工作表 Excel 转 TXT 以下是将一个 Excel 文件中的第一个工作表转换为 TXT 的完整步骤: 1. 加载并读取Excel文件 from spire.xls import * from spire.xls.common import * workbook Workbook() workbook.LoadFromFile("示例.xlsx"…...

如何用PDF Arranger轻松管理PDF文档:终极免费工具指南

如何用PDF Arranger轻松管理PDF文档:终极免费工具指南 【免费下载链接】pdfarranger Small python-gtk application, which helps the user to merge or split PDF documents and rotate, crop and rearrange their pages using an interactive and intuitive graph…...

逐行拆解 STM32F4-CAN-IAP:一份“代码即文档”的功能级说明书

STM32F4的CAN升级方案 bootloader源代码,对应测试用app源代码,都是keil工程,代码有备注,也有使用说明。 带对应上位机可执行文件。 上位机vs2013开发(默认exe,源代码需要额外拿)(适用于:拿到源码…...

Omron NX程序自动化电池焊接检测机:人机配方一键换型,智能故障记录与统计,EtherCA...

omron欧姆龙NX程序NX1P2-1040DT,搭载思勤EtherCAT远程输入输出IO模块 全自动电池焊接检测机 涵盖人机配方一键换型功能,故障记录功能,产量统计及OEE功能,TCP,视觉通信控制,EIP远程IO通信,松下A6…...

三菱FX3U PLC与变频器Modbus RTU通讯控制案例:实现启停、频率设定与读取功能...

三菱FX3U与三菱变频器 modbus RTU通讯案例 器件:三菱FX3U PLCFX3U 485BD,三菱E740变频器,昆仑通态触摸屏,威纶通 功能:采用485方式,modbus RTU协议。 与变频器通讯,控制启停,频率&am…...

Java的java.lang.runtime.ObjectMethods记录类方法自动生成的底层机制

Java记录类方法自动生成的底层机制探秘 在Java 14中引入的记录类(Record)简化了不可变数据载体的定义,而其背后的java.lang.runtime.ObjectMethods类则是实现自动生成equals()、hashCode()和toString()等核心方法的关键。这一机制通过编译时…...

ESP8266驱动1.44英寸ST7735 TFT屏的实战指南与图像显示优化

1. ESP8266与ST7735屏的硬件连接实战 第一次用ESP8266驱动1.44寸ST7735屏时,最让我头疼的就是引脚接线问题。不同厂商的屏幕引脚定义可能略有差异,但核心信号线基本一致。我手头这块屏采用8针SPI接口,实际测试发现用NodeMCU开发板连接最方便。…...

STM32开发效率翻倍:在Clion里集成DeepSeek Cline插件实现智能代码补全与调试

STM32开发效率翻倍:在CLion中集成DeepSeek Cline实现智能编码革命 嵌入式开发领域正在经历一场由AI驱动的生产力变革。对于使用STM32系列芯片的中高级开发者来说,将DeepSeek Cline插件集成到CLion开发环境中,可以显著提升HAL库和标准库开发的…...

告别算法地狱!用XVF3800麦克风阵列快速打造智能语音产品(附开发板选型指南)

告别算法地狱!用XVF3800麦克风阵列快速打造智能语音产品(附开发板选型指南) 在智能语音交互设备爆发的今天,从智能音箱到会议系统,清晰的远场拾音能力已成为产品标配。但传统方案需要自研波束成形、回声消除等复杂算法…...

放弃CMSIS-DSP?实测STM32H7优化RNNoise神经网络运算的几种思路与效果对比

STM32H7神经网络加速实战:从CMSIS-DSP到手工优化的性能突围 在嵌入式音频处理领域,实时噪声抑制一直是工程师们面临的挑战。当我们将目光投向STM32H7这类高性能微控制器时,往往会期待其Cortex-M7内核与双精度FPU能轻松应对神经网络计算。但现…...

当图论遇到优化:手把手教你用分支限界法解决带权顶点覆盖问题(C++实现)

当图论遇到优化:手把手教你用分支限界法解决带权顶点覆盖问题(C实现) 在算法优化的世界里,图论问题总是散发着独特的魅力。想象这样一个场景:你需要在一个城市部署最少数量的监控摄像头,每个位置的安装成本…...

Go语言的sync.RWMutex读

Go语言中的sync.RWMutex:高效读锁的奥秘 在多线程编程中,读写锁(RWMutex)是一种经典的同步机制,它允许多个读操作并发执行,而写操作则需要独占访问。Go语言的sync.RWMutex正是为此设计,尤其适合…...

下一个任务-----利用辅助服务自动关掉app广告

这应该也比较容易吧。--------我自己用总可以吧-----我还要把这个给他开源出来...

app充电电流查看器UI设计

...

app电池fragment功能设计

1电池充电电流电池容量✅ 是设计容量、实际容量电池健康度✅ 是健康/过热/过压/故障等状态电池电压✅ 是当前电压(mV)电池温度✅ 是当前温度(C)6 电池电量7 电池电量达到一定数值,自动报警功能8 电池达到99%自动报警功...

AI原生物联网开发到底难在哪?2026奇点大会首席架构师亲授:从LLM-Agent嵌入到超低功耗NPU调度的12小时攻坚路径

第一章:AI原生物联网开发的范式革命与奇点临界点 2026奇点智能技术大会(https://ml-summit.org) 传统物联网开发长期受限于“云中心化推理边缘数据采集”的割裂架构,设备仅作为传感器与执行器存在,智能决策权被牢牢锁定在远端服务器。而AI原…...

别只盯着速度!STM32G474 CCM SRAM在电机控制FOC算法中的实战避坑指南

STM32G474 CCM SRAM在电机控制FOC算法中的高阶应用与避坑指南 电机控制领域对实时性的苛刻要求,让每一位工程师都在与时间赛跑。当你的PID调节器因为几微秒的延迟导致电机震动,或是中断服务程序(ISR)响应不及时引发系统不稳定时,CCM SRAM这个…...