关于Pytorch转换为MindSpore的一点建议
一、事先准备
必须要对Mindspore有一些了解,因为这个框架确实有些和其它流程不一样的地方,比如算子计算、训练过程中的自动微分,所以这两个课程要好好过一遍,官网介绍文档最好也要过一遍
1、零基础Mindspore:https://www.bilibili.com/video/BV1CS4y1z72r/?spm_id_from=333.337.search-card.all.click
2、MindSpore进阶课程:https://www.bilibili.com/video/BV12W4y1t7yn/?spm_id_from=333.337.search-card.all.click

3、Mindspore教程:MindSpore教程 — MindSpore master documentation

对这些课程和文档过一遍后,可以去看几个数据加载和模型训练的案例
最好是自定义数据集加载,因为大多数据集都是表格或者其它,图像分类案例较少
跑一下几个案例,理解他们的这个过程
二、框架转换过程注意事项
框架转换主要有以下基本,拿转换医学影像分割的来讲述(pytorch-》Mindspore)
官网也是有给网络迁移部分的要点说明的,也可以好好看看

转换之前一定要理解自己原有网络当中的每一部分的处理、每一部分的数据形态和类型,这样转换起来比较容易
1、数据集导入
判断好数据集是什么类型,能否用快捷方式加载,如果不能就自定义数据集,然后用GeneratorDataset进行加载
数据加载类,注意最后返回的要是两部分值,前者为数据,后者为标签

一定要这样,因为GeneratorDataset需要这种形式,期间的计算,每一步可以看看有无问题,形态和原有网络保持一致
2、网络结构搭建
2.1 如果已经有算法,也有网络,那就一层的对比着看,保证每层输入输出一样

2.2 对应的网络中的API计算,大多都能对应上,主要有部分会有细节差异,需要去官网查询对应API,填写适应参数
如这里和pytorch的就不一样,mindspore中的scale_factor不能和bilinear一起,所有要替换为其它插值方式,另外插值法方式也会影响padding的值

就是要保证每层的输入输出都一致,计算要正常,如这里mindspore不写stride=2就会导致后面的计算出问题

2.3 一点一点的对比和尝试,必须要保证网络重每一步的计算前和计算后的数据形态一样
最终的输出也是要保持一致,数据经过网络得到预测值,预测值的shape注意保持一致
3、模型训练
一定要保证数据的准确,在pytorch内是什么形式在mindspore内也要是
对于梯度和loos的计算,多打印出来看一看,虽然pytorch和mindspore训练过程有所不同,但整体还是相似的

注意label的shape要和模型输出的logit一样,这样才能计算loss,这里可能会有维度不相同,那就去掉无关维度即可,mindspore里也有squeeze,多看看文档
流程就是,训练step内使用gard_fn,进行自动微分计算(这里mindspore用了这就不用梯度清零了),自动微分计算value_and_grad中又会调用前向传播函数,前向传播中涉及到loos的计算,一般只要loss输出没有问题,那么其它都是小事情
注意各项的形式,很容易理解的还是
4、训练和评估
这个过程就很简单了,只要前面定义好训练step和其他的什么优化器、损失函数还有前向传播网络什么的,那么这就很简单了,获取可迭代数据进行一个batch一个batch的训练就行了,loss可以计算可以输出,模型的评估上mindspore里面也有提供一些自定义的评估,看需要用到什么,先去搜搜看,看看如何使用的,直接套用即可

5、模型保存和调用推理
这部分就很简单了,按照格式定义即可

三、总结
整体来说,只要数据集构建没有问题,网络结构没有问题(需要计算测试)
那么框架转换就很简单了,因为训练的流程都大致相同,虽然mindspore里面没有梯度清零什么的
但是也有独特的自动微分梯度求导,这个多看几个案例,其实也是一套流程
相关文章:
关于Pytorch转换为MindSpore的一点建议
一、事先准备 必须要对Mindspore有一些了解,因为这个框架确实有些和其它流程不一样的地方,比如算子计算、训练过程中的自动微分,所以这两个课程要好好过一遍,官网介绍文档最好也要过一遍 1、零基础Mindspore:https://…...
JetBrains IDEA 新旧UI切换
JetBrains IDE 新旧UI切换 IntelliJ IDEA 的老 UI 以其经典的布局和稳定的性能,成为了许多开发者的首选。而新 UI 则在此基础上进行了全面的改进,带来了更加现代化、响应式和高效的用户体验。无论是新用户还是老用户,都可以通过了解和适应这…...
iOS KeychainAccess的了解与使用
KeychainAccess 是一个用于 iOS、macOS、tvOS 和 watchOS 上的 Swift 密钥链访问库。它提供了一个简单且安全的 API,用于在设备的密钥链中存储和检索数据。 KeychainAccess 的一些主要特点包括: 简单易用的 API:该库提供了一个直观的 API,可以轻松地将数据存储和检…...
STM32 Customer BootLoader 刷新项目 (二) 方案介绍
STM32 Customer BootLoader 刷新项目 (二) 方案介绍 文章目录 STM32 Customer BootLoader 刷新项目 (二) 方案介绍1. 需求分析2. STM32 Memery介绍3. BootLoader方案介绍4. 支持指令 1. 需求分析 首先在开始编程之前,我们先详细设计一下BootLoder的方案。 本项目做…...
2-14 基于matlab的GA优化算法优化车间调度问题
基于matlab的GA优化算法优化车间调度问题。n个工作在m个台机器上加工。已知每个工作中工序加工顺序、各工序的加工时间以及每个工件所包含的工序,在满足约束条件的前提下,目的是确定机器上各工件顺序,以保证某项性能指标最优。程序功能说明&a…...
Program-of-Thoughts(PoT):结合Python工具和CoT提升大语言模型数学推理能力
Program of Thoughts Prompting:Disentangling Computation from Reasoning for Numerical Reasoning Tasks github:https://github.com/wenhuchen/Program-of-Thoughts 一、动机 数学运算和金融方面都涉及算术推理。先前方法采用监督训练的形式,但这…...
ansible setup模块
用于收集有关目标主机的系统和网络信息,并将这些信息存储为一个facts变量,可以在Playbook的后续任务中使用。setup模块可以用来获取主机的操作系统、软件包、IP地址、内存、磁盘和其他硬件信息。这些信息对编写Playbook和进行条件判断非常有用。当你在Pl…...
【2024最新华为OD-C/D卷试题汇总】[支持在线评测] LYA的测试用例执行计划(100分) - 三语言AC题解(Python/Java/Cpp)
🍭 大家好这里是清隆学长 ,一枚热爱算法的程序员 ✨ 本系列打算持续跟新华为OD-C/D卷的三语言AC题解 💻 ACM银牌🥈| 多次AK大厂笔试 | 编程一对一辅导 👏 感谢大家的订阅➕ 和 喜欢💗 📎在线评测链接 https://app5938.acapp.acwing.com.cn/contest/2/problem/OD…...
NSIS 入门教程 (一)
介绍 大多数应用程序都附带一个安装程序,它将所需的文件复制到正确的文件夹中,创建注册表项,并提供卸载例程以(希望)从计算机中彻底删除应用程序. 有多种解决方案可以为自主开发的应用程序配备安装程序。除了Install …...
cve-2015-3306-proftpd-vulfocus
1.原理 proftp是用于搭建基于ftp协议的应用软件 ProFTPD是ProFTPD团队的一套开源的FTP服务器软件。该软件具有可配置性强、安全、稳定等特点。 ProFTPD 1.3.5中的mod_copy模块允许远程攻击者通过站点cpfr和site cpto命令读取和写入任意文件。任何未经身份验证的客户端都可以…...
超详细!想进华为od的请疯狂看我!
三分钟带你全面了解华为OD 【合同及管理】签约方为科锐国际/外企德科(人力服务公司),劳动合同期为4年,试用期6个月。员工关系合同管理、五险一金、考勤发薪由科锐国际/外企德科负责;定级定薪、员工培训、工作安排、绩…...
MQTT协议与TCP/IP协议在性能上的区别
MQTT协议与TCP/IP协议在性能上的区别主要体现在以下几个方面: 1.协议开销与传输效率: ① MQTT:MQTT协议针对消息传递进行了优化,使用了小型的控制包和变长的包头设计,极大程度地减少了数据传输过程中的冗余和带宽消耗…...
LeetCode 每日一题 2024/6/17-2024/6/23
记录了初步解题思路 以及本地实现代码;并不一定为最优 也希望大家能一起探讨 一起进步 目录 6/17 522. 最长特殊序列 II6/18 2288. 价格减免6/19 2713. 矩阵中严格递增的单元格数6/20 2748. 美丽下标对的数目6/21 LCP 61. 气温变化趋势6/22 2663. 字典序最小的美丽字…...
FlinkCDC pipeline模式 mysql-to-paimon.yaml
flinkcdc 需要引入: source端: flink-cdc-pipeline-connector-mysql-xxx.jar、mysql-connector-java-xxx.jar、 sink端: flink-cdc-pipeline-connector-paimon-xxx.jar flinkcdc官方提供connect包下载地址,pipeline模式提交作业和…...
mysql数据库入门手册
数据库 常见的数据库查看当前用户及其权限创建用户授权用户访问数据库撤销用户权限修改用户密码删除用户增创建一个数据库创建表表中插入数据表中添加字段(三种方式) 删删除表记录删除表字段删除表(三种方式)删除数据库 改修改表名…...
增强大型语言模型(LLM)可访问性:深入探究在单块AMD GPU上通过QLoRA微调Llama 2的过程
Enhancing LLM Accessibility: A Deep Dive into QLoRA Through Fine-tuning Llama 2 on a single AMD GPU — ROCm Blogs 基于之前的博客《使用LoRA微调Llama 2》的内容,我们深入研究了一种称为量化低秩调整(QLoRA)的参数高效微调࿰…...
空间复杂度 线性表,顺序表尾插。
各位少年,大家好,我是那一脸阳光,本次分享的主题是时间复杂度和空间复杂度 还有顺序表文章讲解和分享,如有不对可以评论区指导。 时间复杂度例题 // 计算斐波那契递归Fib的时间复杂度? long long Fib(size_t N){if(N…...
linux创建用户、切换用户、删除用户
创建用户 # 创建新用户 sudo useradd newuser# 设置新用户的密码 sudo passwd newuser切换用户 # 切换到新用户 su newuser# 验证用户切换 whoami 删除用户 # 删除用户 sudo userdel -r username# 验证用户是否已被删除 grep username /etc/passwd 如果删除用户时提示&…...
BC64 牛牛的快递(c++)
牛牛的快递 题目描述输入描述输出描述示例代码 解题思路例如 题目描述 牛牛正在寄快递,他了解到快递在 1kg 以内的按起步价 20 元计算,超出部分按每 kg 1元计算,不足 1kg 部分按 1kg计算。如果加急的话要额外付五元,请问牛牛总共要…...
离线linux通过USB连接并使用手机网络
离线linux通过USB连接并使用手机网络 引场景 引 离线环境要安装一些软件特别麻烦,要自己去官网下载对应的包,然后上传到服务器上,再解压,编译,执行,配置变量等等,错一步都可能安装失败。有网络…...
OpenClaw成本优化方案:Qwen3.5-9B-AWQ-4bit自部署省下80%Token
OpenClaw成本优化方案:Qwen3.5-9B-AWQ-4bit自部署省下80%Token 1. 为什么需要关注OpenClaw的Token消耗 第一次用OpenClaw完成图片处理任务时,我的信用卡账单给我上了深刻的一课——单月API调用费用直接突破2000元。这个数字让我意识到:如果…...
IDM注册表权限控制技术深度解析:突破30天试用期的终极方案
IDM注册表权限控制技术深度解析:突破30天试用期的终极方案 【免费下载链接】IDM-Activation-Script IDM Activation & Trail Reset Script 项目地址: https://gitcode.com/gh_mirrors/id/IDM-Activation-Script 核心技术原理:Windows注册表权…...
新手福音:在快马平台上零配置完成你的第一个openclaw交互实验
作为一个刚接触AI的新手,想要在本地电脑上跑通openclaw这样的多模态模型,光是环境配置就能劝退一大波人。最近我在InsCode(快马)平台上发现了一个超友好的入门项目,完全不需要折腾环境,打开浏览器就能直接体验openclaw的核心功能。…...
WeMod Patcher终极实战指南:3步解锁Pro功能的完整方案
WeMod Patcher终极实战指南:3步解锁Pro功能的完整方案 【免费下载链接】Wand-Enhancer Advanced UX and interoperability extension for Wand (WeMod) app 项目地址: https://gitcode.com/gh_mirrors/we/Wand-Enhancer WeMod Patcher是一款开源的游戏辅助工…...
揭秘AI教材写作:低查重率,用AI轻松搞定教材编写难题!
编写教材需要丰富的资料作为基础,但传统的资料整理方式早已无法满足当前的需求。过去,课标文件、学术论文和教学案例等信息零散地散落在多个平台上,比如知网和教研网站,这让我们花费数天才筛选到有用的内容。而即使所有资料都收集…...
通过WireShark与WinHex从pcap数据流中提取并修复损坏的JPG图片
1. 从pcap文件中筛选JPG数据流 当你拿到一个网络抓包文件(pcap格式),里面可能混杂着各种网络流量数据。要从中提取出图片文件,首先得学会用WireShark这个神器来筛选目标数据。我处理过不少类似的案例,发现很多新手容易…...
点云特征提取入门:5分钟搞懂Voxel-based和Pillar-based的核心区别
点云特征提取入门:5分钟搞懂Voxel-based和Pillar-based的核心区别 想象一下,当你站在城市的高楼俯瞰街道,看到的车辆和行人就像散落在空间中的点。这些点如何被计算机"理解"?这就是点云特征提取要解决的问题。Voxel-bas…...
2025最权威的AI论文助手推荐
Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 在当下诸多处于主流地位的AI论文工具当中,Grammarly于语法校对以及学术表达优化…...
使用RyTuneX提升Windows性能:系统优化全指南
使用RyTuneX提升Windows性能:系统优化全指南 【免费下载链接】RyTuneX RyTuneX is a cutting-edge optimizer built with the WinUI 3 framework, designed to amplify the performance of Windows devices. Crafted for both Windows 10 and 11. 项目地址: https…...
Agent--多轮对话系统设计6道高频考题解析
去年面试某大厂AI岗位,多轮对话这块被追问了好几道题,有些问题当时答得磕磕绊绊,回来后我把相关知识点重新梳理了一遍。这次复盘把面试中遇到的核心问题分享出来,希望对准备面试的同学有点帮助。真题现场: 面试刚开始&…...
