当前位置：首页 > article >正文

【深度学习框架】MXNet（Apache MXNet）

article 2026/5/7 5:07:13

MXNet（Apache MXNet）是一个 高性能、可扩展 的 开源深度学习框架，支持 多种编程语言（如 Python、R、Scala、C++ 和 Julia），并能在 CPU、GPU 以及分布式集群 上高效运行。MXNet 是亚马逊 AWS 官方支持的深度学习框架，并且被用于 Amazon SageMaker 等云端 AI 服务。

MXNet 的特点

1. 灵活的计算模式

符号式（Symbolic） 和 命令式（Imperative） 计算模式可选：
- 符号式计算（Symbolic API）：计算图构建与执行分离，适合大规模部署（类似 TensorFlow）。
- 命令式计算（Imperative API）：即时执行操作，类似 PyTorch，更易调试。
- 还支持 混合计算（HybridBlock），结合二者的优点。

2. 轻量级 & 高性能

低内存占用，适用于大规模数据训练。
使用 高效的计算图优化（Computation Graph Optimization） 提高速度。
适合 CPU、GPU、TPU、多 GPU 训练和分布式计算，可自动并行计算。

3. 易于分布式训练

内置 多机多 GPU 训练支持，轻松扩展到云端大规模训练。
可以运行在 Hadoop、Apache Spark 及 Kubernetes 等分布式计算环境。

4. 多语言支持

原生支持 Python、Scala、R、C++ 和 Julia，相比 TensorFlow 早期仅支持 Python，MXNet 在多语言方面更友好。

5. 低级 & 高级 API

既有低级 API（如 NDArray），也提供高级 API（如 Gluon）。
Gluon 类似 Keras，提供面向对象的神经网络构建方式，支持动态图计算。

MXNet 主要组件

NDArray（多维数组）：
- MXNet 的核心数据结构，与 NumPy 相似，但支持 GPU 加速计算。
- 适用于大规模深度学习计算。
Gluon（高级 API）：
- 让模型构建更加直观，可灵活定义神经网络。
- 结合 命令式计算 和 符号计算，提高可读性和执行效率。
KVStore（分布式计算）：
- 负责在多 GPU/多机器环境下的参数同步，提高训练速度。

安装 MXNet

MXNet 可以通过 pip 安装，支持 CPU 和 GPU 版本：

# 安装 CPU 版本
pip install mxnet# 安装 GPU 版本（适用于 NVIDIA CUDA 计算平台）
pip install mxnet-cu118  # 适用于 CUDA 11.8

注意：如果使用 GPU，需要安装正确版本的 CUDA 和 cuDNN。

MXNet 基本用法

1. NDArray：MXNet 的多维数组

类似 NumPy，但支持 GPU 计算：

import mxnet as mx# 创建一个 3x3 的 NDArray
x = mx.nd.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])# 在 GPU 上创建张量
x_gpu = mx.nd.array([[1, 2], [3, 4]], ctx=mx.cpu())# 计算矩阵加法
y = x + x
print(y)

运行结果

[[ 2.  4.  6.][ 8. 10. 12.][14. 16. 18.]]
<NDArray 3x3 @cpu(0)>

2. 使用 Gluon 构建神经网络

Gluon 使得构建神经网络变得更加简洁：

from mxnet import gluon, autograd, nd# 定义一个简单的前馈神经网络（MLP）
net = gluon.nn.Sequential()
net.add(gluon.nn.Dense(128, activation='relu'),  # 隐藏层gluon.nn.Dense(10)  # 输出层
)# 初始化网络参数
net.initialize()# 生成一个随机输入
x = nd.random.uniform(shape=(4, 20))# 前向传播
output = net(x)
print(output.shape)  # 输出维度应为 (4, 10)

输出结果

(4, 10)

3. 训练模型（手写数字识别）

使用 MXNet 训练一个简单的 MNIST 手写数字分类器：

import mxnet as mx
from mxnet import gluon, autograd, nd
import mxnet.gluon.nn as nn
from mxnet.gluon.data.vision import transforms# 1. 加载 MNIST 数据集
transform = transforms.Compose([transforms.ToTensor()])
train_data = gluon.data.DataLoader(gluon.data.vision.MNIST(train=True).transform_first(transform),batch_size=64, shuffle=True)test_data = gluon.data.DataLoader(gluon.data.vision.MNIST(train=False).transform_first(transform),batch_size=64, shuffle=False)# 2. 定义模型
net = nn.Sequential()
net.add(nn.Dense(128, activation='relu'),nn.Dense(64, activation='relu'),nn.Dense(10)
)
net.initialize(mx.init.Xavier())# 3. 定义损失函数和优化器
loss_fn = gluon.loss.SoftmaxCrossEntropyLoss()
trainer = gluon.Trainer(net.collect_params(), 'adam', {'learning_rate': 0.01})# 4. 训练模型
epochs = 5
for epoch in range(epochs):for data, label in train_data:with autograd.record():output = net(data)loss = loss_fn(output, label)loss.backward()trainer.step(batch_size=64)print(f'Epoch {epoch+1}: Loss = {loss.mean().asscalar()}')# 5. 评估模型
acc = mx.metric.Accuracy()
for data, label in test_data:predictions = net(data).argmax(axis=1)acc.update(preds=predictions, labels=label)print(f'Test Accuracy: {acc.get()[1]:.4f}')

运行结果

Downloading C:\Users\nhn\.mxnet\datasets\mnist\train-images-idx3-ubyte.gz from https://apache-mxnet.s3-accelerate.dualstack.amazonaws.com/gluon/dataset/mnist/train-images-idx3-ubyte.gz...
Downloading C:\Users\nhn\.mxnet\datasets\mnist\train-labels-idx1-ubyte.gz from https://apache-mxnet.s3-accelerate.dualstack.amazonaws.com/gluon/dataset/mnist/train-labels-idx1-ubyte.gz...
Downloading C:\Users\nhn\.mxnet\datasets\mnist\t10k-images-idx3-ubyte.gz from https://apache-mxnet.s3-accelerate.dualstack.amazonaws.com/gluon/dataset/mnist/t10k-images-idx3-ubyte.gz...
Downloading C:\Users\nhn\.mxnet\datasets\mnist\t10k-labels-idx1-ubyte.gz from https://apache-mxnet.s3-accelerate.dualstack.amazonaws.com/gluon/dataset/mnist/t10k-labels-idx1-ubyte.gz...
Epoch 1: Loss = 0.26113489270210266
Epoch 2: Loss = 0.054963454604148865
Epoch 3: Loss = 0.1699257791042328
Epoch 4: Loss = 0.13348454236984253
Epoch 5: Loss = 0.17477944493293762
Test Accuracy: 0.9660

MXNet 的应用

计算机视觉（CV）
- 目标检测（SSD、YOLO、Faster R-CNN）
- 图像分类（ResNet、DenseNet）
- 图像生成（GANs、Style Transfer）
自然语言处理（NLP）
- 机器翻译（Transformer）
- 语音识别（WaveNet）
- 文本生成（GPT）
强化学习（RL）
- DQN、A3C、PPO 等算法
时间序列 & 预测
- 股票预测、流量预测

MXNet vs. 其他框架

特性	MXNet	TensorFlow	PyTorch
计算模式	符号式 + 命令式	符号式	命令式
GPU 支持	✅ 高效支持	✅ 支持	✅ 支持
多语言支持	✅ 多种语言	❌ 主要支持 Python	❌ 主要支持 Python
分布式训练	✅ 高效	✅ 复杂	❌ 不方便
API 易用性	✅ Gluon 简洁	❌ 复杂	✅ 直观

总结

MXNet 是一个高效、可扩展、支持多语言的深度学习框架，特别适用于大规模分布式训练。
结合Gluon API，使得模型定义更加直观，既可命令式计算，也可符号式计算。
被 AWS 作为官方推荐框架，并广泛用于工业应用。

MXNet 适合大规模云端 AI 训练，特别是多GPU 和分布式环境，但在社区生态方面不如 TensorFlow 和 PyTorch 强大。

【深度学习框架】MXNet（Apache MXNet）

MXNet（Apache MXNet）是一个高性能、可扩展的开源深度学习框架，支持多种编程语言（如 Python、R、Scala、C 和 Julia），并能在 CPU、GPU 以及分布式集群上高效运行。MXNet 是亚马逊 AWS 官方支持的深度学…...

编程日记 2026/3/10 11:12:18

游戏引擎学习第87天

当直接使用内存时，可能会发生一些奇怪的事情在直接操作内存时，一些意外的情况可能会发生。由于内存实际上只是一个大块的空间，开发者可以完全控制它，而不像高级语言那样必须遵守许多规则，因此很容易发生错误。在一个…...

编程日记 2026/5/6 3:13:32

【物联网】ARM核常用指令(详解)：数据传送、计算、位运算、比较、跳转、内存访问、CPSR/SPSR

文章目录指令格式（重点）1. 立即数2. 寄存器位移一、数据传送指令1. MOV指令2. MVN指令3. LDR指令二、数据计算指令1. ADD指令1. SUB指令1. MUL指令三、位运算指令1. AND指令2. ORR指令3. EOR指令4. BIC指令四、比较指令五、跳转指令1. B/BL指令2. l…...

编程日记 2026/5/6 3:13:28

Qt展厅播放器/多媒体播放器/中控播放器/帧同步播放器/硬解播放器/监控播放器

一、前言说明音视频开发除了应用在安防监控、视频网站、各种流媒体app开发之外，还有一个小众的市场，那就是多媒体展厅场景，这个场景目前处于垄断地位的软件是HirenderS3，做的非常早而且非常全面，都是通用的需求&…...

编程日记 2026/5/6 3:13:22

VSCode源码分析参考资料

VSCode Architecture Analysis - Electron Project Cross-Platform Best Practices 中文版 VSCode 架构分析 - Electron 项目跨平台最佳实践 Sihan Li博客上的vscode源码分析系列：分析了微服务架构、事件体系、资源管理、配置系统等文召博客上的vscode 源码解析…...

编程日记 2026/2/18 22:31:14

html中的表格属性以及合并操作

表格用table定义，标签标题用caption标签定义；用tr定义表格的若干行；用td定义若干个单元格；（当单元格是表头时，用th标签定义）（th标签会略粗于td标签） table的整体外观取决…...

编程日记 2026/5/6 3:13:17

html的字符实体和颜色表示

在HTML中，颜色可以通过以下几种方式表示，以下是具体的示例： 1. 十六进制颜色代码十六进制颜色代码以#开头，后面跟随6个字符，每两个字符分别表示红色、绿色和蓝色的强度。例如： • #FF0000：纯红…...

编程日记 2026/5/6 3:13:14

unordered_map/set的哈希封装

【C笔记】unordered_map/set的哈希封装 🔥个人主页：大白的编程日记 🔥专栏：C笔记文章目录【C笔记】unordered_map/set的哈希封装前言一. 源码及框架分析二.迭代器三.operator[]四.使用哈希表封装unordered_map/set后言前言哈…...

编程日记 2026/5/6 3:13:01

运算符(C#) 算数运算符 - * / % //算数运算符// - * / %//这跟我们初中的运算符一样// 加号Console.WriteLine(12);//3int a 5 6;Console.WriteLine(a);//11// - 减号Console.WriteLine(6-3);//3int b 10 - 6;Console.WriteLine(b);//4// * 乘号Console.WriteL…...

编程日记 2026/2/24 12:36:50

idea中git的简单使用

提交，推送直接合并合到哪个分支就到先切到哪个分支...

编程日记 2026/5/6 3:12:53

Fastdds学习分享_xtpes_发布订阅模式及rpc模式

在之前的博客中我们介绍了dds的大致功能，与组成结构。本篇博文主要介绍的是xtypes.分为理论和实际运用两部分.理论主要用于梳理hzy大佬的知识，对于某些一带而过的部分作出更为详细的阐释，并在之后通过实际案例便于理解。案例分为普通发布订阅…...

编程日记 2026/5/5 8:26:23

SQLite Update 语句详解

SQLite Update 语句详解 SQLite 是一款轻量级的数据库管理系统，以其简单、易用和高效的特点在全球范围内得到了广泛的应用。在 SQLite 中，UPDATE 语句是用于修改数据库表中记录的常用命令。本文将详细解析 SQLite 的 UPDATE 语句，包括其语法…...

编程日记 2026/3/4 6:23:02

【大数据技术】用户行为日志分析（python+hadoop+mapreduce+yarn+hive）

用户行为日志分析（python+hadoop+mapreduce+yarn+hive）搭建完全分布式高可用大数据集群（VMware+CentOS+FinalShell）搭建完全分布式高可用大数据集群（Hadoop+MapReduce+Yarn）本机PyCharm远程连接虚拟机Python 搭建完全分布式高可用大数据集群（MySQL+Hive）...

编程日记 2026/4/11 5:21:04

开发板上Qt运行的环境变量的三条设置语句的详解

在终端中运行下面三句命令用于配置开发板上Qt运行的环境变量： export QT_QPA_GENERIC_PLUGINStslib:/dev/input/event1 export QT_QPA_PLATFORMlinuxfb:fb/dev/fb0 export QT_QPA_FONTDIR/usr/lib/fonts/设置成功后可以用下面的语句检查设置成功没有 echo $QT_QPA…...

编程日记 2026/5/7 4:14:34

vue3中el-input无法获得焦点的问题

文章目录现象两次nextTick()加setTimeout()解决结论现象 el-input被外层div包裹了，设置autofocus不起作用： <el-dialog v-model"visible" :title"title" :append-to-bodytrue width"50%"><el-form v-model&q…...

编程日记 2026/4/1 12:34:28

语言月赛 202412【顽强拼搏奖的四种发法】题解（AC）

》》》点我查看「视频」详解》》》 [语言月赛 202412] 顽强拼搏奖的四种发法题目描述在 XCPC 竞赛里，会有若干道题目，一支队伍可以对每道题目提交若干次。我们称一支队伍对一道题目的一次提交是有效的，当且仅当： 在本次提交…...

编程日记 2026/5/6 3:12:08

使用 Kotlin 将 Vertx 和 Springboot 整合

本篇文章目的是将 Springboot 和 Vertx 进行简单整合。整合目的仅仅是为了整活，因为两个不同的东西整合在一起提升的性能并没有只使用 Vertx 性能高，因此追求高性能的话这是在我来说不推荐。而且他们不仅没有提高很多性能甚至增加了学习成本一、整合流…...

编程日记 2026/3/6 15:22:59

自定义数据集使用scikit-learn中svm的包实现svm分类

引入必要的库 import numpy as np from sklearn.datasets import make_classification from sklearn.model_selection import train_test_split from sklearn.svm import SVC from sklearn.metrics import accuracy_score, classification_report 生成自定义数据集 X, y ma…...

编程日记 2026/5/6 3:11:59

python：如何播放 .spx 声音文件

.spx 是 Speex音频编解码器的文件扩展名，它是一种开源的、免费的音频编解码器，主要用于语音压缩和语音通信领域。spx 文件通常用于语音记录、VoIP应用、语音信箱等场景。 .mp3 是一种广泛使用的音频格式，它采用了有损压缩算法，可…...

编程日记 2026/2/25 11:47:52

php的使用及 phpstorm环境部署

php语法环境搭建：在小皮中新建网站，注意先填写域名再点击选择根目录。成功创建网站后，打开发现forbidden，因为新建的网站里是空的，需要新建index.php文件----> 在Phpstorm中左上角打开文件，打开那个文…...

编程日记 2026/3/4 3:15:13

有用的sql链接

『SQL』常考面试题（2——窗口函数）_sql的窗口函数面试题-CSDN博客史上最强sql计算用户次日留存率详解（通用版）及相关常用函数 -2020.06.10 - 知乎 (zhihu.com) 1280. 学生们参加各科测试的次数 - 力扣（LeetCode&…...

编程日记 2026/5/5 10:26:19

【Numpy核心编程攻略：Python数据处理、分析详解与科学计算】2.27 NumPy+Pandas：高性能数据处理的黄金组合

2.27 NumPyPandas：高性能数据处理的黄金组合目录 #mermaid-svg-x3ndEE4hrhO6WR6H {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-x3ndEE4hrhO6WR6H .error-icon{fill:#552222;}#mermaid-svg-x3ndEE4hr…...

编程日记 2026/5/5 15:49:34

第一个3D程序！

运行效果 CPP #include <iostream> #include <fstream> #include <string> #include <cmath>#include <GL/glew.h> #include <GLFW/glfw3.h> #include <glm/glm.hpp> #include <glm/gtc/type_ptr.hpp> #include <glm/gtc/…...

编程日记 2026/5/5 4:42:57

NeuralCF 模型：神经网络协同过滤模型

实验和完整代码完整代码实现和jupyter运行：https://github.com/Myolive-Lin/RecSys--deep-learning-recommendation-system/tree/main 引言 NeuralCF 模型由新加坡国立大学研究人员于 2017 年提出，其核心思想在于将传统协同过滤方法与深度学习技术相结…...

编程日记 2026/5/2 16:25:16

第二十三章 MySQL锁之表锁

目录一、概述二、语法三、特点一、概述表级锁，每次操作锁住整张表。锁定粒度大，发生锁冲突的概率最高，并发度最低。应用在MyISAM、InnoDB、BDB等存储引擎中。对于表级锁，主要分为以下三类： 1. 表锁 2. 元数…...

编程日记 2026/5/5 5:31:21

【Uniapp-Vue3】获取用户状态栏高度和胶囊按钮高度

在项目目录下创建一个utils文件，并在里面创建一个system.js文件。在system.js中配置如下代码： const SYSTEM_INFO uni.getSystemInfoAsync();// 返回状态栏高度 export const getStatusBarHeight ()> SYSTEM_INFO.statusBarHeight || 15;// 返回胶…...

编程日记 2026/5/5 4:58:16

04树 + 堆 + 优先队列 + 图（D1_树（D10_决策树））

目录一、引言二、算法原理三、算法实现四、知识小结一、引言决策树算法是一种常用的机器学习算法，可用于分类和回归问题。它基于特征之间的条件判断来构建一棵树，树的每个节点代表一个特征，每个叶节点代表一个类别或回归值。决策…...

编程日记 2026/2/22 17:03:29

通向AGI之路：人工通用智能的技术演进与人类未来

文章目录引言：当机器开始思考一、AGI的本质定义与技术演进1.1 从专用到通用：智能形态的范式转移1.2 AGI发展路线图二、突破AGI的五大技术路径2.1 神经符号整合（Neuro-Symbolic AI）2.2 世界模型架构（World Models）2.3 具身认知理论（Embodied Cognition）三、AGI安全：价…...

编程日记 2026/5/7 0:12:17

将ollama迁移到其他盘（eg:F盘)

文章目录 1.迁移ollama的安装目录2.修改环境变量3.验证背景：在windows操作系统中进行操作相关阅读 ：本地部署deepseek模型步骤 1.迁移ollama的安装目录因为ollama默认安装在C盘，所以只能安装好之后再进行手动迁移位置。 # 1.迁移Ollama可…...

编程日记 2026/5/5 7:40:18

为AI聊天工具添加一个知识系统之86 详细设计之27 数据处理：ETL

本文要点 ETL 数据提取作为数据项目的起点。数据的整个三部曲--里程碑式的发展进程： ETL : 1分形 Type()-层次Broker / 2完形 Method() - 维度Delegate /3 整形 Class() - 容器 Agent 1变象。变象脸谱Extractor - 缠度（物理皮肤缠度&#xf…...

编程日记 2026/5/5 12:24:03