当前位置：首页 > news >正文

自动微分技术在 AI for science 中的应用

news 2025/12/26 12:00:14

本文简记我在学习自动微分相关技术时遇到的知识点。

反向传播和自动微分

以 NN 为代表的深度学习技术展现出了强大的参数拟合能力，人们通过堆叠固定的 layer 就能轻松设计出满足要求的参数拟合器。

例如，大部分图神经网络均基于消息传递的架构。在推理阶段，用户只需给出分子坐标及原子类型，就能得到整个分子的性质。因此其整体架构与下图类似：

在模型设计阶段，我们用 pytorch 即可满足大部分需求，以 schnetpack 为例：

我们 from torch import nn 导入了设计 nn 常用的模块。在初始化模型时，我们直接继承了 pytorch 内置的模块 class AtomisticModel(nn.Module)
有一些函数是重新编写的，例如激活函数 shiftedsoftplus

我们可以看到，模型的整体框架依然是基于 pytorch 的，但针对具体的应用场景，我们做了很多优化。

一方面，使用 pytorch 可以帮助我们快速建立类似上图的模型网络，pytorch 会自动执行梯度的反向传播。从 loss function 开始，逐层递进直至输入层。pytorch 还会帮助我们完成整个网络的参数迭代，学习率的迭代等等。。。

另一方面，针对一些特殊的需求，用户需要自行 DIY，完成需要的功能。

这其中隐含着，用户在程序设计时灵活性与便利性之间的折中。

注意到，刚才提到了梯度的反向传播，事实上，这种常用算法只是自动微分算法中的一种。引用 Gemini 的一个例子：

反向传播好像是计算小山丘斜率（仅限于 NN）的一种算法；
自动微分则可以计算除了小山丘以外的所有物品的斜率（涵盖所有链式求导法则）；

写到这里，自动微分技术的应用场景就很好理解了：

有一些应用场景不适合无脑堆叠 NN，但仍然需要优化参数，此时 from torch import nn 就不管用了，套用固定模版已经很难带来便利性；
由于整个网络的框架已经不再是上图所示，规整的一层层的 NN 结构，反向传播算法就不再适用于参数优化了，需要更加灵活的自动微分方法；

pytorch 与 jax

我们可以将参数优化的相关框架归结为两个应用场景：

用户调用标准函数，搭建层级式标准 NN；
用户自行设计函数，搭建非标准拟合器（仍需优化参数）

针对第一个场景，我们可以使用 pytorch，因为 pytorch 对常用网络架构封装很好。

针对第二个场景，使用 pytorch 会更加繁琐，此时可以切换为 jax ，因为 jax 对用户自定义函数形式更加友好，其内置自动微分算法使用起来更加方便。

除了应用场景的区别外，二者还有以下几个区别：

pytorch 支持静态/动态计算图，而 jax 仅支持静态图
pytorch debug 起来更加方便
jax 针对 GPU, TPU 等硬件优化更多，结合其 JIT(Just In Time) 特性，jax 模型一般比 pytorch 模型快得多
二者间的相互转换难度不大（参见：一文打通PyTorch与JAX）

AI for Science 领域内三个应用案例

DMFF

余旷老师在他的系列博文里系统阐释了为什么 DMFF 要基于 jax 开发（参见：漫谈分子力场、自动微分与DMFF项目：4. DMFF和JAX概述）

总结一下，使用 jax 的原因有以下几点：

传统分子力场的形式不适合用 NN 建模
- 为方便大家理解，我举一个中学物理的例子。苹果从树上落下，遵从自由落体运动，位移随时间变化的规律：h=1/2 * g * t^2, 其中 g 作为引力常数就是需要通过多次落体实验测定的量。我们当然可以用多层 NN 拟合这一参数，但假如我们已经知道了这样一个表达式，此时直接使用该表达式即可。
- 传统分子力场就是高度参数化的方程，发展至今已经有了一套函数形式，无需从头用 NN 的形式拟合
反向传播算法只适用与 NN，不适应上述高度参数化的方程，但优化力场参数仍需要自动微分技术
- 计算原子受力，整个盒子的维里均需要微分技术，使用 jax 编程会更加方便
jax 性能更高，速度快
jax 可拓展性好
- 余旷老师在漫谈分子力场、自动微分与DMFF项目：5. DMFF中势函数的生成和拓展举了一个例子，使用 DMFF 能有效复用前人开发势函数模块，无需从头造轮子

E3x

在 Oliver T. Unke 近期的一篇论文中，作者介绍了名为 E3x 的神经网络框架，对标 pytorch_geometric。

其目的在于，方便用户设计具有 E3 等变性的图神经网络。

使用 E3x 能将所有 AI for Science 领域的 GNN 从 pytorch 迁移至 jax 框架，再结合 jax-MD，获得大幅性能提升。

作者在另一篇论文中透露了这种改造的效果：

请添加图片描述

在稳定性和受力误差不变的情况下，NequIP 提速 28 倍，SchNet 提速 15 倍。那么，E3x 做了哪些关键改动呢？

e3x 对不可约张量进行了压缩，降低了其稀疏性
e3x 设计了开箱即用的激活函数，全连接层、张量层等，这些网络结构都是 E3 等变的

DLDFPT

神经网络与密度泛函围绕理论的结合，论文地址

这是李贺大神今年上半年的一篇 PRL，说实话，我也没看懂。我只是理解到：

传统的 DFPT 理论在计算某一个矩阵的时候遇到了计算瓶颈；
使用自动微分技术能绕开这一瓶颈

自动微分技术在 AI for science 中的应用

本文简记我在学习自动微分相关技术时遇到的知识点。反向传播和自动微分以 NN 为代表的深度学习技术展现出了强大的参数拟合能力，人们通过堆叠固定的 layer 就能轻松设计出满足要求的参数拟合器。例如，大部分图神经网络均基于消息传递的架构。在推理…...

编程日记 2024/6/3 1:17:07

ASM OMF single-file creation form 重命名

OMF下不能自动命名，需要重新命名的话：1 1. spfile 可以 create pfile from spfile 后再create spfile from pfile 2 redo？ 3 datafile？ Here are some details of the copy problem: a) You are not allowed to set the numbe…...

编程日记 2024/6/3 1:15:05

VGGNet CNN卷积网络的发展史 1. LetNet5(1998) 2. AlexNet(2012) 3. ZFNet(2013) 4. VGGNet(2014) 5. GoogLeNet(2014) 6. ResNet(2015) 7. DenseNet(2017) 8. EfficientNet(2019) 9. Vision Transformers(2020) 10. 自适应卷积网络(2021) 上面列出了发展到现在CNN的一些经典…...

编程日记 2024/6/3 1:14:04

SpringMVC：转发和重定向

1. 请求转发和重定向简介参考该链接第9点 2. forward 返回下一个资源路径，请求转发固定格式：return "forward:资源路径"如 return "forward:/b" 此时为一次请求返回逻辑视图名称返回逻辑视图不指定方式时都会默认使用请求转发in…...

编程日记 2024/6/3 1:13:03

961操作系统知识总结

部分图片可能无法显示，参考这里：https://zhuanlan.zhihu.com/p/701247894 961操作系统知识总结一操作系统概述 1. 操作系统的基本概念重要操作系统类型：批处理操作系统(批量处理作业，单道批处理/多道批处理系统，用…...

编程日记 2024/6/3 1:10:00

电脑死机问题排查

情况描述：2024年6月2日下午16：04分电脑突然花屏死机，此情况之前遇到过三次，认为是腾讯会议录屏和系统自带录屏软件冲突导致。报错信息：应用程序-特定权限设置并未向在应用程序容器不可用 SID (不可用)中运行的地址…...

编程日记 2024/6/3 1:08:59

百度地图1

地图的基本操作百度地图3.0文档百度地图3.0实例中心设置地图 centerAndZoom(center: Point, zoom: Number)设初始化地图,center类型为Point时，zoom必须赋值，范围3-19级， // 百度地图API功能var map new BMap.Map("map"); //…...

编程日记 2024/6/3 1:07:58

Ubuntu 24.04 LTS 安装Docker

1 更新软件包索引： sudo apt-get update 2 安装必要的软件包，以允许apt通过HTTPS使用仓库： sudo apt-get install apt-transport-https ca-certificates curl software-properties-common 3 添加Docker的官方GPG密钥： curl -fs…...

编程日记 2024/6/3 1:06:57

【架构设计】Java如何利用AOP实现幂等操作，防止客户端重复操作

1实现方案详解在Java中，使用AOP（面向切面编程）来实现幂等操作是一个常见的做法，特别是当你想在不修改业务代码的情况下添加一些横切关注点（如日志、事务管理、安全性等）时。幂等操作指的是无论执行多少次，结果都是相同的操作。为了利用AOP实现幂等操作以防止客户端重…...

编程日记 2024/6/3 1:05:56

笔记：美团的测试

0.先启动appium 1.编写代码如下： from appium import webdriver from appium.webdriver.extensions.android.nativekey import AndroidKeydesired_caps {platformName: Android,platformVersion: 10,deviceName: :VOG_AL10,appPackage: com.sankuai.meituan,ap…...

编程日记 2024/6/3 1:04:55

【30天精通Prometheus：一站式监控实战指南】第15天：ipmi_exporter从入门到实战：安装、配置详解与生产环境搭建指南，超详细

亲爱的读者们👋 欢迎加入【30天精通Prometheus】专栏！📚 在这里，我们将探索Prometheus的强大功能，并将其应用于实际监控中。这个专栏都将为你提供宝贵的实战经验。🚀 Prometheus是云原生和DevOps的…...

编程日记 2024/6/3 1:03:54

STM32F103借助ESP8266连接网络

ESP8266配置 STM32F103本身是不具备联网功能的，所以我们必须借助其他单片机来进行联网，然后让STM32与联网单片机通信，就可以实现STM32联网了。本文借助的是ESP8266模块，其通过UART协议与STM32通信（http://t.csdnimg.c…...

编程日记 2024/6/3 1:01:52

Feature Manipulation for DDPM based Change Detection

基于去噪扩散模型的特征操作变化检测文章提出了一种基于去噪扩散概率模型（DDPM）的特征操作变化检测方法。变化检测是计算机视觉中的经典任务，涉及分析不同时间捕获的图像对，以识别场景中的重要变化。现有基于扩散模型的方法主要…...

编程日记 2024/6/3 1:00:51

第十三届蓝桥杯国赛大学B组填空题(c++)

A.2022 动态规划 AC; #include<iostream> #define int long long using namespace std; int dp[2050][15]; //dp[i][j]:把数字i分解为j个不同的数的方法数 signed main(){dp[0][0]1;for(int i1;i<2022;i){for(int j1;j<10;j){//一种是已经分成j个数,这时只需每一个…...

编程日记 2024/6/3 0:59:50

conda源不能用了的问题

conda旧没用了，不知道什么原因，安装源出问题，报如下错： Loading channels: failedUnavailableInvalidChannel: HTTP 404 NOT FOUND for channel anaconda/pkgs/main <https://mirrors.aliyun.com/anaconda/pkgs/main>The c…...

编程日记 2024/6/3 0:58:49

【C#】自定义List排序规则的两种方式

目录 1.系统排序原理 2.方式一：调用接口并重写 3.方式二：传排序规则函数做参数 1.系统排序原理当我们对一个List<int>类型的数组如list1排序时，一个轻松的list1.sort();帮我们解决了问题但是在实际应用过程中，往往我们…...

编程日记 2024/6/3 0:57:47

ANAH数据集- 大模型幻觉细粒度评估工具

大型语言模型（LLMs）在各种自然语言处理任务中取得了显著的性能提升。然而，它们在回答用户问题时仍面临一个令人担忧的问题，即幻觉，它们会产生听起来合理但不符合事实或无意义的信息，尤其是当问题需要大量知…...

编程日记 2024/6/3 0:56:46

AI前沿技术探索：智能化浪潮下的创新与应用

一、引言随着科技的不断进步，人工智能（AI）已成为推动社会发展的重要力量。从自动驾驶汽车到智能医疗诊断，从智能家居到虚拟助手，AI技术正逐渐渗透到我们生活的方方面面。本文旨在探讨AI的前沿技术、创新应用以及未来…...

编程日记 2024/6/3 0:55:45

JVM类加载过程

在Java虚拟机规范中，把描述类的数据从class文件加载到内存，并对数据进行校验、转换解析和初始化，最终形成可以被虚拟机直接使用的java.lang.Class对象，这个过程被称作类加载过程。一个类在整个虚拟机周期内会经历如下图的阶段&…...

编程日记 2024/6/3 0:54:44

如何安装ansible

ansible安装 1、准备环境----关闭防护墙和selinux 一般用ansible不会少于10台以上环境: 主机：4台一个控制节点 3个被控制节点解析：本地互相解析(所有机器) # vim /etc/hosts 192.168.1.10 ansible-web1 192.168.1.11 ansible-web2 192.168.1.12…...

编程日记 2024/6/3 0:53:43

1688商品列表API与其他数据源的对接思路

将1688商品列表API与其他数据源对接时，需结合业务场景设计数据流转链路，重点关注数据格式兼容性、接口调用频率控制及数据一致性维护。以下是具体对接思路及关键技术点： 一、核心对接场景与目标商品数据同步场景：将1688商品信息…...

编程新知 2025/11/30 16:55:32

系统设计 --- MongoDB亿级数据查询优化策略

系统设计 --- MongoDB亿级数据查询分表策略背景Solution --- 分表背景使用audit log实现Audi Trail功能 Audit Trail范围: 六个月数据量: 每秒5-7条audi log，共计7千万 – 1亿条数据需要实现全文检索按照时间倒序因为license问题，不能使用ELK只能使用…...

编程新知 2025/11/30 16:55:20

《基于Apache Flink的流处理》笔记

思维导图 1-3 章 4-7章 8-11 章参考资料源码： https://github.com/streaming-with-flink 博客 https://flink.apache.org/bloghttps://www.ververica.com/blog 聚会及会议 https://flink-forward.orghttps://www.meetup.com/topics/apache-flink https://n…...

编程新知 2025/12/15 15:10:54

Xen Server服务器释放磁盘空间

disk.sh #!/bin/bashcd /run/sr-mount/e54f0646-ae11-0457-b64f-eba4673b824c # 全部虚拟机物理磁盘文件存储 a$(ls -l | awk {print $NF} | cut -d. -f1) # 使用中的虚拟机物理磁盘文件 b$(xe vm-disk-list --multiple | grep uuid | awk {print $NF})printf "%s\n"…...

编程新知 2025/11/19 6:04:18

论文笔记——相干体技术在裂缝预测中的应用研究

目录相关地震知识补充地震数据的认识地震几何属性相干体算法定义基本原理第一代相干体技术：基于互相关的相干体技术（Correlation）第二代相干体技术：基于相似的相干体技术（Semblance）基于多道相似的相干体…...

编程新知 2025/12/12 20:26:01

安宝特案例丨Vuzix AR智能眼镜集成专业软件，助力卢森堡医院药房转型，赢得辉瑞创新奖

在Vuzix M400 AR智能眼镜的助力下，卢森堡罗伯特舒曼医院（the Robert Schuman Hospitals, HRS）凭借在无菌制剂生产流程中引入增强现实技术（AR）创新项目，荣获了2024年6月7日由卢森堡医院药剂师协会&#xff0…...

编程新知 2025/12/22 7:24:21

PostgreSQL——环境搭建

一、Linux # 安装 PostgreSQL 15 仓库 sudo dnf install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-$(rpm -E %{rhel})-x86_64/pgdg-redhat-repo-latest.noarch.rpm# 安装之前先确认是否已经存在PostgreSQL rpm -qa | grep postgres# 如果存在&#xff0…...

编程新知 2025/11/26 20:46:42

Qemu arm操作系统开发环境

使用qemu虚拟arm硬件比较合适。步骤如下： 安装qemu apt install qemu-system安装aarch64-none-elf-gcc 需要手动下载，下载地址：https://developer.arm.com/-/media/Files/downloads/gnu/13.2.rel1/binrel/arm-gnu-toolchain-13.2.rel1-x…...

编程新知 2025/12/1 14:45:07

鸿蒙（HarmonyOS5）实现跳一跳小游戏

下面我将介绍如何使用鸿蒙的ArkUI框架，实现一个简单的跳一跳小游戏。 1. 项目结构 src/main/ets/ ├── MainAbility │ ├── pages │ │ ├── Index.ets // 主页面 │ │ └── GamePage.ets // 游戏页面 │ └── model │ …...

编程新知 2025/11/20 18:21:59

rknn toolkit2搭建和推理

安装Miniconda Miniconda - Anaconda Miniconda 选择一个新的版本 ，不用和RKNN的python版本保持一致使用 ./xxx.sh进行安装下面配置一下载源 # 清华大学源（最常用） conda config --add channels https://mirrors.tuna.tsinghua.edu.cn…...

编程新知 2025/12/25 3:05:03

反向传播和自动微分

pytorch 与 jax

AI for Science 领域内三个应用案例

DMFF

E3x

DLDFPT

相关文章：