【2025 Nature】AI 生成材料算法 MatterGen 文章要点
文章目录
- 1. MatterGen 框架
- 2. 评价基础模型生成能力的指标
- 3. MatterGen 基础生成能力表现
- 4. MatterGen 定向生成能力表现
- i. 指定晶体化学式
- ii. 指定标量性质
- 1. 每个性质微调一次。
- 2. 两个性质联合微调
- 5. 实验合成
- 6. 模型细节
这篇文档简单介绍 MatterGen 论文亮点。
标题:A generative model for inorganic materials design
代码
1. MatterGen 框架
i. 基于扩散,引入等变神经网络,对原子坐标、原子元素种类和晶格常数进行去噪。此为基础模型。
ii. 通过添加 adapter 模块,对基础模型进行微调,能够实现无条件引导器的定向生成。
iii. 支持的引导类型:化学式、对称性、目标标量性质
2. 评价基础模型生成能力的指标
i. S.U.N. 指标:分别代表 Stable, Unique, Novel,即,稳定的,唯一的,新颖的,晶体结构。是一个百分比。
ii. Stable, Unique, Novel 具体定义细节在 SI 中,作者还设计了新的评测工具。
iii. RMSD 指标:表示,模型生成结构和 DFT 几何优化后的结构,二者之间的误差。
3. MatterGen 基础生成能力表现
i. 在同一训练集下,MatterGen 比先前 SOTA 表现高 1.5 倍。如果扩充训练集,MatterGen 能力能够进一步提高。

ii. 在小批量生成时,唯一性较高,直到 10w 量级以后才出现下降。
![[图片]](https://i-blog.csdnimg.cn/direct/c120a69df5bf4e56879a91305c7b6be6.png)
4. MatterGen 定向生成能力表现
i. 指定晶体化学式
- MatterGen 基础模型在含有 化学式 Adapter 模块下进行微调 和 Substitution 和 RSS (random structure search), 以及最大的数据库 Alex-MP-ICSD (比训练集多一些 disordered 的结构)进行比对
- 由于训练集在不同元素上,分布有所差异,因此,作者在设计实验时,将其分为了,充分探索过的、部分探索过的、没有探索过的。三个类型。
- 同时,设计了 3元、4元、5元,三个生成任务。 使用 S.U.N. 指标 和 Structures combined hull (稳定性)进行评估,结果如下:

ii. 指定标量性质
1. 每个性质微调一次。
- MatterGen 基础模型在部分含有特殊标量性质的数据集下,以及 Adapter 模块下进行微调。
- 使用 DFT 和 MLFF 对生成结果进行打分,和训练集分布进行对比
![[图片]](https://i-blog.csdnimg.cn/direct/59355b7aac17454e84678b842cbf9626.png)
- 给定 DFT 计算次数的预算,从 MatterGen 定向生成结果中进行筛选,与两种策略进行对比:a. 训练集中符合条件的总数,b. 训练集外,未被标注的数据,使用 ML 进行打分,并使用 DFT 预算对高分结构进行筛选
![[图片]](https://i-blog.csdnimg.cn/direct/72d2724e09a14ba0bc20bd677e4b4b77.png)
2. 两个性质联合微调
- 高磁强度的结构(Magnetic density 高),同时具有,低供应链成本(HHI score低)
- 对比训练集数据,以及,仅对 Magnetic density 微调的 MatterGen 模型进行对比
![[图片]](https://i-blog.csdnimg.cn/direct/a046016428e1440ea2690431cc9f5165.png)
5. 实验合成
- 使用 MatterGen 定向生成具有指定 体积模量 的晶体。
- 作者使用 DFT 进行了多指标多轮筛选,在 200 体积模量的定向引导下,最终获得了 75 个 promising 数据,其中挑出了 4 个供实验合成。其中一个被成功合成出,并进行了结构表征。
- 该实验结构一个在化学成分上是无序的,但其结构框架仍然是 MatterGen 预测的有序结构的变体。
6. 模型细节
- 起始学习率 1e-4,当训练损失在 100 个 epoch 内没有减少时,以 0.6 的因子逐步降低,最低降至 1e-6。
- 批次大小 512
- float32 精度
- MatterGen 包含 46.8M 个参数
- 在一个训练 epoch 中,大约 60 万个训练样本在 8 个 NVIDIA A100 GPU 上大约需要 6 分钟。
- 使用单个 NVIDIA V100 GPU 采样 500 结构每小时。
- 下图为训练集和测试集
![[图片]](https://i-blog.csdnimg.cn/direct/b55b365d4a734492beea8b8f3267a1fb.png)
训练集 Alex-MP-20(607,683 个) 和 MP-20 的比较,20 指单胞中最多含有 20 个原子
![[图片]](https://i-blog.csdnimg.cn/direct/3047962fc5d742848fadd83a892dafda.png)
相关文章:
【2025 Nature】AI 生成材料算法 MatterGen 文章要点
文章目录 1. MatterGen 框架2. 评价基础模型生成能力的指标3. MatterGen 基础生成能力表现4. MatterGen 定向生成能力表现i. 指定晶体化学式ii. 指定标量性质1. 每个性质微调一次。2. 两个性质联合微调 5. 实验合成6. 模型细节 这篇文档简单介绍 MatterGen 论文亮点。 标题&…...
时间序列分析(三)——白噪声检验
此前篇章: 时间序列分析(一)——基础概念篇 时间序列分析(二)——平稳性检验 一、相关知识点 白噪声的定义:白噪声序列是一种在统计学和信号处理中常见的随机过程,由一系列相互独立、具有相同…...
STM32-知识
一、Cortex-M系列双指针 Cortex-M系列的MSP与PSP有一些重要的区别,双指针是为了保证OS的安全性和稳健性。本质上,区别于用户程序使用PSP,操作系统和异常事件单独使用一个MSP指针的目的,是为了保证栈数据不会被用户程序意外访问或…...
将Mac上Python程序的虚拟环境搬到Windows
1. 导出Mac上Python虚拟环境的依赖 cd py && source venv/bin/activate && pip freeze > requirements.txt 2. 在Windows上创建一个新的虚拟环境 python -m venv venv 3. 激活虚拟环境 venv\Scripts\activate 4. 安装依赖 pip install -r requiremen…...
[前端] axios网络请求二次封装
一、场景描述 为什么要对axios网络请求进行二次封装? 解决代码的复用,提高可维护性。 —这个有两个方案:一个是二次封装一个是实例化。(设置一些公共的参数,然后进行请求) 为什么可以解决代码的复用: 这是…...
对前端的技术进行分层
前端相比较后端而言,由于其发展历史和浏览器的标准不一,导致其看上去简单,但是深入起来又很复杂,在最开始学习的时候,我们往往是了解一下三剑客和vue、react的api就开始上手工作了,但是到后面会发现&#x…...
【学术投稿-2025年计算机视觉研究进展与应用国际学术会议 (ACVRA 2025)】CSS样式解析:行内、内部与外部样式的区别与优先级分析
简介 2025年计算机视觉研究进展与应用(ACVRA 2025)将于2025年2月28-3月2日在中国广州召开,会议将汇聚世界各地的顶尖学者、研究人员和行业专家,聚焦计算机视觉领域的最新研究动态与应用成就。本次会议将探讨前沿技术,…...
【Linux】【网络】IO多路复用 select、poll、epoll
【Linux】【网络】IO多路复用 select、poll、epoll IO 多路复用 进程或线程同时监控多个文件描述符,查看描述符上是否有事件发生,从而提高资源利用率和系统吞吐量。 1. select int select(int maxfd, fd_set *readfds, fd_set *writefds, fd_set *exc…...
讲解下MySql的外连接查询在SpringBoot中的使用情况
在Spring Boot中使用MySQL的外连接查询时,通常通过JPA、MyBatis或JDBC等持久层框架来实现。外连接查询主要用于从多个表中获取数据,即使某些表中没有匹配的记录。外连接分为左外连接(LEFT JOIN)、右外连接(RIGHT JOIN&…...
OpenGL-基础知识(更新中)
本文基于The Cherno在Youtube上的OpenGL系列视频总结出的笔记,等这个系列视频学习完后,将更加系统详细的学习《计算机图形学编程(使用OpenGL和C 第二版)》这本书。个人认为看cherno的视频上手速度更快,而且他对基本概念…...
逆设计之下,数字纳米光子器件将走向何方?
数字纳米光子器件逆设计是纳米光子学领域中一种创新且极具潜力的设计方法,以下为你详细介绍: 基本概念 纳米光子器件:是指尺寸在纳米量级的光子器件,利用光子(光的粒子)来传输、处理和存储信息。与传统电…...
麒麟信安系统隔核后iperf网络测试影响说明
1、背景介绍 采用麒麟信安系统,在飞腾平台(X86平台类似)上进行了系统核隔离,修改了grub.cfg配置文件中的启动项增加isolcpus2-63 操作,隔核后发现40G网络iperf测试存在影响。 测试命令 taskset -c 16-23 iperf -s -…...
WPF进阶 | WPF 资源管理与本地化:多语言支持与资源复用
WPF进阶 | WPF 资源管理与本地化:多语言支持与资源复用 前言一、WPF 资源管理基础1.1 什么是 WPF 资源1.2 资源的定义与存储位置1.3 资源的引用方式 二、资源字典的深入应用2.1 创建资源字典2.2 在应用程序中合并资源字典2.3 资源字典的层级结构与合并顺序 三、WPF …...
数据结构与算法-动态规划-区间dp(石子合并,环形石子合并,凸多边形的划分,加分二叉树,棋盘分割)
概念 区间动态规划(Interval Dynamic Programming)是动态规划的一个分支,它在处理一些与区间相关的最优解问题上非常有效。以下从基本概念、解题步骤、经典例题、优缺点等方面为你详细介绍: 基本概念:区间 DP 的核心…...
32单片机学习记录4之串口通信
32单片机学习记录4之串口通信 前置 STM32的GPIO口有通用模式,复用模式,模拟模式三种,加上输入输出就是有6中对应的模式。 我学习了通用模式,会使用GPIO口使用一些简单外设,如LED,独立按键,红外…...
开源、免费项目管理工具比较:2025最新整理30款
好用的开源、免费版项目管理系统有:1.Redmine;2. Taiga;3. OpenProject; 4.ProjectLibre; 5.GanttProject; 6.Tuleap; 7.Trac;8. Phabricator; 9.Notion; 10.…...
Android10 音频参数导出合并
A10 设备录音时底噪过大,让音频同事校准了下,然后把校准好的参数需要导出来,集成到项目中,然后出包,导出方式在此记录 设备安装debug系统版本调试好后, adb root adb remount adb shell 进入设备目录 导…...
在 Azure 上部署 DeepSeek 并集成 Open WebUI
DeepSeek 是杭州深度求索人工智能基础技术研究有限公司发布的开源大模型,最近是持续火爆,使得官方服务经常不可用。网上各种本地部署和私有部署的文章已经很多,这里我们提供一个全部基于 Azure 的私有部署方案。 使用 Azure AI Foundry 部署…...
Springboot整合支付宝支付
支付宝支付功能 步骤一:沙箱配置支付宝沙箱配置 步骤二:使用内网穿透步骤三:开始对接SDK配置文件支付 步骤一:沙箱配置 支付宝沙箱配置 需要有支付宝沙箱:提供一个虚拟的支付环境,用于测验调试࿰…...
deepseek+kimi一键生成PPT
1、deepseek生成大纲内容 访问deepseek官方网站:https://www.deepseek.com/ 将你想要编写的PPT内容输入到对话框,点击【蓝色】发送按钮,让deepseek生成内容大纲,并以markdown形式输出。 等待deepseek生成内容完毕后,…...
Druid GetConnectionTimeoutException解决方案之一
> Druid版本:v1.2.18 最近项目中经常出现:com.alibaba.druid.pool.GetConnectionTimeoutException: wait millis 120000, active 0, maxActive 128, creating 0, createErrorCount 2,但是其他平台连接这个数据源正常的 于是做了一个实验复…...
基于ssm的超市订单管理系统
一、系统架构 前端:jsp | web components | jquery | css | ajax 后端:spring | springmvc | mybatis 环境:jdk1.8 | mysql | maven | tomcat 二、代码及数据 三、功能介绍 01. 登录 02. 首页 03. 订单管理 04. 供应…...
AnyPlace:学习机器人操作的泛化目标放置
25年2月来自多伦多大学、Vector Inst、上海交大等机构的论文“AnyPlace: Learning Generalized Object Placement for Robot Manipulation”。 由于目标几何形状和放置的配置多种多样,因此在机器人任务中放置目标本身就具有挑战性。为了解决这个问题,An…...
wps配置deepseek
wps 配置deepseek https://e6jy62bip4.feishu.cn/docx/R09IdpU5HoADyDxcgfQcjpR8nnb...
github不翻墙就可以访问
目录 简介资料准备windows平台设置下载运行git设置firefox设置 ubuntu平台设置下载启动服务设置系统代理git设置firefox设置证书 注意事项 简介 由于github访问不稳定,严重影响了国内软件开发,在网上搜索并验证了一些方法.现在整理出来一个可以正常使用的方法, 在windows和Lin…...
【DeepSeek】在本地计算机上部署DeepSeek-R1大模型实战(完整版)
【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈人工智能与大模型应用 ⌋ ⌋ ⌋ 人工智能(AI)通过算法模拟人类智能,利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络(如ChatGPT&…...
基于全志T507的边缘计算机,推动光伏电站向智能运维转型
智能监控与维护 光伏电站通常分布在广阔的地域内,传统的监控方式往往需要大量的人力物力进行现场检查和数据采集。采用全志T507为核心的嵌入式工控机或边缘计算控制器可以实现光伏电站的实时监测,通过连接传感器网络收集电站各个组件的工作状态信息&…...
Swift的方法派发机制
1. 静态派发(Static Dispatch) 静态派发在编译时确定方法的具体实现,调用时直接跳转到该实现。静态派发的优点是性能高,因为不需要运行时查找方法实现。 适用场景: 值类型(Struct 和 Enum)&am…...
用户认证练习实验
一.拓扑 二.sw2配置 三.ip配置 四.dhcp分配IP地址 五.安全区域配置 六.防火墙地址组信息 七.管理员 创建管理员角色 创建管理员 启动tenlnet 八.用户认证配置 认证策略 九.安全策略配置...
Miniforge —— 轻量化的 conda 解决方案
引言 在日常使用中,我们常常使用 Anaconda 或 Miniconda 来管理 Python 环境和包。但由于 Anaconda/Miniconda 属于商业产品,当企业规模超过一定人数时就会涉及付费问题。相比之下,Miniforge 是由社区主导维护的一个完全免费的替代方案&…...
