当前位置: 首页 > article >正文

基础模型时代的科学计算

基础模型时代的科学计算为了变革科学领域基础模型需要满足物理约束、进行不确定性量化并采用专门的技术来克服数据稀缺性同时保持科学的严谨性。作者Danielle Maddix Robinson2025年9月26日预计阅读时间9分钟。概率时间序列预测单变量时间序列预测的任务是根据历史数据和协变量预测未来的时间点。概率时间序列预测旨在基于过去的观测值提供未来点的分布。传统的局部统计方法如自回归积分滑动平均模型和指数平滑法已被广泛使用。最近跨大量相关时间序列训练的全局深度学习模型包括DeepAR和MQ-CNN/MQ-Transformer逐渐兴起。受大语言模型成功的启发我们提出了时间序列基础模型Chronos旨在回答“能否将开箱即用的语言模型应用于时间序列”这一问题。Chronos将每个历史数据点视为一个标记并使用T5语言模型作为生成模型以自回归方式执行下一个标记的预测。Chronos显著优于传统的统计方法和直接在单个数据集上训练的专用深度学习模型。为了处理数据差异我们依赖合成预训练数据。通过应用TSMix方法混合不同频率的时间序列并同时利用高斯过程生成的合成数据我们增加了数据量。这些技术增强了模型的鲁棒性和泛化能力。设计TSFM的另一个关键挑战是如何将连续的时间序列数据映射为离散标记作为LLM的输入。Chronos通过简单的分箱、量化以及小波标记化实现这一点而Chronos-Bolt则使用连续嵌入。一个有趣且有点令人惊讶的发现是尽管Chronos-Bolt及其后续模型融入了更经典的预测方法在经典时间序列基准数据集上表现更好但基于原始LLM的Chronos在混沌和动力系统数据集上表现最强。这归因于Chronos模仿历史而不回归均值的固有能力这与经典时间序列方法或其他TSFM不同。Chronos已广泛应用于科学领域包括水资源、能源和交通预测。时空预测与单变量时间预测不同时空预测需要预测包含空间和时间维度的未来点。这种预测在计算流体动力学、天气预报甚至地震余震预测中都很重要。传统上计算流体动力学的时空动态是通过数值方法包括有限差分、有限体积和有限元方法求解的。这些方法长期以来为偏微分方程求解器提供动力而偏微分方程是控制流体动力学的物理方程例如纳维-斯托克斯方程。最近深度学习模型显示出潜力特别是在短期天气预报和空气动力学方面。天气预报深度学习天气预报模型的发展已经进步到与传统数值天气预报模型相媲美的程度。这在一定程度上归功于丰富的真实世界数据包括ERA5数据集。最近DLWP的激增引发了一个问题哪种方法最合适我们首次在相同的参数数量、训练协议和输入变量集下对每个DLWP模型在二维不可压缩纳维-斯托克斯动力学具有不同雷诺数以及真实世界的WeatherBench数据集上进行了对照研究。我们在准确性和内存消耗方面发现了权衡。例如在WeatherBench数据集上我们展示了SwinTransformer对中短期预报的有效性。重要的是对于长达一年的长期气象推演我们观察到在构建球体球形数据表示的架构即基于图神经网络的GraphCast和球形FNO中稳定性和物理合理性表现良好。尽管DLWP模型功能强大但一个可能令人惊讶的发现是随着参数数量的增加这些模型趋于饱和并不满足LLM所具有的神经缩放定律。空气动力学最近人们研究了深度学习模型以加速传统数值求解器计算成本高昂的领域中的模拟高精度逼近3D时空数据需要精细网格。即使相对于传统求解器存在轻微的精度损失深度学习模型在迭代设计过程中仍然很有帮助。例如流动的快速近似可以帮助工程师快速测试和迭代几种不同的汽车几何形状或飞机设计。数据稀缺的主题在此再次浮现。生成相关的训练数据非常昂贵因为它需要运行数值求解器。我们发布了高保真3D数据集包括DrivAerML、WindsorML和AhmedML。这些开放数据集已被证明很有价值EmmiAI将它们用作构建汽车动力学基础模型的关键组成部分。此类数据集对于在数据缺乏的科学领域提高泛化能力至关重要。这种需求是广泛的这凸显了丰富合成数据的重要性特别是在代表不同物理来自各种偏微分方程、边界条件和几何形状的应用中。物理约束与不确定性量化违反物理约束和确定性预测也限制了深度学习和基础模型的广泛采用。深度学习模型已被证明会违反已知的物理定律例如质量、能量和动量守恒以及已知的边界条件例如允许热通量穿过绝缘体。强制执行这些约束可以得到物理上准确的解并指导学习过程产生更准确的预测。例如在具有挑战性的两相流问题例如模拟空气和水之间的移动界面中我们的ProbConserv模型强制执行守恒定律提高了预测精度、激波位置检测和域外性能。我们还可以对生成模型例如扩散模型或函数流匹配模型强制执行物理约束以保证生成具有物理意义的结果。例如用于降水临近预报的潜在扩散模型PreDiff使用一种知识对齐方式将物理知识作为软约束在去噪生成过程中将较低的概率分配给物理意义较小的样本。我们基于FFM的ECI采样使用类似于ProbConserv的投影方法输出保证满足已知初始条件、边界条件和守恒定律的各种偏微分方程的生成结果。这些方法的另一个重要特性是它们提供不确定性量化和概率预测这在科学和安全关键领域以及相应的下游任务中至关重要。例如PreDiff本质上提供了不确定性量化与确定性方法相比这带来了更高分辨率和更清晰的预测。结论总之为了使基础模型得到广泛采用确保可靠的物理约束满足和稳健的不确定性量化对于获得领域科学家的信任至关重要。通过科学家和机器学习专家之间的跨学科合作这些模型的增长潜力是无限的。致谢感谢Bernie Wang、Michael W. Mahoney、Fatir Abdul Ansari、Boran Han、Xiyuan Zhang和Annan Yu。FINISHED更多精彩内容 请关注我的个人公众号 公众号办公AI智能小助手或者 我的个人博客 https://blog.qife122.com/对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号网络安全技术点滴分享

相关文章:

基础模型时代的科学计算

基础模型时代的科学计算 为了变革科学领域,基础模型需要满足物理约束、进行不确定性量化,并采用专门的技术来克服数据稀缺性,同时保持科学的严谨性。 作者:Danielle Maddix Robinson,2025年9月26日,预计阅读…...

青蓝送水小程序开发(现成案例)

以下为现成的送水类小程序开发案例及关键功能模块,可结合业务需求调整:核心功能模块用户端:水品分类展示、在线下单、配送地址管理、订单跟踪、在线支付、会员积分系统配送端:订单接收、配送路线规划、状态更新、异常反馈管理后台…...

MarkDown语法学习总结

MarkDown语法学习 一级标题:#空格标题名 二级标题 二级标题:##空格标题名 几级标题就写几个# 字体 粗体:** 文本 ** 你好 斜体:* 文本 * 你好 斜体加粗:* * * 文本 * * * 你好 删除线:~~ 文本~…...

在Windows上安装安卓应用?这个5MB小工具让你告别模拟器

在Windows上安装安卓应用?这个5MB小工具让你告别模拟器 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你是否曾经想在Windows电脑上运行安卓应用&#xff…...

含分布式电源的IEEE33节点配电网的潮流计算程序,程序考虑了风光接入下的潮流计算问题将风光等...

含分布式电源的IEEE33节点配电网的潮流计算程序,程序考虑了风光接入下的潮流计算问题将风光等效为PQV PI等节点处理,采用牛拉法开展潮流计算,而且程序都有注释 –以下内容属于A解读,有可能是一本正经的胡说八道,仅供参…...

Windows 11 LTSC系统快速安装微软商店:3分钟完成完整解决方案

Windows 11 LTSC系统快速安装微软商店:3分钟完成完整解决方案 【免费下载链接】LTSC-Add-MicrosoftStore Add Windows Store to Windows 11 24H2 LTSC 项目地址: https://gitcode.com/gh_mirrors/ltscad/LTSC-Add-MicrosoftStore Windows 11 LTSC版本以其卓越…...

别再只改Keycloak登录密码了!从一次‘误报’漏洞,聊聊真正的中间件安全加固

从Keycloak密码事件看中间件安全:超越弱口令的防御体系 上周团队收到一份来自第三方安全机构的漏洞扫描报告,其中赫然标注着我们的Keycloak服务存在"弱口令漏洞"。令人困惑的是,我们早已将默认的admin/admin密码修改为包含大小写字…...

vibe coding实战:利用快马平台为诗歌朗诵会打造沉浸式互动网页

最近帮朋友策划了一场线上诗歌朗诵会,需要制作一个能实时互动的沉浸式网页。这个项目最有趣的地方在于,它不仅要展示诗歌内容,还要通过视觉和交互传递诗歌的情感氛围。这种强调"氛围编码"(vibe coding)的场景…...

从‘听不清’到‘听得准’:深入FunASR的VAD模型,教你调参优化语音识别在嘈杂环境下的表现

从‘听不清’到‘听得准’:深入FunASR的VAD模型,教你调参优化语音识别在嘈杂环境下的表现 在工业巡检的轰鸣声中,工程师的语音指令频繁被机器噪音淹没;车载语音助手总在高速风噪下错误触发;户外采访录音里的对话被风声…...

Python实战:海康工业相机主动取流(getoneframetimeout)图像数据解析与OpenCV实时显示优化

1. 海康工业相机主动取流技术解析 第一次接触海康工业相机的主动取流功能时,我踩了不少坑。当时项目需要实时监控生产线上的产品缺陷,要求每秒处理25帧以上的图像数据。经过反复测试发现,主动取流方式(getoneframetimeout&#xf…...

3分钟搞定Axure RP中文界面:告别英文困扰,专注原型设计

3分钟搞定Axure RP中文界面:告别英文困扰,专注原型设计 【免费下载链接】axure-cn Chinese language file for Axure RP. Axure RP 简体中文语言包。支持 Axure 11、10、9。不定期更新。 项目地址: https://gitcode.com/gh_mirrors/ax/axure-cn 还…...

塞尔达传说存档定制指南:打造个性化游戏体验

塞尔达传说存档定制指南:打造个性化游戏体验 【免费下载链接】BOTW-Save-Editor-GUI A Work in Progress Save Editor for BOTW 项目地址: https://gitcode.com/gh_mirrors/bo/BOTW-Save-Editor-GUI 在海拉鲁大陆的冒险中,你是否曾因资源匮乏而错…...

保姆级教程:手把手教你用LIOSAM跑通自己的数据集(含常见报错解决)

从零到一:LIOSAM实战指南与避坑手册 1. 环境配置与数据准备 LIOSAM作为激光-惯性紧耦合SLAM系统,对硬件和软件环境有特定要求。我们先从基础环境搭建开始: 系统要求: Ubuntu 18.04/20.04(推荐20.04)ROS Noe…...

UE5对象池系统深度解析:如何基于Subsystem框架设计可扩展的Gameplay工具

UE5对象池系统深度解析:如何基于Subsystem框架设计可扩展的Gameplay工具 在快节奏的现代游戏开发中,性能优化始终是开发者面临的核心挑战之一。想象一下这样的场景:当玩家在射击游戏中连续发射数百发子弹,或者在开放世界游戏中频繁…...

Spyglass实战指南:从约束到违例豁免的CDC/RDC检查全流程

1. Spyglass入门:CDC/RDC检查基础 第一次接触Spyglass时,我被它复杂的规则体系搞得晕头转向。直到在项目中真正用它解决了几个棘手的跨时钟域问题,才明白这个工具的价值。简单来说,Spyglass就像个经验丰富的"电路医生"&…...

PPO-Lag在Velocity-Walker2d任务中周期性震荡的原因分析与解决方案

PPO-Lag在Velocity-Walker2d任务中周期性震荡的机制解析与调优实践 当你在Velocity-Walker2d环境中观察到训练曲线像心电图一样规律起伏时,很可能正遭遇PPO-Lag算法的经典震荡问题。这种周期性波动不仅影响策略收敛效率,更可能掩盖算法在安全约束处理上的…...

毕业论文“通关秘籍”:好写作AI的神奇魔法盒

毕业季的钟声敲响,对于众多即将毕业的大学生来说,毕业论文就像是一场必须跨越的“终极挑战”。从选题时的迷茫,到文献收集的繁琐,再到大纲搭建的纠结,每一步都让人头疼不已。不过别担心,好写作AI这位论文写…...

5个跨系统突破:Ext2Read让Windows无缝访问Linux分区的创新方案

5个跨系统突破:Ext2Read让Windows无缝访问Linux分区的创新方案 【免费下载链接】ext2read A Windows Application to read and copy Ext2/Ext3/Ext4 (With LVM) Partitions from Windows. 项目地址: https://gitcode.com/gh_mirrors/ex/ext2read 当运维工程师…...

嵌入式Linux新手必看:Buildroot根文件系统启动后权限问题全解析(附/dev/console修复指南)

嵌入式Linux权限管理实战:Buildroot根文件系统权限问题深度解析与修复指南 当你在嵌入式Linux开发中首次使用Buildroot构建系统时,可能会遇到一个令人头疼的问题——系统启动后没有root权限,甚至无法访问/dev/console设备。这不仅影响系统功能…...

WebLaTex:革新学术写作体验的云端LaTeX解决方案

WebLaTex:革新学术写作体验的云端LaTeX解决方案 【免费下载链接】WebLaTex A complete alternative for Overleaf with VSCode Web Git Integration Copilot Grammar & Spell Checker Live Collaboration Support. Based on GitHub Codespace and Dev cont…...

【实战指南】利用逐飞库实现printf函数重定向至蓝牙串口的完整步骤

1. 为什么需要printf重定向到蓝牙串口 在嵌入式开发中,printf函数是最常用的调试工具之一。传统的调试方式是通过有线串口将调试信息输出到电脑终端,但在很多实际应用场景中,有线连接会带来诸多不便。比如智能小车调试时,拖着一条…...

新手避坑指南:用STLink-V2给STM32F103RCT6烧录程序,从CubeMX配置到Keil调试全流程

STM32开发实战:从CubeMX配置到Keil调试的完整避坑手册 第一次接触STM32开发时,那种既兴奋又忐忑的心情我至今记忆犹新。看着手边的STLink-V2调试器和STM32F103RCT6开发板,明明按照教程一步步操作,却总在某个环节卡住——驱动死活装…...

ESP32-S3项目实战:从Github下载‘小智’代码到成功烧录的完整避坑记录

ESP32-S3项目实战:从Github下载‘小智’代码到成功烧录的完整避坑记录 在物联网开发领域,ESP32-S3凭借其出色的性能和丰富的外设接口,成为众多开发者的首选。本文将带你完整走一遍从Github获取"小智"开源项目到最终烧录运行的整个流…...

【限时解密】UE6.5.2 Preview版C++27调试增强包(含DWARF5符号扩展插件):仅开放72小时申请通道

第一章:UE6.5.2 Preview版C27调试增强包核心特性概览Unreal Engine 6.5.2 Preview 版首次集成 C27 调试增强包(C27 Debug Enhancement Pack),该包并非语言标准实现,而是基于 Clang 19 与 MSVC 2025 工具链深度定制的调…...

数据安全守护:QQ空间历史说说备份工具全攻略

数据安全守护:QQ空间历史说说备份工具全攻略 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 在数字记忆日益珍贵的今天,QQ空间承载着无数人的青春回忆与生活印记…...

解决Windows系统卡顿:Win11Debloat全方位优化工具使用指南

解决Windows系统卡顿:Win11Debloat全方位优化工具使用指南 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter an…...

AO3镜像站技术架构与部署指南:构建高可用同人作品访问平台

AO3镜像站技术架构与部署指南:构建高可用同人作品访问平台 【免费下载链接】AO3-Mirror-Site 项目地址: https://gitcode.com/gh_mirrors/ao/AO3-Mirror-Site Archive of Our Own(AO3)作为全球最大的非营利性同人作品平台&#xff0c…...

2023长城杯Web赛题解析:从SSRF到Pickle反序列化的实战攻防

1. 从SSRF漏洞到内网渗透的实战突破 去年参加长城杯时遇到一道名为"seeking"的Web题目,让我对SSRF漏洞的利用有了全新认识。题目一开始给出了一个看似简单的PHP文件,但隐藏着精妙的设计。代码中通过file_get_contents函数获取图片内容时&#…...

JBoltAI Agent OS:企业AI转型的“智慧管家”

在AI技术席卷全球的浪潮中,企业如何高效管理员工手中的AI Agent,确保其既助力业务又不失控?JBoltAI Agent OS应运而生,它如同一位“智慧管家”,为企业提供了一套集中式的Agent治理与转型管理方案。一、为何需要企业级A…...

【Netty】【调试工具】----Windows上网络调试助手NetAssist的使用(Java 开发者实用指南)

NetAssist是Windows下轻量免装的TCP/UDP调试工具,对Java开发者核心价值是快速模拟网络对端、裸抓报文、联调硬件/第三方接口,大幅降低网络编程调试成本。一、Java开发者用它的核心用处 网络编程快速验证 不用写完整客户端/服务端,用NetAssist…...