大模型在金融医疗、生命系统和物理仿真领域的创新应用探索
点击蓝字
关注我们
AI TIME欢迎每一位AI爱好者的加入!
在当今迅速发展的科技领域,大模型技术正日益成为金融医疗、生命系统和物理仿真等领域中的重要工具。2023年6月16日,AI TIME举办的青年科学家大模型专场活动邀请了国防科技大学理学院数学系统计与运筹学讲师王琦、西湖大学工学院人工智能方向助理教授吴泰霖、浙江大学国际联合学院助理教授孟祥明、中佛罗里达大学计算机系助理教授及计算安全与隐私中心成员娄钱,四位嘉宾深入探讨了大模型技术在金融医疗、生命系统和物理仿真等领域中的应用案例、技术挑战和未来发展趋势,展示了这一革命性技术对各领域带来的深刻影响。
王琦:AIGC技术的发展溯源与前景展望
近些年,人工智能生成内容(AIGC)技术受到了学术界和工业界的广泛重视,此类生成式AI技术的涌现提升了社会生产效率,为通用人工智能(Artificial General Intelligence)技术开发的难题提供了新的解决思路。王琦老师在报告中首先溯源AIGC技术的发展,随着Diffusion Model、Transformer等生成式系列结构,生成式AI模型的结构趋向深度化和层次化,效果越来越好。王老师在报告的第二部分探讨了生成式AI理论研究的相关问题,并对深度生成模型的结构设计、优化策略、效果评估及应用部署进行展望。他将生成式AI存在研究热点概括为深度生成模型的可解释性,生成数据的多样性与真实性,结构化数据的不变性与等变性,大规模优化的计算复杂性与深度生成模型的跨任务智能决策,而解决这些科学问题涉及的理论工具包括统计学、代数学、决策论、信息论与优化理论等,未来利用这些理论有可能推动AIGC的研究发展。
吴泰霖:AI用于多分辨率科学仿真和设计
系统的多分辨率是科学仿真的研究中存在的一个重要挑战。在物理、流体、天气、材料、核聚变等很多领域,系统的一小部分变化非常剧烈,需要非常精细的分辨率,而大部分则变化缓慢。为解决上述问题,吴泰霖老师在报告中介绍了一种LAMP架构并通过实验数据分析其良好的性能。LAMP通过两个图神经网络进行特征的学习,其中一个图神经网络学习系统随时间的演化,另一个则通过强化学习优化系统内各个部分的空间分辨率从而判断误差和成本是否在可控范围内。此外,吴老师还提出了AI用于科学仿真存在的问题,包括如何更好地解决多尺度问题以及提高其可信度等。基于科学仿真,我们可以进行系统的反向设计,从而优化给定的目标,吴老师在报告的第二部分还详细阐述了AI用于反向设计在各科学、工程关键领域的重要应用、开放问题和可能方向,并欢迎大家一起进行深入探索。
孟祥明:基于扩散模型的量化压缩感知
我们目前正处于大数据时代,很多问题会涉及信号的获取,但是大规模数据的获取会非常消耗资源,那么如何使用少量的观测来获取信号和数据是研究的一大难题。孟祥明老师在报告中首先简明地阐述了压缩感知的主要思想,在信号传输和存储之前先对其进行压缩,在接收端收到数据后进行解压缩,简单讲就是在信号采样的过程中进行压缩。孟老师介绍了一种名为QCS-SGM的高效算法,该算法利用基于分数的生成模型(SGM)作为隐式先验,但该算法受限于行正交传感矩阵,会使得似然得分的计算变得很困难。为了突破此限制,孟老师在报告中又介绍了QCS-SGM的高级变体——QCS-SGM+。它能够有效地处理一般矩阵,从贝叶斯推理角度计算似然得分,而广泛的实验也证明了QCS-SGM+在一般传感矩阵方面比QCS-SGM具有显著的优越性。
娄钱:探讨人工智能的安全与隐私问题
人工智能模型,尤其是深度学习模型,已经在广泛的领域得到了应用,但其隐私和安全问题仍然存在许多待解决的挑战。娄钱老师在报告中首先指出构建一个可靠的深度学习系统需要解决高效性、数据隐私和安全的问题,然后介绍了利用加密的方式对数据和模型隐私进行保护的方案。他列举了现实生活中数据隐私的实例如医疗数据、金融数据等,这些数据中往往会包含个人隐私信息,目前已有的研究中会利用全同态加密(FHE)、多方计算、差分隐私等多种隐私计算技术进行数据隐私的保护。人工智能模型在训练和推理过程中也有可能泄露训练数据的敏感信息,因此模型的安全性尤为重要。娄老师在报告中分别介绍了针对文本和视觉的后门攻击方法,他也表示我们需要探索更多的后门攻击方法,并提出相应的检测和去除策略,才能保护模型的安全性。
智能决策大模型在生命系统/机器人系统中部署的机遇与挑战
王琦:大模型目前已经可以很好地解决视觉包括自然语言方面的基础性问题。在生命系统方面,大模型可以针对不同情景下体质不同的人学习特征,从而制定个性化的治疗方案。大模型部署在生命系统或机器人系统中面临机遇的同时也面临着一些挑战。比如,真实数据的缺失以及数据的表征格式,其次是因果溯源的问题,第三是让机器人系统具备感知能力与推理能力。
孟祥明:大模型应用在医疗系统或是机器人系统中是面临诸多挑战的,首先需要巨大的计算机资源进行支撑;其次用于大模型训练的数据在收集过程中本身是存在偏见和不平衡的,这会影响最终的决策结果,因此如何保证大模型的公正性和可信度是一个较大的挑战;第三,在生命系统中采用安全的措施对于敏感信息的隐私保护也是一个难题;第四,利用大模型辅助决策会面临因果推理的难题,因而解决大模型的可解释性和可理解性也是一个较大的挑战。
娄钱:我比较关注的是大模型或是生成模型的安全隐私问题,未来如果能够对大模型的输入进行一些过滤或者提高大模型本身的推理能力和可解释性,将会是一个很大的进展。
大模型的安全隐患以及解决方案
特别是在医疗金融等高风险领域
娄钱:大模型现在有一些提示词的工程,那么设置好的提示词工程让训练的数据变得更少是现有的机遇。但同时也存在着一些问题,当出于保护隐私的动机去对提示词进行加密,能否保证性能的稳定性是一个挑战。我们可以通过差分隐私利用本地学习或联邦学习的方式去生成垂直领域的个性化提示词,从而防止隐私泄露。
孟祥明:大模型在医疗、金融等高风险领域的应用,除了面对技术问题,还有法律法规的制定,如何管理数据的应用及其产生的伦理,相关的政府、企业都应该形成一个相应的规范。
吴泰霖:大模型可以作为一种基础服务提供给各个机构,由研发机构训练好的基础模型作为初始状态,再分发给不同的公司进行不同类型数据的训练,这样数据就能保存在各个公司中,保证了数据的安全性。
王琦:大模型在训练完投入使用的过程中,数据是呈现一种增量态势的,所以它具备终身学习的特性。大模型会随着数据的更新而更新,这就涉及数据的偏差。倘若有不法机构试图从产生垃圾数据的角度攻击大模型,如何让大模型从数据的角度出发,保证数据公平从而实现安全性也是一个有趣的研究方向。
大模型在物理仿真中的机遇和挑战
吴泰霖:关于大模型是否应该应用于物理仿真,如果它能够用于不同形式不同情景下,只需更改基于学习的表示,减少训练时间,这是将其应用于物理仿真的优势。倘若将其应用于物理仿真的数据量远远超过大模型本身的数据量,这就是不值得的。大模型的训练需要很多数据,而物理仿真中数据很丰富,将这两者结合起来一起训练就是一个机遇。大模型在物理仿真中的挑战主要有两个:设计一个通用的表示使得其对不同的情形都能够适用、对于不同的物理情形能否使用同一个模型来模拟。
王琦:关于挑战,在做推理的时候如何从高维观测信号中推断真实的物理状态是一个比较困难的问题,因为在物理系统中机器人的各种状态信息都是需要通过传感器进行收集的。此外,对于大规模仿真的评估标准也是一大难题,在大规模仿真预算的情况下,仿真需要服务于智能决策,此时对仿真系统的实时性就提出了很高的要求。
孟祥明:物理仿真字面意义上即仿真现实的世界,我们希望它能够精确地重现现实世界的现象或者规律,那么大模型如何保证仿真的精度和稳定性是一大挑战。
娄钱:训练一个大模型的必要条件是数据、计算平台、训练算法,物理仿真的数据表达性更好,更接近现实。在计算方面,由于数据量是巨大的,而GPU又是有限的,所以设计高效训练的算法来缓解产能的限制是有必要的。
AI或者大模型还需要理论吗?
孟祥明:这个回答是肯定的。我们目前需要思考的是机器学习理论方面的研究方式是否存在一些问题或者研究范式。由于机器学习理论界的知识对AI或大模型的发展影响并不是那么大,所以会对理论产生质疑的声音。我认为理论的研究需要改变传统,随着大模型理论研究的深入,传统的理论无法达到精确分析刻画网络结构的效果,需要改变研究范式,用复杂的系统理论解释有限的现象。
娄钱:我个人是从工程角度做AI的相关研究,大部分人做理论研究的流程是先观察问题,再提出算法,而新算法的提出一般是先基于直觉,然后再验证算法的有效性,这也是我目前比较推崇的一种做研究的方式。
王琦:大模型的涌现能力是让人惊艳的它遍历了与人类复杂语言系统中的各种组合技巧,从这种角度看,生成式模型或者AI本质上是在做一种概率建模。除此之外,高效推断、高效采样、随机问题的优化、可解释性也是未来大模型研究中值得探讨的理论问题。
吴泰霖:大模型一定还需要理论。从Science for AI的角度来看,不同的学科都会有不同的方式和概念能够从基础理论的形式上,有可能对大模型进行更好的理解。
整理:陈研
审核:王琦、吴泰霖、孟祥明、娄钱
往期精彩文章推荐
记得关注我们呀!每天都有新知识!
关于AI TIME
AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。
迄今为止,AI TIME已经邀请了1100多位海内外讲者,举办了逾550场活动,超600万人次观看。
我知道你
在看
哦
~
点击 阅读原文 观看回放!
相关文章:

大模型在金融医疗、生命系统和物理仿真领域的创新应用探索
点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 在当今迅速发展的科技领域,大模型技术正日益成为金融医疗、生命系统和物理仿真等领域中的重要工具。2023年6月16日,AI TIME举办的青年科学家大模型专场活动邀请了国防科技大学理学院数学…...

tensorflow / tensorflow-gpu cuda cudNN tensorRT 安装,启用显卡加速
tensorflow / tensorflow-gpu cuda cudNN tensorRT 安装,启用显卡加速 说明 Tensorflow-GPU 已被移除。请安装 tensorflow 。 tensorflow 通过 Nvidia CUDA 支持 GPU 加速操作。 自 2019 年 9月发布 的 TensorFlow2.1 以来,tensorFlow 和 tensorflow-GPU 一直是同…...

计算机视觉中的Transformer
几十年来,理论物理学家一直在努力提出一个宏大的统一理论。通过统一,指的是将被认为是完全不同的两个或多个想法结合起来,将它们的不同方面证明为同一基础现象。一个例子是在19世纪之前,电和磁被看作是无关的现象,但电…...

UVA-1601 万圣节后的早晨 题解答案代码 算法竞赛入门经典第二版
GitHub - jzplp/aoapc-UVA-Answer: 算法竞赛入门经典 例题和习题答案 刘汝佳 第二版 以三个点的当前位置作为状态,广度优先遍历,找到终点即为最短次数。 注意: 一次可以移动多个点,但是每个点只能移动一步。在同一次中…...
nacos 403错误
403错误 2023-08-12 18:04:55,418 [main] ERROR [com.alibaba.cloud.nacos.client.NacosPropertySourceBuilder:106] [trace,span,parent] - get data from Nacos error,dataId:gateway-server.yaml, com.alibaba.nacos.api.exception.NacosException: <html><body&…...
Python遥感图像处理应用篇(三十四):GDAL+Scikit-image+GLCM计算遥感图像纹理特征
1.运行环境 GDAL 3.4.2,Scikit-image最新版本0.19.3,numpy1.21.5 GDAL主要用于实现图像的读取和保存,Scikit-image和numpy对图像进行各种计算处理。 在调试好之前,由于numpy版本(1.16.6)低的问题,运行提示如下错误,更新为1.21.5版本之后就可以正常运行了,在此记录一…...

solr迁移到另一个solr中(docker单机)
背景介绍 solr数据迁移,或者版本升级,需要用到迁移,此处记录一下迁移方法以及过程中遇到的问题。我这边使用的是docker环境,非docker部署的应该也是一样的。 solr部署教程 准备工作 ● solrA 版本: 8.11.2 (已有so…...
谁能讲清楚Spark之Spark系统架构
### 整体架构概述 Spark与Hadoop MapReduce的结构类似,Spark也采用Master-Worker结构。如果一个Spark集群由4个节点组成,即1个Master节点和3个Worker节点,那么在部署Standalone版本后,Spark部署的系统架构图如图2.1所示。简单来说,Master节点负责管理应用和任务,…...

力扣:59. 螺旋矩阵 II(Python3)
题目: 给你一个正整数 n ,生成一个包含 1 到 n2 所有元素,且元素按顺时针顺序螺旋排列的 n x n 正方形矩阵 matrix 。 来源:力扣(LeetCode) 链接:力扣(LeetCode)官网 - 全…...

【electron】electron项目创建的方式:
文章目录 【1】npm init quick-start/electron(推荐)【2】 克隆仓库,快速启动【3】 通过脚手架搭建项目【4】 手动创建项目 【Electron官网】https://www.electronjs.org/zh/docs/latest/api/app 【1】npm init quick-start/electron…...
Vim学习(一)——基本命令与三种模式
写在前面, 致敬 8月3日,Vim创始人Bram Moolenaar去世,在此向老爷子致敬!感谢他为这个世界带来的优秀编辑器Vim。 基本介绍 Vim全称叫Vi IMproved. 而vi则是Visual Interface的缩写,他们处理都是ASCII码字符数据&am…...

unity新输入系统的简单使用(New InputSystem)
1、在包管理器 unity注册表中下载安装InputSystem 2、给玩家添加组件PlayerInput,点击CreatAction,创建一个InputAct InputAct,这是玩家的输入文件,在里面可以设置玩家输入 3、使用 例如玩家控制角色移动 在InputAct中,默认已经设置好了移…...

Redis——特性介绍与应用场景
Redis特性介绍 In-memory data structrues 众所周知,MySQL是一种关系型数据库,其通过表的结构存储数据,就类似于建立了一个excel表格来存储数据。但是像视频这类数据并不适合存储在关系型数据库中,因此存在非关系型数据库——通…...

网络:路由
1. 路由器 路由器工作在三层,每个接口都处于不用的网段中,即不同的广播域。但大多情况下,两台路由器直接相连的接口是同一个广播域,即一个网段。 路由器具有判断网络地址和选择路径的功能,能在多网络互联的环境中&…...

利用三维内容编辑器制作VR交互课件,简单好用易上手
随着虚拟现实技术的不断发展,越来越多的教育机构开始尝试将其应用于教育教学中。然而,要实现这一目标并不容易,需要专业的技术支持和开发团队。 为了解决这一问题,广州华锐互动研发了三维内容编辑器,它是一种基于虚拟现…...

中国首款量子计算机操作系统本源司南 PilotOS正式上线
中国安徽省量子计算工程研究中心近日宣布,中国国产量子计算机操作系统本源司南 PilotOS 客户端正式上线。 如果把量子芯片比喻成人的“心脏”,那么量子计算机操作系统就相当于人的“大脑”,量子计算应用软件则是人的“四肢”。 据安徽省量子…...

基层社会治理平台建设方案[113页PPT]
导读:原文《基层社会治理平台建设方案[113页PPT]》(获取来源见文尾),本文精选其中精华及架构部分,逻辑清晰、内容完整,为快速形成售前方案提供参考。 完整版领取方式 完整版领取方式: 如需获取完…...
认识vite
一.了解vite的不同版本的更新 vite1版本是基于vue项目的,无法跨框架使用vite2可以跨框架(vue2,vue3,react)vite3模板变更;vite cli优化;import.meta.glob API变化;其他vite4主版本主…...

华为运动健康,十年创新天地宽
我听一位朋友讲过这样一个故事。某天早上,急诊科的医生迎来了一位患者,患者进来后直接说:“大夫,我房颤了。” 这位医生非常诧异,因为心脏房颤确实非常危急,但很多时候并没有明显的生理体征,患者…...

深度学习(37)—— 图神经网络GNN(2)
深度学习(37)—— 图神经网络GNN(2) 这一期主要是一些简单示例,针对不同的情况,使用的数据都是torch_geometric的内置数据集 文章目录 深度学习(37)—— 图神经网络GNN(…...
应用升级/灾备测试时使用guarantee 闪回点迅速回退
1.场景 应用要升级,当升级失败时,数据库回退到升级前. 要测试系统,测试完成后,数据库要回退到测试前。 相对于RMAN恢复需要很长时间, 数据库闪回只需要几分钟。 2.技术实现 数据库设置 2个db_recovery参数 创建guarantee闪回点,不需要开启数据库闪回。…...
论文解读:交大港大上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架(二)
HoST框架核心实现方法详解 - 论文深度解读(第二部分) 《Learning Humanoid Standing-up Control across Diverse Postures》 系列文章: 论文深度解读 + 算法与代码分析(二) 作者机构: 上海AI Lab, 上海交通大学, 香港大学, 浙江大学, 香港中文大学 论文主题: 人形机器人…...
React Native 导航系统实战(React Navigation)
导航系统实战(React Navigation) React Navigation 是 React Native 应用中最常用的导航库之一,它提供了多种导航模式,如堆栈导航(Stack Navigator)、标签导航(Tab Navigator)和抽屉…...

学习STC51单片机31(芯片为STC89C52RCRC)OLED显示屏1
每日一言 生活的美好,总是藏在那些你咬牙坚持的日子里。 硬件:OLED 以后要用到OLED的时候找到这个文件 OLED的设备地址 SSD1306"SSD" 是品牌缩写,"1306" 是产品编号。 驱动 OLED 屏幕的 IIC 总线数据传输格式 示意图 …...

c#开发AI模型对话
AI模型 前面已经介绍了一般AI模型本地部署,直接调用现成的模型数据。这里主要讲述讲接口集成到我们自己的程序中使用方式。 微软提供了ML.NET来开发和使用AI模型,但是目前国内可能使用不多,至少实践例子很少看见。开发训练模型就不介绍了&am…...
大语言模型(LLM)中的KV缓存压缩与动态稀疏注意力机制设计
随着大语言模型(LLM)参数规模的增长,推理阶段的内存占用和计算复杂度成为核心挑战。传统注意力机制的计算复杂度随序列长度呈二次方增长,而KV缓存的内存消耗可能高达数十GB(例如Llama2-7B处理100K token时需50GB内存&a…...
docker 部署发现spring.profiles.active 问题
报错: org.springframework.boot.context.config.InvalidConfigDataPropertyException: Property spring.profiles.active imported from location class path resource [application-test.yml] is invalid in a profile specific resource [origin: class path re…...
JAVA后端开发——多租户
数据隔离是多租户系统中的核心概念,确保一个租户(在这个系统中可能是一个公司或一个独立的客户)的数据对其他租户是不可见的。在 RuoYi 框架(您当前项目所使用的基础框架)中,这通常是通过在数据表中增加一个…...

佰力博科技与您探讨热释电测量的几种方法
热释电的测量主要涉及热释电系数的测定,这是表征热释电材料性能的重要参数。热释电系数的测量方法主要包括静态法、动态法和积分电荷法。其中,积分电荷法最为常用,其原理是通过测量在电容器上积累的热释电电荷,从而确定热释电系数…...

GruntJS-前端自动化任务运行器从入门到实战
Grunt 完全指南:从入门到实战 一、Grunt 是什么? Grunt是一个基于 Node.js 的前端自动化任务运行器,主要用于自动化执行项目开发中重复性高的任务,例如文件压缩、代码编译、语法检查、单元测试、文件合并等。通过配置简洁的任务…...