当前位置: 首页 > article >正文

斯坦福+哈佛医学院:虚拟细胞图像生成基础模型

摘要构建能在计算机中模拟细胞行为的虚拟细胞是计算生物学的核心目标。本文提出款图像生成模型CellFluxV2可预测化学与遗传扰动下细胞形态的变化。CellFluxV2的核心创新在于通过流匹配flow matching学习同一实验批次内 「未扰动细胞→扰动细胞」的分布级转换从而分离真实扰动效应与干扰性批次效应。该模型整合大方法学进展相较于基于扩散模型和生成对抗网络GAN的基线模型图像保真度最高提升77%同时保持与真实图像相当的生物保真度。通过规模化扩展CellFluxV2建立了图像基虚拟细胞建模领域的首个缩放定律证实模型性能随数据集规模和模型容量的增加而持续提升。此外扩展后的模型能良好泛化至分布外扰动并具备项全新能力批次效应校正与细胞状态插值。这些结果表明CellFluxV2是推动虚拟细胞研究的强大基础模型为计算机内药物筛选in silico drug screening开辟了新机遇。https://github.com/yuhui-zh15/CellFluxV2#细胞成像 #扰动 #虚拟细胞 #流匹配 #生成模型结果基于流匹配的分布级转换图1CellFluxV2概述(a) 目标CellFluxV2旨在计算机中预测化学或基因扰动诱导的细胞形态变化。本示例中扰动效应为核尺寸减小。(b) 数据数据集包含高内涵筛选实验图像目标孔施加化学或遗传扰动对照孔不施加扰动。对照孔提供先验信息与目标图像形成对比可识别真实扰动效应如核尺寸减小同时校准与扰动无关的系统性偏差即批次效应如颜色强度变化。(c) 问题建模CellFluxV2将该任务建模为分布到分布问题多对多映射源分布为对照图像目标分布为同一批次内的扰动图像。(d) 流匹配CellFluxV2采用流匹配——种最先进的分布到分布转换生成框架。模型学习个神经网络以逼近速度场通过求解常微分方程ODE实现源分布向目标分布的连续转换。与CellFluxV1相比本文引入大关键改进潜空间建模、两阶段训练和噪声插值这些技术有效缓解了分布学习中的数据稀疏问题。(e) CellFluxV2算法训练阶段神经网络vθ在潜空间中学习将对照细胞图像x₀~p₀映射到扰动图像x₁~p₁的速度场。中间状态Tₜ沿 x₀到真实位移x₁-x₀的线性插值采样结合 t~U[0,1]和噪声增强。训练分阶段进行第阶段从噪声到目标分布第阶段从对照到目标分布。(f) 推理阶段训练后的场v₀通过数值积分ODE时间步长t0,0.1,...,1利用学习到的速度更新每个步骤的状态将对照状态x₀转换为扰动状态x₁。损失函数L使预测速度vθ(xₜ,t,c)与真实速度x₁-x₀匹配。最先进性能图2CellFluxV2大幅优于基线模型(a) 图像保真度CellFluxV2实现更优的图像保真度表现为显著更低的整体和条件FID/KID值。(b) 单扰动结果针对6种代表性化学扰动和3种遗传扰动CellFluxV2生成的图像更准确能更好地捕捉扰动效应以FID值衡量。(c) 生物保真度CellFluxV2实现更优的生物保真度表现为更高且接近真实水平的作用机制MoA预测准确率。(d) 方法消融实验CellFluxV2的优异性能源于对流匹配的创新改进包括潜空间建模、两阶段训练和噪声插值。(e) 定性结果定性分析进一步证实CellFluxV2具有更优的视觉和生物保真度。表1 CellFluxV2评估结果(a) 主要结果CellFluxV2优于基于GAN和扩散模型的基线模型在化学、遗传及混合扰动大数据集的细胞形态预测任务中实现最先进性能。指标衡量生成样本与真实样本的距离值越低表现越好。FIDₒ整体 FID评估所有图像FID_c条件FID为各扰动类型结果的平均值。KID值已乘以100以便可视化。(b) 单扰动结果针对6种代表性化学扰动和3种遗传扰动CellFluxV2生成的图像更准确能更好地捕捉扰动效应以FID值衡量。(c) 作用机制MoA分类在BBBC021数据集上训练分类器从细胞形态图像预测药物的作用机制MoA并评估生成图像的准确率/F1值。CellFluxV2的准确率/F1值显著高于其他方法与真实图像高度一致能有效反映扰动的生物学效应。(d) 分布外泛化在BBBC021数据集上针对训练中未见过的新型化合物CellFluxV2生成细胞形态图像时仍保持良好性能。(e) 消融实验各组件均对CellFluxV2的最终性能有贡献凸显其重要性。缩放定律图3CellFluxV2规模化扩展揭示虚拟细胞建模的首个缩放定律(a) 数据缩放随着数据量增加基础模型使用3%至100%的数据性能持续提升。(b) 模型缩放随着模型尺寸增大使用100%数据从微型到超大尺寸性能持续提升。综上建立了虚拟细胞建模领域的首个实证缩放定律证实模型性能随数据规模和模型尺寸的增加而显著提升。除分布内性能外规模化还增强了模型对分布外图像源和扰动的泛化能力凸显其作为虚拟细胞建模稳健基础的潜力。(c) 定性结果以秋水仙素为扰动的定性分析进一步证实随着数据量和模型规模的增加生成质量显著提升秋水仙素会使细胞呈现更球形或圆形的形态。表2 生物学缩放定律本文建立了生物学领域的首个实证缩放定律证实模型性能以FID值衡量随数据规模上半部分和模型尺寸下半部分的增加而显著提升。除分布内性能外规模化还增强了模型对分布外图像源和扰动的泛化能力凸显其作为虚拟细胞建模稳健基础的潜力。分布外泛化图4CellFluxV2对分布外OOD扰动和成像条件展现出稳健的泛化能力(a) 图像保真度指标模型能泛化至分布外成像条件和扰动图像保真度指标FID/KID与分布内性能相当。(b) 生物保真度指标模型能泛化至分布外成像条件和扰动生物保真度指标如作用机制MoA平均精度均值与分布内结果接近且接近真实水平。全新能力批次效应校正图5CellFluxV2具备批次效应校正的全新能力(a) 不同批次的定性结果CellFluxV2以对照图像为初始输入可生成批次特异性预测。对比不同批次的预测结果能凸显真实扰动效应细胞尺寸变小同时过滤虚假批次效应细胞密度变化。(b) 不同批次细胞的PCA可视化将生成图像、真实扰动图像和对照图像通过PCA投影到低维空间按批次标识着色。CellFluxV2生成的图像与对应批次紧密聚类与同一批次的真实图像和对照图像重叠。(c) 作用机制MoA准确率结果当以正确批次为条件时CellFluxV2生成的图像对应的MoA分类准确率显著高于以不同批次为条件的结果。全新能力细胞状态插值图6CellFluxV2具备细胞状态插值的全新能力(a) 插值定性结果利用连续速度场CellFluxV2可在种细胞状态间实现平滑的双向插值为动态生物学进程提供独特视角。(b) 插值轨迹的PCA可视化将插值图像和真实图像的CellProfiler特征通过PCA投影到低维空间。对照组、目标组和中间状态分别代表对照细胞、经48小时扰动的细胞和经24小时扰动的细胞的CellProfiler嵌入。其他彩色点T₁-T₆对应中间时间点收集的生成细胞。插值图像清晰呈现从对照组到目标组的平滑过渡中间时间步样本与真实中间状态细胞紧密聚类。坐标轴为前个主成分括号内为解释方差比例。详细总结思维导图CellFluxV2以流匹配flow matching为核心框架针对数据稀疏问题引入3大创新方法形成完整技术链数据集详情核心性能指标优于GAN/扩散基线参考CellFluxV2 : An Image Generative Foundation Model for Virtual Cell Modelingdoi: https://doi.org/10.64898/2026.01.19.696785260119CellFluxV2.pdf注AI辅助创作如有错误欢迎指出。内容仅供参考不构成任何建议。

相关文章:

斯坦福+哈佛医学院:虚拟细胞图像生成基础模型

摘要 构建能在计算机中模拟细胞行为的虚拟细胞,是计算生物学的核心目标。本文提出1款图像生成模型CellFluxV2,可预测化学与遗传扰动下细胞形态的变化。CellFluxV2的核心创新在于,通过流匹配(flow matching&#xff09…...

Windows DLL注入工具Xenos实战指南:问题解决与效能优化

Windows DLL注入工具Xenos实战指南:问题解决与效能优化 【免费下载链接】Xenos Windows dll injector 项目地址: https://gitcode.com/gh_mirrors/xe/Xenos 引言 在Windows系统开发与调试过程中,DLL注入技术扮演着重要角色,无论是插件…...

Ubuntu 24.04 Noble Numbat 尝鲜记:用Docker搞定ROS 2 Humble开发环境(附镜像拉取与容器运行全流程)

Ubuntu 24.04 Noble Numbat 尝鲜记:用Docker搞定ROS 2 Humble开发环境(附镜像拉取与容器运行全流程) 当Ubuntu 24.04 Noble Numbat遇上ROS 2 Humble,就像两个来自不同时空的旅行者相遇——一个是最新发布的系统版本,另…...

从零到一:基于SkyWalking构建微服务可观测性实践

1. 为什么微服务需要可观测性? 记得去年我们团队把一个单体应用拆分成五个微服务后,突然发现线上问题排查变得异常困难。有一次用户反馈订单支付超时,我们花了整整两天时间才定位到是风控服务调用了第三方接口导致的性能瓶颈。这种经历让我深…...

别再搞混了!Docker部署Redis Stack时,选redis/redis-stack还是redis/redis-stack-server?

Redis Stack镜像选择指南:开发与生产环境的最佳实践 在容器化技术普及的今天,Docker已成为部署Redis Stack的首选方案。但面对官方提供的两个相似镜像——redis/redis-stack和redis/redis-stack-server,许多开发者常陷入选择困境。本文将深入…...

MPU9250 I²C驱动库深度解析与嵌入式工程实践

1. MPU9250 IC驱动库技术解析与工程实践指南 MPU9250是InvenSense(现为TDK子公司)推出的高性能9轴运动传感器,集成3轴陀螺仪、3轴加速度计和3轴磁力计,广泛应用于无人机姿态解算、可穿戴设备运动追踪、机器人SLAM前端感知等嵌入式…...

别再死记硬背了!用‘借位法’5分钟搞定子网划分,网工面试必看

别再死记硬背了!用‘借位法’5分钟搞定子网划分,网工面试必看 刚入行的网络工程师最怕什么?十个人里有九个会说是子网划分。那些密密麻麻的二进制数字、复杂的计算公式,简直像天书一样让人望而生畏。但今天我要告诉你一个秘密&…...

树莓派4B部署YOLOv5-Lite实战:从ONNX模型优化到实时检测性能调优

树莓派4B部署YOLOv5-Lite实战:从ONNX模型优化到实时检测性能调优 当目标检测遇上边缘计算,如何在仅有1.5GHz Cortex-A72处理器的树莓派4B上实现15FPS的实时推理?本文将揭示从模型压缩到硬件调优的全链路实战方案。不同于常规的部署教程&…...

为什么你的Ubuntu实时内核编译失败了?PREEMPT_RT补丁的5个关键配置解析

为什么你的Ubuntu实时内核编译失败了?PREEMPT_RT补丁的5个关键配置解析 在工业自动化、机器人控制和金融交易等对延迟敏感的领域,毫秒级的响应差异可能直接影响系统可靠性。许多开发者选择Ubuntu搭配PREEMPT_RT补丁构建实时系统,却在编译阶段…...

Java实战:阿里云OSS文件操作工具类封装与优化

1. 阿里云OSS基础认知与Java集成准备 第一次接触阿里云OSS时,我完全被文档里那些专业术语搞懵了。后来才明白,它本质上就是个超级网盘,只不过比我们平时用的网盘更专业、更稳定。想象一下,你有个无限容量的保险箱,可以…...

保姆级教程:PX4 EKF调参实战,手把手教你搞定Q、R矩阵(附避坑指南)

PX4 EKF调参实战:从传感器噪声到Q/R矩阵优化的完整指南 当无人机在强风环境下突然出现位置漂移,或是穿越机在高速机动时姿态估计突然发散——这些场景背后往往隐藏着扩展卡尔曼滤波器(EKF)参数配置不当的问题。作为PX4飞控的核心状态估计算法&#xff0c…...

EPSON机器人通信避坑指南:TCP/IP协议在LS3-401S上的常见问题与解决方案

EPSON机器人通信避坑指南:TCP/IP协议在LS3-401S上的常见问题与解决方案 在工业自动化领域,EPSON LS3-401S机器人凭借其高精度和可靠性广受青睐。然而,在实际部署过程中,TCP/IP通信问题往往成为工程师们的"拦路虎"。本文…...

保姆级教程:用sw_urdf_exporter插件将Solidworks机械臂模型转为ROS可用的URDF

从Solidworks到ROS:机械臂URDF转换全流程实战指南 机械臂作为工业自动化和服务机器人的核心部件,其运动仿真在ROS生态中占据重要地位。许多工程师习惯使用Solidworks进行机械结构设计,却苦于如何将设计成果无缝迁移到ROS环境。本文将彻底解决…...

用STM32F103C8T6和NRF24L01自制遥控器,从硬件选型到代码调试的完整避坑指南

STM32F103C8T6与NRF24L01遥控器开发实战:从硬件设计到软件调试的全流程解析 在创客和嵌入式开发领域,无线遥控系统一直是热门话题。无论是机器人控制、无人机飞行还是智能家居应用,稳定可靠的遥控器都是不可或缺的核心组件。本文将详细介绍如…...

万象视界灵坛部署教程:阿里云ECS+Docker一键部署开源多模态感知平台

万象视界灵坛部署教程:阿里云ECSDocker一键部署开源多模态感知平台 1. 项目概述 万象视界灵坛(Omni-Vision Sanctuary)是一款基于OpenAI CLIP技术的高级多模态智能感知平台。它将复杂的语义对齐技术转化为直观的像素风格交互体验&#xff0…...

通过WireShark与WinHex从pcap数据流中提取并修复损坏的JPG图片

1. 从pcap文件中筛选JPG数据流 当你拿到一个网络抓包文件(pcap格式),里面可能混杂着各种网络流量数据。要从中提取出图片文件,首先得学会用WireShark这个神器来筛选目标数据。我处理过不少类似的案例,发现很多新手容易…...

IDM试用期突破技术深度解析:从原理到实战的全方位解决方案

IDM试用期突破技术深度解析:从原理到实战的全方位解决方案 【免费下载链接】IDM-Activation-Script IDM Activation & Trail Reset Script 项目地址: https://gitcode.com/gh_mirrors/id/IDM-Activation-Script 问题溯源:试用期限制的本质与认…...

你的QQ空间记忆正在消失?GetQzonehistory帮你永久保存青春时光

你的QQ空间记忆正在消失?GetQzonehistory帮你永久保存青春时光 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 你是否曾担心QQ空间里的珍贵回忆会随着时间流逝而消失&#x…...

街道办管理系统|基于springboot + vue街道办管理系统(源码+数据库+文档)

街道办管理系统 目录 基于springboot vue街道办管理系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue街道办管理系统 一、前言 博主介绍&#x…...

别再只用NodePort了!手把手教你用MetalLB在本地K8s集群实现LoadBalancer服务暴露

突破本地Kubernetes限制:MetalLB实现LoadBalancer全实战指南 当你第一次在本地Minikube或自建Kubernetes集群中尝试创建LoadBalancer类型的Service时,那个永恒的"Pending"状态是否让你感到困惑?云厂商提供的LoadBalancer服务在本地…...

Android显示驱动避坑指南:高通平台UEFI显示初始化常见问题解析

Android显示驱动避坑指南:高通平台UEFI显示初始化常见问题解析 在移动设备开发领域,显示系统的稳定性直接影响用户体验。作为Android底层开发的核心环节,高通平台UEFI显示初始化过程涉及硬件抽象层、固件配置和内核交互等多个技术层面。本文…...

SAP MM进阶:解密DESADV IDoc如何打通公司间STO的‘任督二脉’

SAP MM进阶:DESADV IDoc在公司间STO流程中的核心作用解析 在集团化企业的供应链管理中,公司间库存转储订单(STO)的高效执行往往决定着整个供应链的响应速度。当货物从发货方仓库运出时,如何确保收货方能实时获取发货信…...

用Python手把手实现ALNS算法:从TSP路径规划到代码实战(附完整源码)

用Python手把手实现ALNS算法:从TSP路径规划到代码实战 旅行商问题(TSP)是组合优化中最经典的NP难问题之一,如何在合理时间内找到近似最优解一直是算法研究的重点。自适应大邻域搜索(ALNS)作为LNS算法的增强…...

从仿真到上板:手把手教你用Vivado搭建一个“永不停机”的FFT信号处理链路(附Testbench)

从仿真到上板:构建高可靠FFT信号处理系统的全流程实战 在数字信号处理领域,快速傅里叶变换(FFT)作为频谱分析的核心算法,其硬件实现一直是FPGA工程师的必备技能。本文将带您从仿真环境搭建开始,逐步完成一…...

腾讯 CodeBuddy 全形态解析:IDE、CLI 与插件如何重塑 AI 编程体验

1. CodeBuddy 三形态全景解析:从终端到桌面的AI编程革命 第一次用CodeBuddy的CLI工具时,我在终端里输入"帮我写个Python爬虫抓取天气数据",三秒钟后看着自动生成的完整代码,手里的咖啡差点洒在键盘上。这就是腾讯CodeB…...

SIP系列四:SIP消息格式实战解析与调试指南

1. SIP消息格式深度拆解:从理论到抓包实战 第一次用Wireshark抓取SIP消息时,我被满屏的Header字段搞得头晕眼花。直到后来才发现,这些看似复杂的文本背后藏着精妙的设计逻辑。我们先从最基础的SIP消息结构说起——它就像快递包裹的运单&…...

保姆级教程:在Ubuntu 20.04上搞定Isaac Gym Preview 4和强化学习环境(含常见libpython报错解决)

保姆级教程:在Ubuntu 20.04上搞定Isaac Gym Preview 4和强化学习环境(含常见libpython报错解决) 刚接触Isaac Gym的机器人/强化学习新手,往往会在环境配置阶段遇到各种依赖问题。本文将提供一个从零开始的详细安装指南&#xff0c…...

Windows Defender的MsMpEng.exe为什么总在“瞎忙”?从机制到应对的深度解读

Windows Defender的MsMpEng.exe高占用现象:机制解析与精准优化策略 你是否经历过这样的场景:正在紧急编译代码时,风扇突然狂转,任务管理器里MsMpEng.exe的CPU使用率飙升至90%;或者拷贝大型设计文件时,系统卡…...

WMIC命令行高效卸载Windows软件:从入门到精通

1. 为什么选择WMIC卸载软件? 每次电脑卡顿的时候,打开C盘一看,总会被各种不明所以的软件占满空间。传统的卸载方式要经过"控制面板-程序和功能-找到目标-点击卸载"的繁琐流程,而WMIC只需要几行命令就能搞定。我在帮同事…...

Pixel Epic智识终端效果展示:复杂逻辑推演型研报(如SWOT+PESTEL)

Pixel Epic智识终端效果展示:复杂逻辑推演型研报(如SWOTPESTEL) 1. 产品概览:当学术研究遇上像素冒险 Pixel Epic智识终端是一款将严肃学术研究与游戏化体验完美融合的创新工具。它基于AgentCPM-Report大模型构建,专…...