当前位置: 首页 > article >正文

德适发布医疗AI评测平台DoctorBench 智诊科技、谷歌、OpenAl位列三甲

4月30日杭州德适生物科技股份有限公司2526.HK简称 “德适”在中国香港正式发布医疗AI评测平台DoctorBench并揭晓首期全球医疗大模型排行榜。杭州智诊科技的WiseDiag-v2、谷歌的Gemini-3.1-Pro-Preview、OpenAI的GPT-5.4 位列前三甲。该平台首次以 “临床实战能力” 为核心标尺为全球医疗大模型构建起一套贴近真实诊疗场景的多维评测体系。专业人士指出当前全球医疗大模型正加速从实验室走向临床应用但行业始终缺乏一套能够真正衡量模型“看病能力” 的评测标准。现有的评测大多聚焦于医学知识问答难以反映模型在复杂临床情境中的综合表现——这种评测与临床实践之间的鸿沟正在成为制约医疗AI落地应用的全球性挑战。此前OpenAI发布HealthBench标志着领先企业开始重视这一挑战。然而医疗具有强烈的本土化特征——不同国家和地区的诊疗指南、语言习惯、患者群体存在显著差异任何单一评测体系都难以实现全球普适。正是基于对这一全球性挑战的深刻认识德适发起并打造了DoctorBench 平台。这一平台的诞生植根于一个跨学科团队近十年的深耕与协作。德适汇聚了基础医学、临床医学、人工智能、医疗产业等多领域的专家将严谨的临床医学逻辑与前沿的深度学习算法深度融合让DoctorBench既能理解AI技术的边界又能洞察临床实践的复杂需求并以此为标准构建评测体系。DoctorBench的核心理念是不再只考核大模型的 “知识储备”而是考核其 “像医生一样思考” 的临床沟通与决策能力。平台构建了三大榜单体系 —— 医学主榜单LLM、多模态榜单VLM与智能体榜单Agent分别评测模型的文本诊疗能力、多模态理解能力以及模拟诊疗环境中的多轮决策与工具调用能力。在评测机制上DoctorBench首创“2大核心维度安全性和准确性3 项通用维度交互质量、信息优先级、主动询问5 项专项模块证据与引用、可解释推理、可执行性、个体化适配、情感支持” 的多维架构并搭载 “场景自适应权重”——根据不同临床场景的风险等级动态调整各维度权重使评分逻辑更贴近真实诊疗决策。尤为关键的是平台将 “医学事实准确” 与 “安全与风险控制” 设为具有 “一票否决权” 的核心红线 —— 任何模型若在关乎患者安全的关键问题上出现严重偏差无论其他维度表现如何突出均无法获得高分。这一设计源于团队对医疗本质的深刻理解在关乎生命的领域安全性永远是第一要义没有妥协余地。“医疗AI的发展是一场关乎人类共同健康福祉的长跑既需要颠覆式的技术创新和跨学科、跨地域的深度协作更需要对生命健康的绝对敬畏与坚守。” 德适创始人宋宁博士表示期待与全球更多科研机构、临床中心和行业伙伴携手让真正有实力的技术被看见、被信赖最终惠及每一位患者。

相关文章:

德适发布医疗AI评测平台DoctorBench 智诊科技、谷歌、OpenAl位列三甲

4月30日,杭州德适生物科技股份有限公司(2526.HK,简称 “德适”)在中国香港正式发布医疗AI评测平台DoctorBench,并揭晓首期全球医疗大模型排行榜。杭州智诊科技的WiseDiag-v2、谷歌的Gemini-3.1-Pro-Preview、OpenAI的G…...

3337. 字符串转换后的长度 II

题目链接 3337. 字符串转换后的长度 II - 力扣(LeetCode) 题目描述 给你一个由小写英文字母组成的字符串 s,一个整数 t 表示要执行的 转换 次数,以及一个长度为 26 的数组 nums。每次 转换 需要根据以下规则替换字符串 s 中的每…...

AI模型安全检测工具DeepSight:原理与应用实践

1. 项目背景与核心价值在AI技术快速落地的今天,模型安全已成为行业不可忽视的关键议题。去年某电商平台因推荐系统漏洞导致千万级用户数据异常曝光的事件,让业界深刻认识到:AI系统上线前的安全评估与运行时诊断,与传统软件测试有着…...

怎样高效掌握Python GUI开发:实用PyQt6实战手册

怎样高效掌握Python GUI开发:实用PyQt6实战手册 【免费下载链接】PyQt-Chinese-tutorial PyQt6中文教程 项目地址: https://gitcode.com/gh_mirrors/py/PyQt-Chinese-tutorial PyQt-Chinese-Tutorial是一份全面的PyQt6中文教程,专为Python开发者和…...

2025最权威的六大AI科研神器推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 一系列关于DeepSeek的论文,系统地阐述了大规模语言模型的技术架构,以…...

AI系统的“正确性”到底怎么定义?

很多团队第一次做 AI 应用测试时,都会遇到一个很尴尬的问题: 传统系统测对错,通常有明确答案。 接口返回状态码是不是 200? 金额计算是不是 99.99? 权限校验是不是拦住了非法用户? 数据库字段是不是落对了…...

别再只会用BLDC方波驱动了!深入浅出对比FOC与六步换相的噪音、效率与适用场景

无刷电机控制技术进阶:FOC与六步换相的深度对比与选型指南 在消费电子和工业设备领域,无刷直流电机(BLDC)凭借高效率、长寿命和低维护成本等优势,正逐步取代传统有刷电机。然而,面对不同的应用场景,工程师们常常陷入控…...

QT5升级QT6踩坑记:qmake构建QML项目,资源管理方式大变样(附完整配置流程)

QT5到QT6迁移实战:qmake构建QML项目的资源管理重构指南 当开发者将一个QT5的QML项目迁移到QT6环境时,最常遇到的"拦路虎"莫过于资源管理机制的变更。许多开发者反馈,原本在QT5下运行良好的项目,在QT6中突然出现图片无法…...

别再只会换清华源了!保姆级教程:Ubuntu 22.04/20.04 软件源配置与故障排查全攻略

Ubuntu系统软件源配置与故障排查实战指南 1. 理解软件源的工作原理 在Ubuntu系统中,软件源(Repository)是软件包管理系统的核心组件。它不仅仅是简单的下载地址列表,而是一个完整的软件分发体系。理解其工作原理,能帮助…...

3个关键技巧:让AutoDock-Vina分子对接结果更准确的实战指南

3个关键技巧:让AutoDock-Vina分子对接结果更准确的实战指南 【免费下载链接】AutoDock-Vina AutoDock Vina 项目地址: https://gitcode.com/gh_mirrors/au/AutoDock-Vina 你是否曾经在进行分子对接时,发现结果总是不尽如人意?明明按照…...

如何一键获取全国高铁数据?Parse12306开源工具终极指南

如何一键获取全国高铁数据?Parse12306开源工具终极指南 【免费下载链接】Parse12306 分析12306 获取全国列车数据 项目地址: https://gitcode.com/gh_mirrors/pa/Parse12306 你是否曾为获取全国高铁时刻表数据而烦恼?当你需要开发铁路查询应用或进…...

别再死记硬背!通过Wireshark抓包,直观理解三层交换机VLAN间路由的数据转发过程

用Wireshark透视三层交换机:VLAN间路由的数据包奇幻之旅 当你第一次看到三层交换机配置成功时,VLAN间能够互相ping通,那种成就感不言而喻。但很快,一个更深的疑问浮上心头:这些数据包到底是怎么穿越不同VLAN的&#x…...

利用Taotoken模型广场为不同视频类型智能匹配最佳文案生成模型

利用Taotoken模型广场为不同视频类型智能匹配最佳文案生成模型 1. 视频内容生产中的模型选型挑战 在视频制作流程中,文案生成环节往往需要适配多种内容类型。宣传片需要富有感染力的叙述性文本,教程视频要求逻辑清晰的步骤说明,而短视频则依…...

如何轻松释放Windows内存:Mem Reduct完整使用指南

如何轻松释放Windows内存:Mem Reduct完整使用指南 【免费下载链接】memreduct Lightweight real-time memory management application to monitor and clean system memory on your computer. 项目地址: https://gitcode.com/gh_mirrors/me/memreduct 你是不…...

量子光学中的多光子干涉与周期性态应用

1. 量子光学中的多光子干涉基础量子光学研究光与物质相互作用的量子特性,其中多光子干涉现象是量子信息处理的核心资源。当多个光子通过线性光学网络时,它们会表现出经典光无法实现的干涉模式,这种非经典特性源于光子的玻色子本质。在量子光学…...

数字电路设计与仿真终极指南:Logisim-Evolution完全使用教程

数字电路设计与仿真终极指南:Logisim-Evolution完全使用教程 【免费下载链接】logisim-evolution Digital logic design tool and simulator 项目地址: https://gitcode.com/gh_mirrors/lo/logisim-evolution 想要学习数字电路设计却不知道从何开始&#xff…...

如何用BilibiliDown打造个人专属B站音乐库:5步实现高品质音频自由

如何用BilibiliDown打造个人专属B站音乐库:5步实现高品质音频自由 【免费下载链接】BilibiliDown (GUI-多平台支持) B站 哔哩哔哩 视频下载器。支持稍后再看、收藏夹、UP主视频批量下载|Bilibili Video Downloader 😳 项目地址: https://gitcode.com/g…...

八大网盘直链下载终极指南:如何一键获取真实下载链接

八大网盘直链下载终极指南:如何一键获取真实下载链接 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云…...

大模型应用开发:小白也能入门的收藏必备指南!

文章详细解析了大模型应用开发的概念及其与传统开发、算法岗的关系,强调三者是并列而非替代关系。文章指出,大模型应用开发主要分为算法工程师(改模型)和LLM应用工程师(用模型),并强调传统开发岗…...

CentOS7上Oracle 19c RPM安装保姆级避坑指南(从防火墙到环境变量)

CentOS7上Oracle 19c RPM安装全流程避坑实战手册 引言:为什么你的Oracle安装总是失败? 在CentOS7上部署Oracle 19c看似简单,但实际操作中90%的运维人员都会遇到各种"坑"。这些隐藏问题往往不会在官方文档中明确提示,却能…...

炉石传说macOS玩家的智能数据助手:HSTracker从入门到精通指南

炉石传说macOS玩家的智能数据助手:HSTracker从入门到精通指南 【免费下载链接】HSTracker A deck tracker and deck manager for Hearthstone on macOS 项目地址: https://gitcode.com/gh_mirrors/hs/HSTracker 想要在炉石传说对局中拥有透视对手牌库的能力吗…...

别再手动拼接数据了!用Kettle Spoon的JavaScript步骤5分钟搞定字段合并

5分钟掌握Kettle Spoon字段合并:JavaScript步骤实战指南 每天面对成百上千条需要拼接的字段数据,你是否还在用Excel公式或手写Python脚本?作为ETL工程师最基础却最高频的操作之一,字段合并的效率直接影响着数据预处理的速度。今天…...

skene-cookbook:基于配方模式的DevOps与IaC标准化实践库

1. 项目概述与核心价值 最近在整理自己的技术栈时,发现一个挺有意思的项目,叫 skene-cookbook 。乍一看这个名字,可能有点摸不着头脑,它既不是某个知名框架,也不是一个具体的工具库。但如果你和我一样,经…...

VRCT完全指南:3步实现VRChat跨语言实时交流革命

VRCT完全指南:3步实现VRChat跨语言实时交流革命 【免费下载链接】VRCT VRCT(VRChat Chatbox Translator & Transcription) 项目地址: https://gitcode.com/gh_mirrors/vr/VRCT 你是否曾在VRChat中遇到这样的困境?面对来自世界各地的玩家&…...

DS4Windows游戏手柄驱动冲突终极解决方案:3步高效修复指南

DS4Windows游戏手柄驱动冲突终极解决方案:3步高效修复指南 【免费下载链接】DS4Windows Like those other ds4tools, but sexier 项目地址: https://gitcode.com/gh_mirrors/ds/DS4Windows DS4Windows是一款强大的开源工具,可将PS4 DualShock 4、…...

多模态大模型算法日常实习总结

普通mllm research日常实习个人总结 主包目前研一,从2.26开始约面30,工作日平均每天4场面试。目前是2个面试挂了,其他基本过,还有几个在流程中,结果没出。涵盖七八个中大厂,几个独角兽,和若干小…...

STL-Volume-Model-Calculator:3D打印模型体积计算的智能助手

STL-Volume-Model-Calculator:3D打印模型体积计算的智能助手 【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否在3D打印前为材料用量估算…...

深入拆解EPSON RX8111CE:从电源管理到抗干扰设计,硬件工程师必须注意的5个细节

深入拆解EPSON RX8111CE:从电源管理到抗干扰设计,硬件工程师必须注意的5个细节 在物联网终端和智能仪表等对功耗与可靠性要求极高的产品设计中,实时时钟(RTC)芯片的选型与电路设计往往成为决定产品长期稳定性的关键因素…...

通过Taotoken CLI工具一键配置团队开发环境中的模型密钥

通过Taotoken CLI工具一键配置团队开发环境中的模型密钥 1. 安装Taotoken CLI工具 Taotoken CLI提供两种安装方式,适合不同使用场景。对于需要频繁使用CLI的团队技术负责人,推荐全局安装: npm install -g taotoken/taotoken对于临时性配置…...

OBS实时字幕插件终极指南:3步打造无障碍直播体验

OBS实时字幕插件终极指南:3步打造无障碍直播体验 【免费下载链接】OBS-captions-plugin Closed Captioning OBS plugin using Google Speech Recognition 项目地址: https://gitcode.com/gh_mirrors/ob/OBS-captions-plugin 您是否曾想过,让直播间…...