当前位置：首页 > news >正文

大模型_DISC-MedLLM基于Baichuan-13B-Base医疗健康对话

news 2026/5/14 2:28:52

文章目录

DISC-MedLLM
- 介绍
- 概述
- 数据集
- 部署
- 推理流程

DISC-MedLLM

介绍

DISC-MedLLM 是一个专门针对医疗健康对话式场景而设计的医疗领域大模型，由复旦大学数据智能与社会计算实验室 (Fudan-DISC) 开发并开源。

该项目包含下列开源资源:

DISC-Med-SFT 数据集 (不包括行为偏好训练数据)
DISC-MedLLM 的模型权重

概述

DISC-MedLLM 是一个专为医疗健康对话场景而打造的领域大模型，它可以满足您的各种医疗保健需求，包括疾病问诊和治疗方案咨询等，为您提供高质量的健康支持服务。

DISC-MedLLM 有效地对齐了医疗场景下的人类偏好，弥合了通用语言模型输出与真实世界医疗对话之间的差距，这一点在实验结果中有所体现。

得益于我们以目标为导向的策略，以及基于真实医患对话数据和知识图谱，引入LLM in the loop 和 Human in the loop的多元数据构造机制，DISC-MedLLM 有以下几个特点：

可靠丰富的专业知识，我们以医学知识图谱作为信息源，通过采样三元组，并使用通用大模型的语言能力进行对话样本的构造。
多轮对话的问询能力，我们以真实咨询对话纪录作为信息源，使用大模型进行对话重建，构建过程中要求模型完全对齐对话中的医学信息。
对齐人类偏好的回复，病人希望在咨询的过程中获得更丰富的支撑信息和背景知识，但人类医生的回答往往简练；我们通过人工筛选，构建符合人类偏好的高质量的小规模行为微调样本，对齐病人的需求。

数据集

为了训练 DISC-MedLLM ，我们构建了一个高质量的数据集，命名为 DISC-Med-SFT，其中包含了超过47万个衍生于现有的医疗数据集重新构建得到的样本。我们采用了目标导向的策略，通过对于精心选择的几个数据源进行重构来得到SFT数据集。这些数据的作用在于帮助模型学习医疗领域知识，将行为模式与人类偏好对齐，并对齐真实世界在线医疗对话的分布情况。

在这里插入图片描述

部署

当前版本的 DISC-MedLLM 是基于Baichuan-13B-Base训练得到的。可以直接从 Hugging Face 上下载我们的模型权重

推理流程

git clone https://github.com/FudanDISC/DISC-MedLLM.gitcd DISC-MedLLMsource activateconda activate DISC-MedLLM

vi tuili.py 编辑待执行程序

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers.generation.utils import GenerationConfig
tokenizer = AutoTokenizer.from_pretrained("/data/sim_chatgpt/DISC-MedLLM", use_fast=False, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("/data/sim_chatgpt/DISC-MedLLM", device_map="auto", torch_dtype=torch.float16, trust_remote_code=True)
model.generation_config = GenerationConfig.from_pretrained("/data/sim_chatgpt/DISC-MedLLM")
messages = []
messages.append({"role": "user", "content": "我感觉自己颈椎非常不舒服，每天睡醒都会头痛"})
response = model.chat(tokenizer, messages)
print(response)

python tuili.py 执行程序

在这里插入图片描述

学习的参考资料：
DISC-MedLLM项目地址
DISC-MedLLM—中文医疗健康助手

大模型_DISC-MedLLM基于Baichuan-13B-Base医疗健康对话

文章目录

DISC-MedLLM

介绍

概述

数据集

部署

推理流程

相关文章：

大模型_DISC-MedLLM基于Baichuan-13B-Base医疗健康对话

开源模型 Prometheus 2 能够评估其他语言模型，其效果几乎与 GPT-4 相当

【Java】HOT100 贪心算法

绝地求生：PUBG杜卡迪联名进入倒计时3天！

【论文阅读】Learning Texture Transformer Network for Image Super-Resolution

读字库写FM24C04

boost::asio::ip::tcp::socket set_option

华为鸿蒙HarmonyOS应用开发者高级认证答案

ElasticSearch 与 OpenSearch:拉开性能差距

Java构造器

TiDB系列之：使用TiUP部署TiDB集群最新版本，同时部署TiCDC的详细步骤

【经典算法】LeetCode 72. 编辑距离(Java/C/Python3/Go实现含注释说明,中等)

webstorm 常用插件

clang：在 Win10 上编译 MIDI 音乐程序（二）

【redis】Redis数据类型(三)List类型

Java面试题:多线程2

T型槽地轨承载力是如何连接整个制造过程的强力桥梁（北重公司设计）

【Numpy】一文向您详细介绍 np.linspace()

VMware虚拟网卡网络适配器出现黄色感叹号

论生命价值

航空航天装备制造行业「气动外形工程师→型号总师、技术副总、CTO」完整晋升路径

青海黑独山｜人间极致灰度，藏着西北水墨秘境

Windows安卓应用安装器：终极免费方案，3分钟搞定电脑运行安卓应用！

从零到一：翁恺C语言MOOC实战习题精解与编程思维构建

LDBlockShow终极指南：5步掌握高质量连锁不平衡热图绘制

先进制程EPE挑战：从系统误差到量测革命，如何驯服边缘位置误差

Elasticsearch管理利器：es-client全方位指南与实战技巧

Gemini插件无法访问本地PDF/网页源码？手把手教你绕过Chrome沙箱限制（含Manifest V3兼容性补丁代码）

Axure RP中文语言包技术深度解析：从键值对到国际化架构的工程实践

HiveWE：现代魔兽争霸III地图编辑器终极指南