当前位置：首页 > news >正文

基于医疗领域数据微调LLaMA——ChatDoctor模型

news 2026/2/9 21:38:04

文章目录

ChatDoctor简介
微调实战
- 下载仓库并进入目录
- 创建conda环境并配置环境（安装相关依赖）
- 下载模型文件
- 微调数据
- 微调过程
- - 全量微调
  - 基于LoRA的微调
  - 基于微调后的模型推理

ChatDoctor简介

CHatDoctor论文：
ChatDoctor: A Medical Chat Model Fine-tuned on LLaMA Model using Medical Domain Knowledge
项目地址：https://github.com/Kent0n-Li/ChatDoctor

ChatDoctor是一款使用LLaMA模型并结合医学知识进行训练的医疗助手，研究人员先收集了50多万条真实医患对话，然后使用这些数据对LLaMA模型进行微调。

ChatDoctor不仅具备流畅的对话能力,在医疗领域的理解和诊断也达到了很高的水平。

用户只需描述症状，ChatDoctor就会像真人医生一样询问其他症状与体征，然后给出初步诊断和治疗建议，而且完全开源免费！

当然，ChatDoctor只是一个AI助手，不能完全替代人医生，但在常见病症诊断方面，它已经表现已经非常不错了。
在这里插入图片描述

微调实战

下载仓库并进入目录

git clone https://github.com/Kent0n-Li/ChatDoctor.git
cd ChatDoctor

创建conda环境并配置环境（安装相关依赖）

conda create -n chatdoctor python=3.10
pip install -r requirements.txt 
pip install datasets

因为我们要基于lora进行微调，故需要安装peft框架，安装方式参考：
https://github.com/AGI-Edgerunners/LLM-Adapters/tree/main
将该仓库中的peft目录复制到本仓库中，然后通过下面命令进行安装。

cd peft/
pip install -e .

下载模型文件

推荐使用git命令下载模型文件，但注意需要提前下载git-lfs工具包，安装步骤如下：

# 先安装git（如已安装可忽略）
sudo apt-get install git
# 安装apt-get源
curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash
# 安装git-lfs
sudo apt-get install git-lfs
# 初始化git-lfs
git lfs install

模型文件下载地址：https://huggingface.co/decapoda-research/llama-7b-hf

下载命令：

git clone https://huggingface.co/decapoda-research/llama-7b-hf

微调数据

ChatDoctor数据集
来自HealthCareMagic.com的10万例实际患者与医生之间的对话HealthCareMagic-100k

来自icliniq.com的1万例实际患者与医生之间的对话icliniq-10k。

5k例由ChatGPT生成的患者与医生之间的对话GenMedGPT-5k和疾病数据库

微调过程

项目中提供了两种微调方式：一种是全量微调，一种是基于lora的微调

全量微调

如果是多卡进行微调可以直接使用项目中提供的命令

torchrun --nproc_per_node=4 --master_port=<your_random_port> train.py \--model_name_or_path <your_path_to_hf_converted_llama_ckpt_and_tokenizer> \--data_path ./HealthCareMagic-100k.json \--bf16 True \--output_dir pretrained \--num_train_epochs 1 \--per_device_train_batch_size 4 \--per_device_eval_batch_size 4 \--gradient_accumulation_steps 8 \--evaluation_strategy "no" \--save_strategy "steps" \--save_steps 2000 \--save_total_limit 1 \--learning_rate 2e-6 \--weight_decay 0. \--warmup_ratio 0.03 \--lr_scheduler_type "cosine" \--logging_steps 1 \--fsdp "full_shard auto_wrap" \--fsdp_transformer_layer_cls_to_wrap 'LLaMADecoderLayer' \--tf32 True

基于LoRA的微调

python train_lora.py \--base_model '/data/sim_chatgpt/llama-7b-hf/models--decapoda-research--llama-7b-hf/snapshots/5f98eefcc80e437ef68d457ad7bf167c2c6a1348/' \--data_path 'chatdoctor5k.json' \--output_dir './lora_models/' \--batch_size 1 \--micro_batch_size 1 \--num_epochs 1 \--learning_rate 3e-5 \--cutoff_len 256 \--val_set_size 120 \--adapter_name lora

在这里插入图片描述
显存占用情况：约占用11G。

基于微调后的模型推理

使用全量微调好的模型进行推理：mncai/chatdoctor
transformers-cli download mncai/chatdoctor --cache-dir ./chatdoctor

修改chat.py

load_model("/data/chatdoctor/models--mncai--chatdoctor/snapshots/8fdcfdda6877d7f21173dfac48b2c14499ba8264/")

执行 python chat.py即可
报错：

ImportError: LlamaConverter requires the protobuf library but it was
not found in your environment.

解决方法：

pip install protobuf==3.19.0

执行 python chat.py
在这里插入图片描述
显存占用，约为14G

基于医疗领域数据微调LLaMA——ChatDoctor模型

文章目录 ChatDoctor简介微调实战下载仓库并进入目录创建conda环境并配置环境（安装相关依赖）下载模型文件微调数据微调过程全量微调基于LoRA的微调基于微调后的模型推理 ChatDoctor简介 CHatDoctor论文： ChatDoctor: A Medical Chat Model F…...

编程日记 2023/8/23 8:18:39

UDP TCP 报文内容

1.UDP 2.TCP 源/目的端口号:表示数据是从哪个进程来,到哪个进程去; 32位序号/32位确认号:后面详细讲;4位TCP报头长度:表示该TCP头部有多少个32位bit(有多少个4字节);所以TCP头部最大长度是15*460 6位标志位: o URG:紧急指针是否有效 ——urgent 紧急的 o ACK:确认号是否有…...

编程日记 2023/8/23 8:17:38

Boost开发指南-4.8operators

operators C提供了强大且自由的操作符重载能力，可以把大多数操作符重新定义为函数，使操作更加简单直观。这方面很好的例子就是标准库中的string和 complex，可以像操作内置类型int、double那样对它们进行算术运算和比较运算，非常方…...

编程日记 2023/8/23 8:16:37

c# 泛型约束

在C#中，泛型约束用于指定泛型类型参数的限制条件，以确保类型参数满足特定的条件。以下是C#中常见的泛型约束： where T : struct： 这个约束要求类型参数必须是一个值类型（如int、float等）。 where T : cla…...

编程日记 2023/8/23 8:15:35

android frida

Frida 是一个用于动态分析、调试和修改 Android 应用程序的强大工具。它的主要作用包括： 代码注入和Hooking： Frida 允许您在运行时修改和监视应用程序的行为。您可以通过Frida注入JavaScript代码到目标应用程序中，然后使用该代码来Hook&…...

编程日记 2023/8/23 8:14:33

Linux下的Shell编程——正则表达式入门（四）

前言： 正则表达式使用单个字符串来描述、匹配一系列符合某个语法规则的字符串。在很多文本编辑器里，正则表达式通常被用来检索、替换那些符合某个模式的文本。在Linux 中，grep，sed，awk 等文本处理工具都支持…...

编程日记 2023/8/23 8:13:32

使用VisualStudio制作上位机（一）

文章目录使用VisualStudio制作上位机（一）写在前面第一部分：创建应用程序第二部分：GUI主界面设计使用VisualStudio制作上位机（一） Author:YAL 写在前面 1.达到什么目的呢本文主要讲怎么通过Visual Studio 制作上位机，全文会以制作过程来介绍怎么做，不会去讲解具体…...

编程日记 2023/8/23 8:12:29

【前端从0开始】JavaSript——自定义函数

函数函数是一个可重用的代码块，用来完成某个特定功能。每当需要反复执行一段代码时，可以利用函数来避免重复书写相同代码。函数包含着的代码只能在函数被调用时才会执行，就可以避免页面载入时执行该脚本在JavaScript中，可以使用…...

编程日记 2023/8/23 8:11:26

如何在Windows、Mac和Linux操作系统上安装Protocol Buffers（protobuf）编译器

🌷🍁 博主猫头虎带您 Go to New World.✨🍁 🦄 博客首页——猫头虎的博客🎐 🐳《面试题大全专栏》文章图文并茂🦕生动形象🦖简单易学！欢迎大家来踩踩~🌺 &a…...

编程日记 2023/8/23 8:10:25

简单介绍 CPU 的工作原理

内部架构 CPU 的根本任务就是执行指令，对计算机来说最终都是一串由 0 和 1 组成的序列。CPU 从逻辑上可以划分成 3 个模块，分别是控制单元、运算单元和存储单元。其内部架构如下： 【1】控制单元控制单元是整个CPU的指挥控制中心&#xff…...

编程日记 2023/8/23 8:09:24

UE4/5数字人MetaHuman的控制绑定资产使用

目录开始操作找到控制绑定资产放入控制绑定资产编辑生成动画资产开始操作首先我们创建一个关卡序列： 打开后将我们的数字人放进去【右键，第一个添加进去】： 我们会自动进入动画模式，没有的话，就自己…...

编程日记 2023/8/23 8:08:23

二、11.系统交互

fork 函数原型是 pid_t fork(void），返回值是数字，该数字有可能是子进程的 pid ，有可能是 0，也有可能是-1 。 1个函数有 3 种返回值，这是为什么呢？可能的原因是 Linux 中没有获取子进程 pid 的方…...

编程日记 2023/8/23 8:07:22

敏捷管理工具/国内软件敏捷开发工具

Scrum中非常强调公开、透明、直接有效的沟通，这也是“可视化的管理工具”在敏捷开发中如此重要的原因之一。通过“可视化的管理工具”让所有人直观的看到需求，故事，任务之间的流转状态，可以使团队成员更加快速适应敏捷开发流程。…...

编程日记 2023/8/23 8:06:21

Selenium环境+元素定位大法

selenium 与 webdriver Selenium 是一个用于 Web 测试的工具，测试运行在浏览器中，就像真正的用户在手工操作一样。支持所有主流浏览器 WebDriver 就是对浏览器提供的原生API进行封装，使其成为一套更加面向对象的Selenium WebDriver API。使…...

编程日记 2023/8/23 8:05:20

Vue3 用父子组件通信实现页面页签功能

一、大概流程二、用到的Vue3知识 1、组件通信 （1）父给子在vue3中父组件给子组件传值用到绑定和props 因为页签的数组要放在父页面中， data(){return {tabs: []}}, 所以顶部栏需要向父页面获取页签数组先在页签页面中定义props用来接…...

编程日记 2023/8/23 8:04:19

HCIP STP协议

STP协议 STP协议概念生成树为什么要用STP STP名词解释根网桥根端口指定端口非指定端口 STP的版本802.1DPVSTPVST 快速生成树 STP协议概念 IEEE 802.1d STP（生成树协议，Spanning-Tree Protocol）协议： ①使冗余端口置于“阻塞状态”…...

编程日记 2023/8/23 8:03:16

链表的顶级理解

目录 1.链表的概念及结构 2.链表的分类单向或者双向带头或者不带头循环或者非循环 3.无头单向非循环链表的实现 3.1创建单链表 3.2遍历链表 3.3得到单链表的长度 3.4查找是否包含关键字 3.5头插法 3.6尾插法 3.7任意位置插入 3.8删除第一次出现关键字为key的节点 …...

编程日记 2023/8/23 8:02:15

探索贪心算法：理解与实现JAVA语言

探索贪心算法：理解与实现贪心算法（Greedy Algorithm）是一种基于每一步的最优选择来达到整体最优的算法思想。尽管贪心算法并不适用于所有问题，但它在很多情况下都能够提供高效、近似的解决方案。本文将深入探讨贪心算法的基本概…...

编程日记 2023/8/23 8:01:14

数字孪生技术对旅游行业能起到什么作用？

随着疫情对我们生活影响的淡化，旅游行业迎来了新的春天，暑期更是旅游行业的小高潮，那么作为一个钻研数字孪生行业的小白，本文就着旅游的话题以及对旅游的渴望带大家一起探讨一下数字孪生对智慧旅游发展的作用~ 数字孪生作为一种虚…...

编程日记 2023/8/23 8:00:13

攻防世界-Web_php_include

原题解题思路 php://被替换了，但是只做了一次比对，改大小写就可以绕过。用burp抓包，看看有哪些文件 flag明显在第一个PHP文件里，直接看...

编程日记 2023/8/23 7:59:11

C++标志库中提供is_convertible，可以测试一种类型是否可以转换为另一只类型： template <class From, class To> struct is_convertible; 使用举例： #include <iostream> #include <string>using namespace std;struct A { }; struct B : A { };int main…...

编程新知 2025/6/11 15:23:57

Python爬虫实战：研究feedparser库相关技术

1. 引言 1.1 研究背景与意义在当今信息爆炸的时代，互联网上存在着海量的信息资源。RSS（Really Simple Syndication）作为一种标准化的信息聚合技术，被广泛用于网站内容的发布和订阅。通过 RSS，用户可以方便地获取网站更新的内容，而无需频繁访问各个网站。然而，互联网…...

编程新知 2025/8/18 9:54:31

【CSS position 属性】static、relative、fixed、absolute 、sticky详细介绍，多层嵌套定位示例

文章目录 ★ position 的五种类型及基本用法 ★ 一、position 属性概述二、position 的五种类型详解（初学者版） 1. static（默认值） 2. relative（相对定位） 3. absolute（绝对定位） 4. fixed（固定定位） 5. sticky（粘性定位）三、定位元素的层级关系（z-i…...

编程新知 2026/2/9 1:38:05

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个生活电费的缴纳和查询小程序

一、项目初始化与配置 1. 创建项目 ohpm init harmony/utility-payment-app 2. 配置权限 // module.json5 {"requestPermissions": [{"name": "ohos.permission.INTERNET"},{"name": "ohos.permission.GET_NETWORK_INFO"…...

编程新知 2025/11/26 13:15:57

ArcGIS Pro制作水平横向图例+多级标注

今天介绍下载ArcGIS Pro中如何设置水平横向图例。之前我们介绍了ArcGIS的横向图例制作：ArcGIS横向、多列图例、顺序重排、符号居中、批量更改图例符号等等（ArcGIS出图图例8大技巧），那这次我们看看ArcGIS Pro如何更加快捷的操作。…...

编程新知 2026/2/4 17:18:03

是否存在路径（FIFOBB算法）

题目描述一个具有 n 个顶点e条边的无向图，该图顶点的编号依次为0到n-1且不存在顶点与自身相连的边。请使用FIFOBB算法编写程序，确定是否存在从顶点 source到顶点 destination的路径。输入第一行两个整数，分别表示n 和 e 的值（1…...

编程新知 2025/10/1 6:09:21

企业如何增强终端安全？

在数字化转型加速的今天，企业的业务运行越来越依赖于终端设备。从员工的笔记本电脑、智能手机，到工厂里的物联网设备、智能传感器，这些终端构成了企业与外部世界连接的 “神经末梢”。然而，随着远程办公的常态化和设备接入的爆炸式…...

编程新知 2026/1/29 9:14:58

Hive 存储格式深度解析：从 TextFile 到 ORC，如何选对数据存储方案？

在大数据处理领域，Hive 作为 Hadoop 生态中重要的数据仓库工具，其存储格式的选择直接影响数据存储成本、查询效率和计算资源消耗。面对 TextFile、SequenceFile、Parquet、RCFile、ORC 等多种存储格式，很多开发者常常陷入选择困境。本文将从底…...

编程新知 2025/12/6 10:54:35

Python ROS2【机器人中间件框架】简介

销量过万TEEIS德国护膝夏天用薄款优惠券冠生园百花蜂蜜428g 挤压瓶纯蜂蜜巨奇严选鞋子除臭剂360ml 多芬身体磨砂膏280g健70%-75%酒精消毒棉片湿巾1418cm 80片/袋3袋大包清洁食品用消毒优惠券AIMORNY52朵红玫瑰永生香皂花同城配送非鲜花七夕情人节生日礼物送女友热卖妙洁棉…...

编程新知 2026/1/29 9:12:46

基于Java Swing的电子通讯录设计与实现：附系统托盘功能代码详解

JAVASQL电子通讯录带系统托盘一、系统概述本电子通讯录系统采用Java Swing开发桌面应用，结合SQLite数据库实现联系人管理功能，并集成系统托盘功能提升用户体验。系统支持联系人的增删改查、分组管理、搜索过滤等功能，同时可以最小化到系统…...

编程新知 2025/10/4 20:58:43