当前位置：首页 > news >正文

开发自己私有chatGPT（五）训练微调openai模型

news 2026/2/9 23:13:48

微调

了解如何为应用程序自定义模型。

介绍

通过微调，您可以通过提供以下内容从通过 API 提供的模型中获得更多收益：

比提示设计更高质量的结果
能够训练比提示所能容纳的更多示例
由于提示时间较短，可以节省token
更低的延迟请求

GPT-3 已经对来自开放互联网的大量文本进行了预训练。当给出一个只有几个例子的提示时，它通常可以直观地判断你正在尝试执行什么任务并生成一个合理的完成。这通常被称为“少镜头学习”。

微调通过训练比提示所能容纳的更多的示例来改进少数镜头学习，让您在大量任务上获得更好的结果。对模型进行微调后，无需再在提示中提供示例。这样可以节省成本并实现更低的延迟请求。

概括地说，微调涉及以下步骤：

准备和上传训练数据
训练新的微调模型
使用微调模型

请访问我们的定价页面，详细了解如何对微调的模型训练和使用计费。

哪些模型可以微调？

微调目前仅适用于以下基本型号：davinci curie babbage ada text-davinci-003。

安装

我们建议使用我们的 OpenAI 命令行界面 (CLI)。要安装它，请运行

pip install --upgrade openai

(以下说明适用于版本 0.9.4 及更高版本。此外，OpenAI CLI 需要 python 3。

通过在 shell 初始化脚本(例如 .bashrc、zshrc 等)中添加以下行或在微调命令之前的命令行中运行它来设置环境变量：OPENAI_API_KEY

准备训练数据

训练数据是你教 GPT-3去说。

您的数据必须是 JSONL 文档，其中每行都是对应于训练示例的一对提示完成。您可以使用我们的 CLI 数据准备工具轻松地将数据转换为此文件格式。

{"prompt": "<prompt text>", "completion": "<ideal generated text>"}
{"prompt": "<prompt text>", "completion": "<ideal generated text>"}
{"prompt": "<prompt text>", "completion": "<ideal generated text>"}
...

CLI 数据准备工具

我们开发了一个工具来验证、提供建议和重新格式化您的数据：

openai tools fine_tunes.prepare_data -f <LOCAL_FILE>

此工具接受不同的格式文件，唯一要求它们包含提示和完成列/键。您可以传递 CSV、TSV、XLSX、JSON 或 JSONL 文件，它会在指导您完成建议的更改过程后，将输出保存到 JSONL 文件中，以便进行微调。

创建微调模型

以下假设你已按照上述说明准备了训练数据。

使用 OpenAI CLI 启动微调作业：

openai api fine_tunes.create -t <TRAIN_FILE_ID_OR_PATH> -m <BASE_MODEL>

BASE_MODEL是基础模型的名称(ada, babbage, curie, davinci)。您可以使用后缀参数自定义你的微调模型的名称。

运行上述命令会执行以下几项操作：

使用文件 API 上传文件(或使用已上传的文件)
创建微调作业
流式传输事件，直到作业完成(这通常需要几分钟，但如果队列中有许多作业或数据集很大，则可能需要数小时)

每个微调作业都从基础模型开始，默认是curie。模型的选择会影响模型的性能和运行微调模型的成本。

开始微调作业后，可能需要一些时间才能完成。你的作业可能排在我们系统上的其他作业后面，训练我们的模型可能需要几分钟或几小时，具体取决于模型和数据集大小。如果事件流因任何原因中断，您可以通过运行以下命令来恢复它：

openai api fine_tunes.follow -i <YOUR_FINE_TUNE_JOB_ID>

作业完成后，它会显示微调模型的名称。

除了创建微调作业之外，您还可以列出现有作业、检索作业状态或取消作业。

# List all created fine-tunes
openai api fine_tunes.list# Retrieve the state of a fine-tune. The resulting object includes
# job status (which can be one of pending, running, succeeded, or failed)
# and other information
openai api fine_tunes.get -i <YOUR_FINE_TUNE_JOB_ID># Cancel a job
openai api fine_tunes.cancel -i <YOUR_FINE_TUNE_JOB_ID>

使用微调模型

OpenAI CLI：

openai api completions.create -m <FINE_TUNED_MODEL> -p <YOUR_PROMPT>

curl

curl https://api.openai.com/v1/completions \-H "Authorization: Bearer $OPENAI_API_KEY" \-H "Content-Type: application/json" \-d '{"prompt": YOUR_PROMPT, "model": FINE_TUNED_MODEL}'

Python:

import openai
openai.Completion.create(model=FINE_TUNED_MODEL,prompt=YOUR_PROMPT)

Node.js

const response = await openai.createCompletion({model: FINE_TUNED_MODELprompt: YOUR_PROMPT,
});

开发自己私有chatGPT（五）训练微调openai模型

微调

介绍

哪些模型可以微调？

安装

准备训练数据

CLI 数据准备工具

创建微调模型

使用微调模型

相关文章：

开发自己私有chatGPT（五）训练微调openai模型

【数据结构】二叉树-堆实现及其堆的应用(堆排序topK问题)

ubuntu Repo 安装

JAVA：选择排序算法及其编写

【Linux】——基础开发工具和vim编辑器的基本使用方法

R语言部分题解

水文监测场景的数据通信规约解析和落地实践

【数据结构】时间复杂度和空间复杂度

从发现SQL注入到ssh连接

SAP ABAP

C/C++每日一练(20230219)

【NestJS】模块

隐私计算头条周刊（2.13-2.19）

【STM32笔记】低功耗模式配置及避坑汇总

DFN: Dynamic Filter Networks-动态卷积网络

面试官：你是怎样理解Fiber的

【C++的OpenCV】第一课-opencv的介绍和安装（Linux环境下）

k8s安装tekton,编写task

K_A12_014 基于STM32等单片机驱动S12SD紫外线传感器模块串口与OLED0.96双显示

还真不错，今天 Chatgpt 教会我如何开发一款小工具开发(Python 代码实现)

[2025CVPR]DeepVideo-R1：基于难度感知回归GRPO的视频强化微调框架详解

在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能

基于ASP.NET+ SQL Server实现（Web）医院信息管理系统

零基础设计模式——行为型模式 - 责任链模式

零基础在实践中学习网络安全-皮卡丘靶场（第九期-Unsafe Fileupload模块）（yakit方式）

ip子接口配置及删除

Java线上CPU飙高问题排查全指南

推荐 github 项目:GeminiImageApp(图片生成方向，可以做一定的素材)

【SSH疑难排查】轻松解决新版OpenSSH连接旧服务器的“no matching...“系列算法协商失败问题

宇树科技，改名了！