当前位置：首页 > news >正文

【AI学习】LLaMA模型的微调成本有几何？

news 2026/2/9 9:56:23

在前面文章《LLaMA 系列模型的进化（二）》中提到了Stanford Alpaca模型。
Stanford Alpaca 基于LLaMA (7B) 进行微调，通过使用 Self-Instruct 方法借助大语言模型进行自动化的指令生成，Stanford Alpaca 生成了 52K 条指令遵循样例数据（Alpaca-52K）用于训练。
在这里插入图片描述
据说，这个训练成本不到600美元。那这个成本是如何计算的呢？
训练成本：在8个80GB A100 上训练了3个小时，不到100美元；
数据成本：生成数据使用OpenAl的API，500美元。这里就是通过使用 Self-Instruct 方法，使用了OpenAl的接口的调用成本。

在前面文章《英伟达ChipNeMo，一个领域大模型的训练案例》里，介绍了领域大模型的训练过程。如下图：
在这里插入图片描述
对应的训练时长为：

使用 128 个 A100 GPU 进行了训练。ChipNeMo 的领域适配预训练成本（包括基于领域数据的继续预训练和SFT），具体见下表，单位是A100 GPU hours
ChipNeMo 的领域适配预训练成本，对比从头开始预训练基础模型的总成本不到 1.5%。
在这里插入图片描述
以LLaMa 7B模型的训练来说，总训练时长=2710，按照前面“在8个80GB A100 上训练了3个小时，不到100美元”的成本折算，成本应该小于11300美金
13B模型，总训练时长=5100，成本应该小于21250美金
70B模型，总训练时长=21340，成本应该小于88920美金

至于数据，ChipNeMo 的领域适配预训练需要24B以上的数据，这个可能与相应的数据积累有很大关系，不好计算了。

【AI学习】LLaMA模型的微调成本有几何？

相关文章：

【AI学习】LLaMA模型的微调成本有几何？

【专题】2024全数驱动致胜未来-数字化敏捷银行白皮书报告合集PDF分享（附原数据表）

280Hz显示器哪家强

ROUTE_STATUS

v4l2(video4linux2) yuyv(yuv422)、MJPEG、H.264

.Net插件开发开源框架

基于Spark实现大数据量的Node2Vec

[VMware]VMware-Esxi 6.7 厚置备转为精简置备

vue面试题十八

windows C++-windows C++/CX简介(三)

《黑神话.悟空》：一场跨越神话与现实的深度探索

【Kotlin设计模式】建造者模式在Android中的应用

Kafka 性能为什么比 RocketMQ 好

el-image的配套使用（表格，表单）

MKS MWH-5匹配器Automatc matching impedance Network手侧

打卡50天------图论

实现 FastCGI

0x01 GlassFish 任意文件读取漏洞复现

RLOC_ORIGIN

【Python】成功解决 NameError: name ‘reload‘ is not defined

uniapp 对接腾讯云IM群组成员管理（增删改查）

内存分配函数malloc kmalloc vmalloc

css实现圆环展示百分比，根据值动态展示所占比例

React19源码系列之事件插件系统

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院查看报告小程序

浅谈不同二分算法的查找情况

tree 树组件大数据卡顿问题优化

是否存在路径（FIFOBB算法）

Java 二维码

C#学习第29天：表达式树（Expression Trees）