当前位置：首页 > news >正文

精调llama模型

news 2026/2/10 11:42:50

github地址：https://github.com/facebookresearch/llama-recipes
github:https://github.com/facebookresearch/llama

import torch
from transformers import LlamaForCausalLM, LlamaTokenizer#model_id="./models_hf/7B"
# 可以从huggingface上面下载模型，hf就是huggingface模型，也可以通过transformer库的convert_llama_weights_to_hf方法来转换原始的llama模型
model_id="模型path/Llama-2-7b-chat-hf-local"tokenizer = LlamaTokenizer.from_pretrained(model_id)model =LlamaForCausalLM.from_pretrained(model_id, load_in_8bit=True, device_map='auto', torch_dtype=torch.float16)
from llama_recipes.utils.dataset_utils import get_preprocessed_dataset
from llama_recipes.configs.datasets import samsum_datasettrain_dataset = get_preprocessed_dataset(tokenizer, samsum_dataset, 'train')
eval_prompt = """
Summarize this dialog:
A: Hi Tom, are you busy tomorrow’s afternoon?
B: I’m pretty sure I am. What’s up?
A: Can you go with me to the animal shelter?.
B: What do you want to do?
A: I want to get a puppy for my son.
B: That will make him so happy.
A: Yeah, we’ve discussed it many times. I think he’s ready now.
B: That’s good. Raising a dog is a tough issue. Like having a baby ;-)
A: I'll get him one of those little dogs.
B: One that won't grow up too big;-)
A: And eat too much;-))
B: Do you know which one he would like?
A: Oh, yes, I took him there last Monday. He showed me one that he really liked.
B: I bet you had to drag him away.
A: He wanted to take it home right away ;-).
B: I wonder what he'll name it.
A: He said he’d name it after his dead hamster – Lemmy  - he's  a great Motorhead fan :-)))
---
Summary:
"""model_input = tokenizer(eval_prompt, return_tensors="pt").to("cuda")model.eval()
with torch.no_grad():print(tokenizer.decode(model.generate(**model_input, max_new_tokens=100)[0], skip_special_tokens=True))model.train()def create_peft_config(model):from peft import (get_peft_model,LoraConfig,TaskType,prepare_model_for_int8_training,)peft_config = LoraConfig(task_type=TaskType.CAUSAL_LM,inference_mode=False,r=8,lora_alpha=32,lora_dropout=0.05,target_modules = ["q_proj", "v_proj"])# prepare int-8 model for trainingmodel = prepare_model_for_int8_training(model)model = get_peft_model(model, peft_config)model.print_trainable_parameters()return model, peft_config# create peft config
model, lora_config = create_peft_config(model)from transformers import TrainerCallback
from contextlib import nullcontext
enable_profiler = False
output_dir = "tmp/llama-output"config = {'lora_config': lora_config,'learning_rate': 1e-4,'num_train_epochs': 1,'gradient_accumulation_steps': 2,'per_device_train_batch_size': 2,'gradient_checkpointing': False,
}# Set up profiler
if enable_profiler:wait, warmup, active, repeat = 1, 1, 2, 1total_steps = (wait + warmup + active) * (1 + repeat)schedule =  torch.profiler.schedule(wait=wait, warmup=warmup, active=active, repeat=repeat)profiler = torch.profiler.profile(schedule=schedule,on_trace_ready=torch.profiler.tensorboard_trace_handler(f"{output_dir}/logs/tensorboard"),record_shapes=True,profile_memory=True,with_stack=True)class ProfilerCallback(TrainerCallback):def __init__(self, profiler):self.profiler = profilerdef on_step_end(self, *args, **kwargs):self.profiler.step()profiler_callback = ProfilerCallback(profiler)
else:profiler = nullcontext()from transformers import default_data_collator, Trainer, TrainingArguments# Define training args
training_args = TrainingArguments(output_dir=output_dir,overwrite_output_dir=True,bf16=True,  # Use BF16 if available# logging strategieslogging_dir=f"{output_dir}/logs",logging_strategy="steps",logging_steps=10,save_strategy="no",optim="adamw_torch_fused",max_steps=total_steps if enable_profiler else -1,**{k:v for k,v in config.items() if k != 'lora_config'}
)with profiler:# Create Trainer instancetrainer = Trainer(model=model,args=training_args,train_dataset=train_dataset,data_collator=default_data_collator,callbacks=[profiler_callback] if enable_profiler else [],)# Start trainingtrainer.train()model.save_pretrained(output_dir)model.eval()
with torch.no_grad():print(tokenizer.decode(model.generate(**model_input, max_new_tokens=100)[0], skip_special_tokens=True))

精调llama模型

github地址：https://github.com/facebookresearch/llama-recipes github:https://github.com/facebookresearch/llama import torch from transformers import LlamaForCausalLM, LlamaTokenizer#model_id"./models_hf/7B" # 可以从huggingface上面下载模…...

编程日记 2023/12/5 16:30:41

【C语言】深入理解C语言中的数学运算和类型转换

文章目录引言取负运算的奥秘源码探索分析与解读浮点数运算的精细差异源码分析精度损失与隐式类型转换精度和除零运算探究float类型和double类型的精度各是多少（即十进制有效位的位数）？在你的机器上，“负数开方”是如何处理的&a…...

编程日记 2023/12/5 16:28:40

基于javaweb的宠物服务商城系统设计与开发

摘要最近几年以来，宠物在人们的日常生活中所占的地位越来越重要了，它们不仅仅是我们的朋友，也成为了我们家庭中的一份子。21世纪，信息技术飞速发展，计算机行业日新月异，极大地带动了信息的流动&#xff…...

编程日记 2023/12/5 16:27:39

LeetCode-470. 用 Rand7() 实现 Rand10()【数学拒绝采样概率与统计随机化】

LeetCode-470. 用 Rand7 实现 Rand10【数学拒绝采样概率与统计随机化】题目描述：解题思路一：首先说一个结论就是(rand_X() - 1) Y rand_Y() > [1,X*Y]，即可以等概率的生成[1, X * Y]范围的随机数，其实就像军训的时候报数…...

编程日记 2023/12/5 16:25:36

通达信指标公式19：龙虎榜股票池——主力控盘度的计算方法

0.小红牛本指标，选股的思路说明：控盘度，又称主力控盘，是指主力控制了某只股票的大部分流通股，从而控制了股票的价格。主力控盘的目的通常是为了获取更多的收益，通过控制股票价格来实现其策略。所以首要分析…...

编程日记 2023/12/5 16:24:35

手搓图片滑动验证码_JavaScript进阶

手搓图片滑动验证码背景代码效果图展示网站背景在做前端项目开发的时候，少不了登录注册部分，既然有登录注册就少不了机器人验证，验证的方法有很多种，比如短信验证码、邮箱验证码、图片滑动、图片验证码等。由于鄙人在开发中…...

编程日记 2023/12/5 16:21:31

Linux服务器超级实用的脚本

1.使用INOTIFY+RSYNC自动实时同步数据代码执行： bash inotify_rsyncs.sh ：cat inotify_rsyncs.sh 脚本内容如下： #!bing/bash # Author: reyn #检测/data路径下的文件变化，排除Temp目录 INOTIFY_CMD="inotifywait -mrq -e modify,create,move,delete /data/ --exc…...

编程日记 2023/12/5 16:20:30

IntelliJ IDEA安装使用教程#intellij idea

做为基础开发软件，idea、pycharm、phpstorm是高级企业级开发中常用的图形化工具。安装非常简单：去官网下载即可，有社区版本、有企业版本： IntelliJ IDEA – 领先的 Java 和 Kotlin IDE 因版权问题：这里不方面多讲。…...

编程日记 2023/12/5 16:16:26

【组合数学】容斥鸽巢原理

目录 1. 容斥原理容斥原理三种形式 2. 容斥原理应用有限重复数的多重集合的 r 组合数错排问题 3. 鸽巢原理4. Ramsey 定理 1. 容斥原理容斥原理提供了一种通过计算每个单独集合的大小，然后修正重复计数的方法，从而得到多个集合并集大小的计算方法。它通…...

编程日记 2023/12/5 16:14:24

视频后期特效处理软件 Motion 5 mac中文版

Motion mac是一款运动图形和视频合成软件，适用于Mac OS平台。 Motion mac软件特点 - 精美的效果：Motion提供了多种高质量的运动图形和视频效果，例如3D效果、烟雾效果、粒子效果等，方便用户制作出丰富多彩的视频和动画。 - 高效的工…...

编程日记 2023/12/5 16:10:21

【智能家居】一、工厂模式实现继电器灯控制

用户手册对应的I/O 工厂模式实现继电器灯控制代码段 controlDevice.h（设备设备）main.c（主函数）bathroomLight.c（浴室灯）bedroomLight.c（卧室灯）restaurantLight.c（餐厅…...

编程日记 2023/12/5 16:08:18

第三节：提供者、消费者、Eureka

一、提供者消费者（就是个说法、定义，以防别人叭叭时听不懂） 服务提供者：业务中被其他微服务调用的服务。（提供接口给其他服务调用）服务消费者：业务中调用其他微服务的服务。（调用…...

编程日记 2023/12/5 16:07:17

Leetcode刷题详解——等差数列划分

1. 题目链接：413. 等差数列划分 2. 题目描述： 如果一个数列至少有三个元素 ，并且任意两个相邻元素之差相同，则称该数列为等差数列。例如，[1,3,5,7,9]、[7,7,7,7] 和 [3,-1,-5,-9] 都是等差数列。给你一个整数数组 …...

编程日记 2023/12/5 16:06:16

导出主机上所有docker 镜像并导入到其它主机

保存镜像列表到文件 docker images --format “{{.Repository}}:{{.Tag}}” > image_list.txt 导出列表中所有镜像到tar文件 cat image_list.txt | xargs -L 1 docker save -o all_images.tar 导入tar包中所有镜像 docker load -i all_images.tar...

编程日记 2023/12/5 16:05:15

HTML5+CSS3+JS小实例：焦点图波浪切换动画特效

实例：焦点图波浪切换动画特效技术栈：HTML+CSS+JS 字体图标库：Font Awesome 效果：源码：【HTML】 <!DOCTYPE html> <html><head><meta http-equiv="content-type" content="text/html; charset=utf-8"><meta name=&…...

编程日记 2023/12/5 16:04:14

Mac电脑如何安装git

一、简介在Mac上安装Git之前，可以先使用git --version来查看一下是否安装了Git，因为Mac系统可能自带了Git，或者在你安装XCode（或者XCode的命令行工具）时，可能已经安装了 Git。如果Mac还没有安装Git的话&…...

编程日记 2023/12/5 16:01:11

macOS本地调试k8s源码

目录准备工作创建集群注意点1. kubeconfig未正常加载2. container runtime is not running3. The connection to the server 172.16.190.132:6443 was refused - did you specify the right host or port?4. 集群重置5.加入子节点代码调试准备工作 apple m1芯片安装vmwa…...

编程日记 2023/12/5 15:58:09

JS 实现一键复制文本内容

1、演示： 2、代码 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>一键复制</title&g…...

编程日记 2023/12/5 15:56:07

【Linux】echo命令使用

echo命令功能是在显示器上显示一段文字，一般起到一个提示的作用。此外，也可以直接在文件中写入要写的内容。也可以用于脚本编程时显示某一个变量的值，或者直接输出指定的字符串。著者由布莱恩福克斯和切特拉米撰写。语法 echo […...

编程日记 2023/12/5 15:55:06

Day03 嵌入式---中断

目录一、简单介绍二、总体框架三、NVIC 3.2 NVIC的寄存器 3.3 中断向量表 3.4 中断优先级 3.5 NVIC优先级分组 3.6 NVIC配置 3.6.1、设置中断分组 3.6.2、初始化四、EXTI 外部中断 4.1.EXTI的基本概念 4.2.EXTI的⼯作原理 4.3 EXTI配置五、SYSCFG 5.1 SYS…...

编程日记 2023/12/5 15:52:04

深入剖析AI大模型：大模型时代的 Prompt 工程全解析

今天聊的内容，我认为是AI开发里面非常重要的内容。它在AI开发里无处不在，当你对 AI 助手说 "用李白的风格写一首关于人工智能的诗"，或者让翻译模型 "将这段合同翻译成商务日语" 时，输入的这句话就是 Prompt。…...

编程新知 2026/2/8 20:42:53

从零实现富文本编辑器#5-编辑器选区模型的状态结构表达

先前我们总结了浏览器选区模型的交互策略，并且实现了基本的选区操作，还调研了自绘选区的实现。那么相对的，我们还需要设计编辑器的选区表达，也可以称为模型选区。编辑器中应用变更时的操作范围，就是以模型选区为基准来…...

编程新知 2026/1/16 16:34:26

云启出海，智联未来｜阿里云网络「企业出海」系列客户沙龙上海站圆满落地

借阿里云中企出海大会的东风，以**「云启出海，智联未来｜打造安全可靠的出海云网络引擎」为主题的阿里云企业出海客户沙龙云网络&安全专场于5.28日下午在上海顺利举办，现场吸引了来自携程、小红书、米哈游、哔哩哔哩、波克城市、…...

编程新知 2026/1/30 0:00:28

centos 7 部署awstats 网站访问检测

一、基础环境准备（两种安装方式都要做） bash # 安装必要依赖 yum install -y httpd perl mod_perl perl-Time-HiRes perl-DateTime systemctl enable httpd # 设置 Apache 开机自启 systemctl start httpd # 启动 Apache二、安装 AWStats&#xff0…...

编程新知 2026/1/23 8:33:56

vscode（仍待补充）

写于2025 6.9 主包将加入vscode这个更权威的圈子 vscode的基本使用侧边栏 vscode还能连接ssh？ debug时使用的launch文件 1.task.json {"tasks": [{"type": "cppbuild","label": "C/C: gcc.exe 生成活动文件"…...

编程新知 2026/1/24 13:04:10

使用van-uploader 的UI组件，结合vue2如何实现图片上传组件的封装

以下是基于 vant-ui（适配 Vue2 版本 ）实现截图中照片上传预览、删除功能，并封装成可复用组件的完整代码，包含样式和逻辑实现，可直接在 Vue2 项目中使用： 1. 封装的图片上传组件 ImageUploader.vue <te…...

编程新知 2026/1/31 2:37:22

Springcloud：Eureka 高可用集群搭建实战（服务注册与发现的底层原理与避坑指南）

引言：为什么 Eureka 依然是存量系统的核心？ 尽管 Nacos 等新注册中心崛起，但金融、电力等保守行业仍有大量系统运行在 Eureka 上。理解其高可用设计与自我保护机制，是保障分布式系统稳定的必修课。本文将手把手带你搭建生产级 Eur…...

编程新知 2026/1/31 7:23:48

【Zephyr 系列 10】实战项目：打造一个蓝牙传感器终端 + 网关系统（完整架构与全栈实现）

🧠关键词：Zephyr、BLE、终端、网关、广播、连接、传感器、数据采集、低功耗、系统集成 📌目标读者：希望基于 Zephyr 构建 BLE 系统架构、实现终端与网关协作、具备产品交付能力的开发者 📊篇幅字数：约 5200 字 ✨ 项目总览在物联网实际项目中，**“终端 + 网关”**是…...

编程新知 2026/1/31 6:12:22

实现弹窗随键盘上移居中

实现弹窗随键盘上移的核心思路在Android中，可以通过监听键盘的显示和隐藏事件，动态调整弹窗的位置。关键点在于获取键盘高度，并计算剩余屏幕空间以重新定位弹窗。 // 在Activity或Fragment中设置键盘监听 val rootView findViewById<V…...

编程新知 2025/10/6 18:46:56

React---day11

14.4 react-redux第三方库提供connect、thunk之类的函数以获取一个banner数据为例子 store： 我们在使用异步的时候理应是要使用中间件的，但是configureStore 已经自动集成了 redux-thunk，注意action里面要返回函数 import { configureS…...

编程新知 2026/1/19 2:13:24

相关文章：