当前位置：首页 > news >正文

PaddleNLP使用Vicuna

news 2026/2/11 8:57:19

LLaMA 模型

LLaMa 是一个大型语言模型，由 Meta 开源。它的全称是 Large Language Model Meta AI，参数量从 70 亿到 650 亿不等。例如，130 亿参数的 LLaMA 模型在大多数基准上可以胜过参数量达 1750 亿的 GPT-3，而且可以在单块 V100 GPU 上运行。而最大的 650 亿参数的 LLaMA 模型可以媲美谷歌的 Chinchilla-70B 和 PaLM-540B。

Vicuna 模型

Vicuna 是一个由 UC 伯克利、CMU、斯坦福等机构的学者联手发布的最新开源大模型。基于 Meta 开源的 LLaMA 大模型，使用 ShareGPT 平台上的用户共享对话数据微调而来。包含 7B 和 13B 两个型号的开源预训练模型。

在这里插入图片描述

下载模型

# 下载 Vicuna 7B
# !git lfs clone http://git.aistudio.baidu.com/180581/vicuna-7b-v1.1.git# 下载 Vicuna 13B
!git lfs clone http://git.aistudio.baidu.com/180581/vicuna-13b-v1.1.git

开发环境

!pip install --pre --upgrade paddlenlp -f https://www.paddlepaddle.org.cn/whl/paddlenlp.html --user
!pip install paddlepaddle-gpu==0.0.0.post112 -f https://www.paddlepaddle.org.cn/whl/linux/gpu/develop.html --user

代码

import os
import glob
import paddlefrom tqdm import tqdm
from paddlenlp.transformers import LlamaForCausalLM, LlamaConfig, LlamaTokenizerpattern = 'paddle-model-?????-of-?????.pdparams'# Vicuna 7B
# ckpt_dir = 'vicuna-7b-v1.1'
# config_dict =  {
#     "hidden_size": 4096,
#     "initializer_range": 0.02,
#     "intermediate_size": 11008,
#     "max_position_embeddings": 2048,
#     "model_type": "llama",
#     "num_attention_heads": 32,
#     "num_hidden_layers": 32,
#     "rms_norm_eps": 1e-06,
#     "vocab_size": 32000,
#     "bos_token_id": 1,
#     "eos_token_id": 2,
#     "pad_token_id": 0,
#     "use_cache": True,
#     "use_recompute": False,
#     "use_flash_attention": False,
# }# Vicuna 13B
ckpt_dir = 'vicuna-13b-v1.1'
config_dict =  {"hidden_size": 5120,"initializer_range": 0.02,"intermediate_size": 13824,"max_position_embeddings": 2048,"model_type": "llama","num_attention_heads": 40,"num_hidden_layers": 40,"rms_norm_eps": 1e-06,"vocab_size": 32000,"bos_token_id": 1,"eos_token_id": 2,"pad_token_id": 0,"use_cache": True,"use_recompute": False,"use_flash_attention": False,
}paddle.set_default_dtype('float16')tokenizer = LlamaTokenizer.from_pretrained(ckpt_dir)config = LlamaConfig(**config_dict)model = LlamaForCausalLM(config)
model.eval()for name, layer in model.named_sublayers():if 'rotary_emb' in name:layer.inv_freq = layer.inv_freq.cast(paddle.float32)paddle.device.cuda.empty_cache()for file_path in tqdm(glob.glob(os.path.join(ckpt_dir, pattern))):params = paddle.load(file_path)assert model.set_dict(params)[1] == [], 'Load error.'del paramspaddle.device.cuda.empty_cache()input_text = input('USER: ')
prompt = f'''USER: {input_text}\n\nASSISTANT: '''
with paddle.no_grad():with paddle.amp.auto_cast(False, level='O2', dtype='float16'):while True:if input_text == 'exit':breakinputs = tokenizer(prompt, return_tensors="pd", return_attention_mask=True,return_position_ids=True)outputs = model.generate(input_ids=inputs.input_ids, attention_mask=inputs.attention_mask, position_ids=inputs.position_ids, max_length=2048-inputs.input_ids.shape[1], min_length=0, decode_strategy="sampling",temperature=0.8, top_k=40, top_p=0.95, repetition_penalty=1.1,bos_token_id=tokenizer.bos_token_id,eos_token_id=tokenizer.eos_token_id,pad_token_id=tokenizer.pad_token_id,use_cache=True, use_fast=True, use_fp16_decoding=True)response = tokenizer.decode(outputs[0][0], skip_special_tokens=True)print('ASSISTANT: ' + response)input_text = input('USER: ')prompt += f'''{response}\n\nUSER: {input_text}\n\nASSISTANT: '''del inputsdel outputsdel responsepaddle.device.cuda.empty_cache()

PaddleNLP使用Vicuna

LLaMA 模型 LLaMa 是一个大型语言模型，由 Meta 开源。它的全称是 Large Language Model Meta AI，参数量从 70 亿到 650 亿不等。例如，130 亿参数的 LLaMA 模型在大多数基准上可以胜过参数量达 1750 亿的 GPT-3，而且可以在单块 V1…...

编程日记 2023/9/4 16:51:46

jackson常用操作

#jackson常用操作 jackson序列化框架，一些常用的操作依赖 <dependency><groupId>com.fasterxml.jackson.core</groupId><artifactId>jackson-core</artifactId><version>2.15.2</version></de…...

编程日记 2023/9/4 16:50:45

ios ipa包上传需要什么工具

目录 ios ipa包上传需要什么工具前言一、IPA包的原理二、IPA包上传的步骤 1.注册开发者账号 2.apk软件制作工具创建应用程序 3.构建应用程序 4.生成证书和配置文件 5.打包IPA包 6.上传IPA包三、总结前言 iOS IPA包是iOS应用程序的安装包，可以通过iT…...

编程日记 2023/9/4 16:49:45

科目1基础知识快速入门精简

科目1-4 科目一，又称科目一理论考试、驾驶员理论考试。》学习道路交通安全法律、法规和相关知识学习考试内容包括驾车理论基础、道路安全法律法规、地方性法规等相关知识，再加地方性法规。考试形式为上机考试，100道题，90分及以…...

编程日记 2023/9/4 16:48:42

安卓逆向 - 某东app加密参数还原

本文仅供学习交流，只提供关键思路不会给出完整代码，严禁用于非法用途，拒绝转载，若有侵权请联系我删除！ 目标app：5Lqs5LicYXBwMTEuMy4y 目标接口：aHR0cHM6Ly9hcGkubS5qZC5jb20vY2xpZW50LmFjdGl…...

编程日记 2023/9/4 16:47:41

Visual Studio(2022)生成链接过程的.map映射文件以及.map映射文件的内容说明

微软的官方说明 /MAP（生成映射文件） | Microsoft Learn 设置步骤 1. 右键项目属性, 连接器 -> 常规 -> 启用增量链接，设置为否。如下图： 2. 连接器 -> 调试生成调试信息设置为生成调试信息 (/DEBUG) 生成程序数据库…...

编程日记 2023/9/4 16:46:39

time limit per test 1 second memory limit per test 256 megabytes input standard input output standard output Recently, Tema and Vika celebrated Family Day. Their friend Arina gave them a carpet, which can be represented as an n⋅m�⋅&…...

编程日记 2023/9/4 16:45:36

技术科普：汽车开放系统架构AUTOSAR

01.AUTOSAR简介汽车是现代人类实现“千里江陵一日还”的交通工具，而计算机则是使人脱离繁杂重复脑力劳动的生产技术，两者的结合催生了汽车电子产业的蓬勃发展。 21世纪初，随着汽车电子应用需求的不断增多与硬件资源不断丰富，软…...

编程日记 2023/9/4 16:44:34

说说HTTP 和 HTTPS 有什么区别？

分析&回答 http协议超文本传输协议，是互联网上应用最多的协议，基于TCP/IP通讯协议来传递信息，用于从WWW服务器传输超文本到本地浏览器的传输协议。 https协议我们可以将其看作是以安全为目标的http协议。在http协议的基础上增加了S…...

编程日记 2023/9/4 16:42:30

Pygame中Trivia游戏解析6-5

3.4 next_question()函数 next_question()函数的作用是显示下一个题目。当用户按下“确认”按键后，将会显示下一个题目，代码如下所示。 if self.scored or self.failed:self.scored Falseself.failed Falseself.correct 0self.colors [white,white…...

编程日记 2023/9/4 16:41:29

Java8新特性2——方法引用

Java8新特性2——方法引用注：以下内容基于Java 8，所有代码都已在Java 8环境下测试通过目录： Java8新特性1——函数式接口&lambda表达式方法引用Stream 1. 方法引用方法引用提供了一种替代 lambda 表达式的语法，允许以更…...

编程日记 2023/9/4 16:40:27

Mac“其他文件”存放着什么？“其他文件”的清理方法

很多Mac用户在清理磁盘空间时发现，内存占用比例比较大的除了有iCloud云盘、应用程序、影片、音频、照片等项目之外，还有一个“其他文件”的项目磁盘占用比也非常大，想要清理却无从下手。那么Mac“其他文件”里存放的是什么文件？我…...

编程日记 2023/9/4 16:39:24

46、TCP的“三次握手”

在上一节中，TCP首部常用的几个选项，有些选项的参数就是在通信双方在建立TCP连接的时候进行确定和协商的。所以在学习过TCP报文首部之后，下面我们开始学习TCP的连接建立。 TCP的一个特点是提供可靠的传输机制，还有一个特点就是TCP…...

编程日记 2023/9/4 16:38:23

libudev 和 libusb 常见API分析

libudev详解: libudev是Linux系统下的一个库，它提供针对内核提供的udev设备管理服务的函数库。udev是一种内核机制，用于在系统中传递解决方案的有关设备信息，以及在出现设备事件（如删除、插入设备）时触发相应的操作。 …...

编程日记 2023/9/4 16:37:23

[dasctf]misc04

与他不说一模一样吧也差不多第三届红明谷杯CTF-【MISC】-阿尼亚_keepb1ue的博客-CSDN客flag.zip需要解压密码，在图片中发现一串密文。一串乱码，尝试进行字符编码爆破。获取到密码：简单的编码。https://blog.csdn.net/qq_36618918/article/d…...

编程日记 2023/9/4 16:36:21

Scala的函数式编程与高阶函数,匿名函数，偏函数，函数的闭包、柯里化，抽象控制，懒加载等

Scala的函数式编程函数式编程解决问题时，将问题分解成一个一个的步骤，将每个步骤进行封装（函数），通过调用这些封装好的步骤，解决问题。例如：请求->用户名、密码->连接 JDBC->读取…...

编程日记 2023/9/4 16:35:19

Axure RP 8.1.0.3400(原型设计工具)

Axure RP 8是一款原型设计工具，它提供了丰富的功能和工具，帮助用户创建高质量的网页、移动应用和桌面软件原型。以下是Axure RP 8的一些特色介绍： 强大的交互设计：Axure RP 8支持创建复杂的动画和过渡效果，让你的原型更…...

编程日记 2023/9/4 16:34:18

企业微信、飞书、钉钉机器人消息发送工具类

1、实例化WebClient对象其实你也可以使用RestTemplate，我这里主要是用到了webflux框架，所以需要实例化客户端请求对象 Bean public WebClient webClient(){HttpClient httpClient getHttpClient();return WebClient.builder().clientConnector(new R…...

编程日记 2023/9/4 16:33:16

手撕视觉slam14讲 ch7 / pose_estimation_3d2d.cpp （1）

首先理清我们需要实现什么功能，怎么实现，提供一份整体逻辑：包括主函数和功能函数主函数逻辑： 1. 读图,两张rgb（cv::imread） 2. 找到两张rgb图中的特征点匹配对 2.1定义所需要的参数：keypoints…...

编程日记 2023/9/4 16:32:12

Mac安装Dart时，Homebrew报错 Error: Failure while executing

前言： 最近准备开发Flutter项目时，在安装环境时，安装Homebew时遇到了以下报错信息，在这里分享一下。报错信息： ~ % brew tap dart-lang/dart > Tapping dart-lang/dart Cloning into /opt/homebrew/Library/Tap…...

编程日记 2023/9/4 16:31:11

iPhone密码忘记了办？iPhoneUnlocker，iPhone解锁工具Aiseesoft iPhone Unlocker 高级注册版分享

平时用 iPhone 的时候，难免会碰到解锁的麻烦事。比如密码忘了、人脸识别 / 指纹识别突然不灵，或者买了二手 iPhone 却被原来的 iCloud 账号锁住，这时候就需要靠谱的解锁工具来帮忙了。Aiseesoft iPhone Unlocker 就是专门解决这些问题的软件&…...

编程新知 2026/1/29 10:22:28

【论文笔记】若干矿井粉尘检测算法概述

总的来说，传统机器学习、传统机器学习与深度学习的结合、LSTM等算法所需要的数据集来源于矿井传感器测量的粉尘浓度，通过建立回归模型来预测未来矿井的粉尘浓度。传统机器学习算法性能易受数据中极端值的影响。YOLO等计算机视觉算法所需要的数据集来源于…...

编程新知 2025/10/14 10:52:24

C++ 基础特性深度解析

目录引言一、命名空间（namespace） C 中的命名空间与 C 语言的对比二、缺省参数 C 中的缺省参数与 C 语言的对比三、引用（reference） C 中的引用与 C 语言的对比四、inline（内联函数…...

编程新知 2026/1/15 4:25:16

C++中string流知识详解和示例

一、概览与类体系 C 提供三种基于内存字符串的流，定义在 <sstream> 中： std::istringstream：输入流，从已有字符串中读取并解析。std::ostringstream：输出流，向内部缓冲区写入内容，最终取…...

编程新知 2025/11/30 11:30:47

sipsak：SIP瑞士军刀！全参数详细教程！Kali Linux教程！

简介 sipsak 是一个面向会话初始协议 (SIP) 应用程序开发人员和管理员的小型命令行工具。它可以用于对 SIP 应用程序和设备进行一些简单的测试。 sipsak 是一款 SIP 压力和诊断实用程序。它通过 sip-uri 向服务器发送 SIP 请求，并检查收到的响应。它以以下模式之一…...

编程新知 2026/1/29 8:51:33

Fabric V2.5 通用溯源系统——增加图片上传与下载功能

fabric-trace项目在发布一年后，部署量已突破1000次，为支持更多场景，现新增支持图片信息上链，本文对图片上传、下载功能代码进行梳理，包含智能合约、后端、前端部分。一、智能合约修改为了增加图片信息上链溯源，需要对底层数据结构进行修改，在此对智能合约中的农产品数…...

编程新知 2025/9/27 12:03:43

三分算法与DeepSeek辅助证明是单峰函数

前置单峰函数有唯一的最大值，最大值左侧的数值严格单调递增，最大值右侧的数值严格单调递减。单谷函数有唯一的最小值，最小值左侧的数值严格单调递减，最小值右侧的数值严格单调递增。三分的本质三分和二分一样都是通过不断缩…...

编程新知 2026/1/31 2:50:32

Ubuntu Cursor升级成v1.0

0. 当前版本低使用当前 Cursor v0.50时 GitHub Copilot Chat 打不开，快捷键也不好用，当看到 Cursor 升级后，还是蛮高兴的 1. 下载 Cursor 下载地址：https://www.cursor.com/cn/downloads 点击下载 Linux (x64) ，…...

编程新知 2026/2/4 16:04:11

Python实现简单音频数据压缩与解压算法

Python实现简单音频数据压缩与解压算法引言在音频数据处理中，压缩算法是降低存储成本和传输效率的关键技术。Python作为一门灵活且功能强大的编程语言，提供了丰富的库和工具来实现音频数据的压缩与解压。本文将通过一个简单的音频数据压缩与解压算法…...

编程新知 2025/9/18 22:43:13

LangChain 中的文档加载器（Loader）与文本切分器（Splitter）详解《二》

🧠 LangChain 中 TextSplitter 的使用详解：从基础到进阶（附代码） 一、前言在处理大规模文本数据时，特别是在构建知识库或进行大模型训练与推理时，文本切分（Text Splitting） 是一个…...

编程新知 2025/10/10 9:24:44

PaddleNLP使用Vicuna

LLaMA 模型

Vicuna 模型

下载模型

开发环境

代码

相关文章：

PaddleNLP使用Vicuna

jackson常用操作

ios ipa包上传需要什么工具

科目1基础知识快速入门精简

安卓逆向 - 某东app加密参数还原

Visual Studio(2022)生成链接过程的.map映射文件以及.map映射文件的内容说明

A. Gift Carpet

技术科普：汽车开放系统架构AUTOSAR

说说HTTP 和 HTTPS 有什么区别？

Pygame中Trivia游戏解析6-5

Java8新特性2——方法引用

Mac“其他文件”存放着什么？“其他文件”的清理方法

46、TCP的“三次握手”

libudev 和 libusb 常见API分析

[dasctf]misc04

Scala的函数式编程与高阶函数,匿名函数，偏函数，函数的闭包、柯里化，抽象控制，懒加载等

Axure RP 8.1.0.3400(原型设计工具)

企业微信、飞书、钉钉机器人消息发送工具类

手撕视觉slam14讲 ch7 / pose_estimation_3d2d.cpp （1）

Mac安装Dart时，Homebrew报错 Error: Failure while executing

iPhone密码忘记了办？iPhoneUnlocker，iPhone解锁工具Aiseesoft iPhone Unlocker 高级注册版分享

【论文笔记】若干矿井粉尘检测算法概述

C++ 基础特性深度解析

C++中string流知识详解和示例

sipsak：SIP瑞士军刀！全参数详细教程！Kali Linux教程！

Fabric V2.5 通用溯源系统——增加图片上传与下载功能

三分算法与DeepSeek辅助证明是单峰函数

Ubuntu Cursor升级成v1.0

Python实现简单音频数据压缩与解压算法

LangChain 中的文档加载器（Loader）与文本切分器（Splitter）详解《二》