当前位置：首页 > news >正文

大模型部署手记（12）LLaMa2+Chinese-LLaMA-Plus-2-7B+Windows+text-gen+中文对话

news 2026/5/17 6:24:35

1.简介：

组织机构：Meta（Facebook）

代码仓：https://github.com/facebookresearch/llama

模型：chinese-alpaca-2-7b-hf

下载：使用百度网盘下载

硬件环境：暗影精灵7Plus

Windows版本：Windows 11家庭中文版 Insider Preview 22H2

内存 32G

GPU显卡：Nvidia GTX 3080 Laptop （16G）

从 https://github.com/ymcui/Chinese-LLaMA-Alpaca-2

的README.md可以看出，中文LLaMA&Alpaca大模型支持不同的LLaMA生态：

这里面有

transformers
llama.cpp
text-generation-webui：
LangChain
privateGPT
vLLM

等多种。

在这里也介绍了不同环境上的部署方式：

2.代码和模型下载：

cd \

git clone https://github.com/oobabooga/text-generation-webui

在 https://blog.csdn.net/snmper/article/details/133744735大模型部署手记（11）LLaMa2+Chinese-LLaMA-Plus-2-7B+Windows+llama.cpp+中文对话https://blog.csdn.net/snmper/article/details/133744735下载的完整版权重目录 D:\llama.cpp\models2\chinese-alpaca-2-7b-hf 复制到 D:\text-generation-webui\models 目录下:

3.安装依赖

参考 https://github.com/ymcui/Chinese-LLaMA-Alpaca-2/wiki/text-generation-webui_zh

和 https://github.com/oobabooga/text-generation-webui#installation

创建conda环境

conda create -n textgen python=3.10.9

conda activate textgen

cd text-generation-webui

安装pytorch

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117

安装依赖：

pip install -r requirements.txt

4.部署验证

加载模型并启动：

python server.py --model chinese-alpaca-2-7b-hf --chat

打开地址：

可以参考下面的指引操作：

在打开的网页中，依次选择Chat setting->Instruction template，在Instruction template中下拉选择Llama-v2，并将Context输入框中的Answer the questions.提示语替换为You are a helpful assistant. 你是一个乐于助人的助手。，最后回到Text generation界面，在input输入框中输入你的指令，即可与chinese-alpaca-2对话了。

不过张小白点击Model，发现这个模型已经加载上去了！

回到Chat屏幕，可以跟AI对话：

这个部署起来还是非常快的。

大模型部署手记（12）LLaMa2+Chinese-LLaMA-Plus-2-7B+Windows+text-gen+中文对话

1.简介：

2.代码和模型下载：

3.安装依赖

4.部署验证

相关文章：

大模型部署手记（12）LLaMa2+Chinese-LLaMA-Plus-2-7B+Windows+text-gen+中文对话

C#导出本机Win32native dll

express-generator快速构建node后端项目

视频监控系统/视频汇聚平台EasyCVR如何反向代理进行后端保活？

金融信创黄金三年：小程序生态+跨端技术框架构建

这短短 6 行代码你能数出几个bug？

【毕设选题】深度学习机器视觉车位识别车道线检测 - python opencv

不同数据类型在单片机内存中占多少字节？

安卓LinearLayout让控件居中的办法

uniapp下拉刷新

【工作记录】css3 grid布局笔记

区块链技术-比特币数据结构

SpringBoot结合dev-tool 实现IDEA项目热部署

flink中使用外部定时器实现定时刷新

Spring Cloud Pipelines 入门实践

G1 GC详解及设置

GitHub详细教程

【小沐学Python】Python实现Web图表功能（Dash）

【RabbitMQ】docker rabbitmq集群 docker搭建rabbitmq集群

Linux 网络驱动实验

基于GitHub Actions的自动化代码质量守护：CodeBuddy实战指南

柔性3D打印与生物仿生设计：从TPU材料到空气喷涂的完整实践

知乎API完全指南：用Python轻松获取知乎数据的5个核心技巧

小米汽车Q3真车现身：科技巨头跨界造车的技术路径与市场挑战

Adafruit Bluefruit模块DFU模式恢复与固件更新全攻略

AI对话记忆管理实战：memory-organizer库解决长上下文难题

【独家首发】Midjourney针孔相机风格参数白皮书：基于1,842张生成图像的光学畸变量化分析（含f/1.4–f/16等效光圈映射表）

Visual Paradigm 17.0 新特性解析：团队协作与项目管理效率跃升

从六度空间到毫秒响应：HNSW图索引如何重塑向量检索

MATLAB bandpass函数实战：用音乐合成和滤波案例，5分钟搞懂信号处理核心参数