当前位置：首页 > news >正文

Llama3.1的部署与使用

news 2025/7/8 15:32:36

✨ Blog’s 主页: 白乐天_ξ( ✿＞◡❛)
🌈 个人Motto：他强任他强，清风拂山冈！
💫 欢迎来到我的学习笔记！

什么是Llama3.1？

Llama3.1 是 Meta（原 Facebook）公司开发的一款超大型语言模型。它的发布时间是在2024 年 7 月 23 日，模型系列包括 Llama3.1 8b、Llama3.1 70b 和 Llama3.1 405b。

性能与特点	详情
1. 处理能力提升	长文本处理能力增强，所有三款模型都具备改进的 128k 上下文长度，相比之前版本增加了 12 万个标记（token），模型容量是上一版本的 16 倍。多语言能力进步，提升了在英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语等八种语言对话场景中的推理能力。
2. 语言理解与推理能力	更好地理解上下文，可从长篇文本中获取更多信息以做出更明智决策并生成更细致回应。强大的逻辑推理能力，能灵活把握语义关联，合理引申和过渡话题。
3. 运算及专业领域表现	在数学运算、工具使用等专业领域有不错表现，可精准进行复杂计算和操作。
4. 应用领域	内容生成，如故事、文章和诗歌等。聊天机器人与虚拟助手，增强对话能力。语言翻译，提供多语言即时高质量翻译。代码生成，协助开发人员。医疗与科研，辅助疾病预测和药物发现等。

下面我们开始学习部署 Llama3.1 的 8B 版本，该版本至少需要GPU显存16G。

本次部署的测试环境：

<font style="color:rgba(60, 60, 67, 0.78);">ubuntu 22.04 python 3.12 cuda 12.1 pytorch 2.4.0</font>

部署流程

创建实例

进入丹摩DAMODEL｜让AI开发更简单！算力租赁上丹摩！店家开始创建实例：

进入创建页面后，首先在实例配置中选择付费类型。一般短期需求可以选择按量付费或者包日，长期需求可以选择包月套餐；
其次选择GPU数量和需求的GPU型号，首次创建实例推荐选择：
1. 按量付费–GPU数量1–NVIDIA-GeForc-RTX-4090，该配置为60GB内存，24GB的显存（本次测试的LLaMA3.1 8B 版本至少需要GPU显存16G）
3. 4.
接下来配置数据硬盘的大小。每个实例默认附带了50GB的数据硬盘，首次创建可以就选择默认大小50GB。

注意： 如果您通过官方预制方式下载模型，建议扩容至60GB。

继续选择安装的镜像，选择PyTorch 2.4.0。

为保证安全登录，创建密钥对，输入自定义的名称，然后选择自动创建并将创建好的私钥保存的自己电脑中并将后缀改为.pem，以便后续本地连接使用。

创建好密钥对后，选择刚刚创建好的密钥对，并点击立即创建，等待一段时间后即可启动成功！

例如我创建的时“BaiLetian”。

点击立即创建：

登录实例

1. 等待实例创建成功，在 GPU云实例中查看实例信息：

JupyterLab 界面：

登录后一般会在 /root/workspace 目录下，服务器各个路径具体意义如下：
1. /：系统盘，替换镜像，重置系统时系统盘数据都会重置。
2. /root/workspace：数据盘，支持扩容，保存镜像时此处数据不会重置。
3. /root/shared-storage：共享文件存储，可跨实例存储。

SSH登录

SSH登录一般需要以下 4 个信息：

用户名：<font style="color:rgb(60, 60, 67);">root</font>；
远程主机域名或IP（这里使用host域名）：实例页面获取；
端口号：实例页面获取；
登录密码或密钥（这里使用密钥）：前面创建实例时保存到本地的密钥。

在实例页面获取主机host和端口号：

复制结果类似如下：

ssh -p 31729 root@gpu-s277r6fyqd.ssh.damodel.com
//gpu-s277r6fyqd.ssh.damodel.com 即主机host，31729 为端口号。

部署LLama3.1

1. 我们使用 `conda` 管理环境，DAMODEL示例已经默认安装了 `conda 24.5.0` ，直接创建环境即可：

conda create -n llama3 python=3.12

环境创建好后，使用如下命令切换到新创建的环境：

conda activate llama3

继续安装部署LLama3.1需要的依赖：

pip install langchain==0.1.15
pip install streamlit==1.36.0
pip install transformers==4.44.0
pip install accelerate==0.32.1

安装好后，下载 Llama-3.1-8B 模型，平台已预制Llama-3.1-8B-Instruct模型，执行以下命令即可内网高速下载：

wget http://file.s3/damodel-openfile/Llama3/Llama-3.1-8B-Instruct.tar

下载完成后解压缩/Llama-3.1-8B-Instruct.tar

tar -xf Llama-3.1-8B-Instruct.tar

Llama3.1的部署与使用

✨ Blog’s 主页: 白乐天_ξ( ✿＞◡❛) 🌈 个人Motto：他强任他强，清风拂山冈！ 💫 欢迎来到我的学习笔记！ 什么是Llama3.1？ Llama3.1 是 Meta（原 Facebook）公…...

编程日记 2024/9/23 13:41:12

Java/Spring项目的包开头为什么是com？

Java/Spring项目的包开头为什么是com？ 下面是一个使用Maven构建的项目初始结构 src/main/java/ --> Java 源代码com.example/ --->为什么这里是com开头resources/ --> 资源文件 (配置、静态文件等)test/java/ --> 测试代码resourc…...

编程日记 2024/9/23 13:40:11

深度学习自编码器 - 随机编码器和解码器篇

序言在深度学习领域，自编码器作为一种无监督学习技术，凭借其强大的特征表示能力，在数据压缩、去噪、异常检测及生成模型等多个方面展现出独特魅力。其中，随机编码器和解码器作为自编码器的一种创新形式，进一步拓宽了…...

编程日记 2024/9/23 13:38:10

Spring IoC DI

Spring 框架的核心是其控制反转（IoC，Inversion of Control）和依赖注入（DI，Dependency Injection）机制。这些概念是为了提高代码的模块化和灵活性，进而简化开发和测试过程。下面将详细介绍这两个…...

编程日记 2024/9/23 13:37:09

[数据集][目标检测]无人机飞鸟检测数据集VOC+YOLO格式6647张2类别

数据集格式：Pascal VOC格式YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)：6647 标注数量(xml文件个数)：6647 标注数量(txt文件个数)：6647 标注…...

编程日记 2024/9/23 13:34:06

Vue 中 watch 的使用方法及注意事项

前言 Vue 的 Watch 是一个非常有用的功能，它能够监听 Vue 实例数据的变化并执行相应的操作。本篇文章将详细介绍 Vue Watch 的使用方法和注意事项，让你能够充分利用 Watch 来解决 Vue 开发中的各种问题。 1. Watch 是什么？ 1.1 Watch 的作…...

编程日记 2024/9/23 13:33:06

情指行一体化平台建设方案和必要性-———未来之窗行业应用跨平台架构

一、平台建设必要性以下是情指行一体化平台搭建的一些必要性： 1. 提高响应速度 - 实现情报、指挥和行动的快速协同，大大缩短从信息获取到决策执行的时间，提高对紧急情况和突发事件的响应效率。 2. 优化资源配置 - 整合各类资源信…...

编程日记 2024/9/23 13:32:04

窗口框架frame(HTML前端)

一.窗口框架作用：将网页分割为多个HTML页面，即将窗口分为多个小窗口，每个小窗口可以显示不同的页面，但是在浏览器中是一个完整的页面基本语法 <frameset cols"" row""></frameset><frame…...

编程日记 2024/9/23 13:31:03

51单片机——数码管

一、数码管原理图我们发现，总共有8个数码管。它们的上面接8个LED，用来控制选择哪个数码管。例如要控制第三个数码管，就让LED6为0，其他为1，那LED又接到哪呢？ 二、LED 由图可以看出，这个一个1…...

编程日记 2024/9/23 13:29:01

`re.compile(r“(＜.*?＞)“)` 如何有效地从给定字符串中提取出所有符合 `＜...＞` 格式的引用

regexp re.compile(r"(<.*?>)") 这行代码是在Python中使用正则表达式的一个示例，具体含义如下： re.compile(): 这个函数来自Python的 re（正则表达式）模块，用于将一个正则表达式模式编译成一个正则表…...

编程日记 2024/9/23 13:26:58

算法打卡：第十一章图论part01

今日收获：图论理论基础，深搜理论基础，所有可达路径，广搜理论基础（理论来自代码随想录） 1. 图论理论基础 （1）邻接矩阵邻接矩阵存储图，x和y轴的坐标表示节点的个数优点…...

编程日记 2024/9/23 13:25:57

为C#的PetaPoco组件增加一个批量更新功能(临时表模式)

总有一些数据是需要批量更新的，并且更新的字段，每个数据都不一样。为了实现这样一个功能，写了这样一个方法： using System.Linq.Expressions; using System.Reflection; using System.Text; using NetRube.Data; using PetaPoc…...

编程日记 2024/9/23 13:21:52

Spring实战——入门讲解

博客主页: 南来_北往系列专栏：Spring Boot实战 Spring介绍 Spring实战的入门讲解主要涵盖了Spring框架的基本概念、核心功能以及应用场景。以下是关于Spring实战入门的具体介绍： Spring框架概述：Spring是一个轻量级的Java开发框架…...

编程日记 2024/9/23 13:20:51

MTK芯片机型的“工程固件” 红米note9 5G版资源预览写入以及改写参数相关步骤解析

小米机型：小米5 小米5x 米6 米6x 米8 米9 米10系列米11系列米12系列 mix mix2 mix2s mix3 max max2 max3 note3 8se 9se cc9系列米play 平板系列等分享红米机型：红米note4 红米note4x 红米note5 红米note6 红米note7 红米note8 红米note8pro 红米s2 红米note7pro 红米…...

编程日记 2024/9/23 13:19:49

[Golang] Context 文章目录 [Golang] Context什么是context创建context创建根context创建context context的作用并发控制context.WithCancelcontext.WithDeadlinecontext.WithTimeoutcontext.WithValue 什么是context Golang在1.7版本中引入了一个标准库的接口context&#xf…...

编程日记 2024/9/23 13:16:46

【JAVA集合总结-壹】

文章目录 synchronized 的实现原理以及锁优化？ThreadLocal原理，使用注意点，应用场景有哪些？synchronized和ReentrantLock的区别？说说CountDownLatch与CyclicBarrier 区别Fork/Join框架的理解为什么我们调用start()方法…...

编程日记 2024/9/23 13:15:45

Mysql梳理7——分页查询

目录 7、分页查询 7.1 背景 7.2 实现规则分页原理 7.3 使用 LIMIT 的好处 7、分页查询 7.1 背景背景1：查询返回的记录太多了，查看起来很不方便，怎么样能够实现分页查询呢？ 背景2：表里有 4 条数据&#xff0c…...

编程日记 2024/9/23 13:14:44

智能制造与工业互联网公益联播∣企企通副总经理杨华：AI的浪潮下，未来智慧供应链迭代方向

近两年在IT圈子里面，AI毫无疑问是最火的一个词语，最近的ChatGPT、文心一言、通义千问，从千亿参数到万亿参数，再往前就是Sora文生视频异军突起... 在人工智能的浪潮下，AI之于供应链的价值体现在哪些地方？其发…...

编程日记 2024/9/23 13:13:41

《深度学习》—— 卷积神经网络(CNN)的简单介绍和工作原理

文章目录一、卷积神经网络的简单介绍二、工作原理(还未写完)1.输入层2.卷积层3.池化层4.全连接层5.输出层一、卷积神经网络的简单介绍基本概念定义：卷积神经网络是一种深度学习模型，通常用于图像、视频、语音等信号数据的分类和识别任务。其核心思想…...

编程日记 2024/9/23 13:12:40

数据结构：线性表

1、线性表概述 1.1线性表的定义线性表（list）：零个或多个数据元素的有限序列。简单地来说，我们可以用下面这张图来描述一个线性表： 1.2 线性表的存储结构 1.2.1顺序存储结构——顺序表顺序表是将数据全部存储到…...

编程日记 2024/9/23 13:11:39

未来机器人的大脑：如何用神经网络模拟器实现更智能的决策？

编辑：陈萍萍的公主一点人工一点智能未来机器人的大脑：如何用神经网络模拟器实现更智能的决策？RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战，在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…...

编程新知 2025/7/7 13:25:45

基于ASP.NET+ SQL Server实现（Web）医院信息管理系统

医院信息管理系统 1. 课程设计内容在 visual studio 2017 平台上，开发一个“医院信息管理系统”Web 程序。 2. 课程设计目的综合运用 c#.net 知识，在 vs 2017 平台上，进行 ASP.NET 应用程序和简易网站的开发；初步熟悉开发一…...

编程新知 2025/7/8 7:05:43

质量体系的重要

质量体系是为确保产品、服务或过程质量满足规定要求，由相互关联的要素构成的有机整体。其核心内容可归纳为以下五个方面： 🏛️ 一、组织架构与职责质量体系明确组织内各部门、岗位的职责与权限，形成层级清晰的管理网络&#xf…...

编程新知 2025/7/7 12:15:03

【HTTP三个基础问题】

面试官您好！HTTP是超文本传输协议，是互联网上客户端和服务器之间传输超文本数据（比如文字、图片、音频、视频等）的核心协议，当前互联网应用最广泛的版本是HTTP1.1，它基于经典的C/S模型，也就是客…...

编程新知 2025/6/16 8:33:33

ArcGIS Pro制作水平横向图例+多级标注

今天介绍下载ArcGIS Pro中如何设置水平横向图例。之前我们介绍了ArcGIS的横向图例制作：ArcGIS横向、多列图例、顺序重排、符号居中、批量更改图例符号等等（ArcGIS出图图例8大技巧），那这次我们看看ArcGIS Pro如何更加快捷的操作。…...

编程新知 2025/7/5 18:11:47

.Net Framework 4/C# 关键字（非常用，持续更新...）

一、is 关键字 is 关键字用于检查对象是否于给定类型兼容，如果兼容将返回 true，如果不兼容则返回 false，在进行类型转换前，可以先使用 is 关键字判断对象是否与指定类型兼容，如果兼容才进行转换，这样的转换是安全的。例如有：首先创建一个字符串对象，然后将字符串对象隐…...

编程新知 2025/6/25 1:12:20

OPENCV形态学基础之二腐蚀

一.腐蚀的原理 (图1) 数学表达式：dst(x,y) erode(src(x,y)) min(x,y)src(xx,yy) 腐蚀也是图像形态学的基本功能之一，腐蚀跟膨胀属于反向操作，膨胀是把图像图像变大，而腐蚀就是把图像变小。腐蚀后的图像变小变暗淡。腐蚀…...

编程新知 2025/7/8 2:17:11

在鸿蒙HarmonyOS 5中使用DevEco Studio实现企业微信功能

1. 开发环境准备安装DevEco Studio 3.1： 从华为开发者官网下载最新版DevEco Studio安装HarmonyOS 5.0 SDK 项目配置： // module.json5 {"module": {"requestPermissions": [{"name": "ohos.permis…...

编程新知 2025/7/6 20:17:05

Spring AI Chat Memory 实战指南：Local 与 JDBC 存储集成

一个面向 Java 开发者的 Sring-Ai 示例工程项目，该项目是一个 Spring AI 快速入门的样例工程项目，旨在通过一些小的案例展示 Spring AI 框架的核心功能和使用方法。项目采用模块化设计，每个模块都专注于特定的功能领域，便于学习和…...

编程新知 2025/6/20 11:58:47

「全栈技术解析」推客小程序系统开发：从架构设计到裂变增长的完整解决方案

在移动互联网营销竞争白热化的当下，推客小程序系统凭借其裂变传播、精准营销等特性，成为企业抢占市场的利器。本文将深度解析推客小程序系统开发的核心技术与实现路径，助力开发者打造具有市场竞争力的营销工具。一、系统核心功能架构&…...

编程新知 2025/7/8 2:56:16