当前位置：首页 > news >正文

丹摩征文活动｜实现Llama3.1大模型的本地部署

news 2026/5/12 5:47:06

文章目录

1.前言
2.丹摩的配置
3.Llama3.1的本地配置
4. 最终界面

丹摩

1.前言

Llama3.1是Meta 公司发布的最新开源大型语言模型，相较于之前的版本，它在规模和功能上实现了显著提升，尤其是最大的 4050亿参数版本，成为开源社区中非常强大的竞争者，能够在许多场景下与封闭模型如 OpenAI 的 GPT-4 相媲美。以下是 Llama3.1的一些主要特性：

上下文窗口扩展
Llama3.1支持最长 128K tokens 的上下文窗口，这使得它能够处理更长的文本内容，特别适用于长文档总结和复杂对话场景。
多语言支持
Llama 3.1 支持包括英语、西班牙语、法语、德语、意大利语等八种语言的生成和理解功能，非常适合全球化应用。
增强的推理与工具使用能力
Meta 声称 Llama 3.1 在数学计算、逻辑推理和工具调用方面表现卓越，这使其在许多基准测试中表现出色。
高效部署与训练优化
通过量化技术（将计算从 BF16 缩减到 FP8），Llama 3.1 的推理和训练成本显著降低，适合单节点服务器的部署。此外，它支持监督微调和生成高质量的合成数据。
开源与社区支持
Llama 3.1 完全开源，开发者可以通过 Meta 平台和 Hugging Face 下载模型，并在本地或云端环境中运行，充分保障数据隐私与安全。同时，Meta 提供了完善的开发工具和生态系统支持，例如支持增强的检索生成（RAG）工作流。

2.丹摩的配置

下面我会从打开丹摩平台开始一步一步的教导大家配置。

首先我们打开丹摩平台，然后点击创建实例。
进入下一个页面后点击绿框中的配置。推荐选择按需支付模式。
根据图片选择配置
开始设置镜像，平台提供多种基础镜像，便于用户快速启动应用。这些镜像都预装了必要的环境和工具，用户可以根据需求轻松选择，推荐选择绿色框选内容。
创建密钥对，密钥对是为了确保安全登录，可以自定义名称，选择自动生成，并将生成的私钥下载到本地计算机。

密钥创建成功后，选择新生成的密钥对，点击立即创建，稍等片刻，系统便会成功启动。
使用密钥对登录

7.完成

平台提供了可以直接登录的JupyterLab在线入口，让你轻松访问和管理实例。
进入终端。

3.Llama3.1的本地配置

环境创建好后。使用以下指令创建新环境：

conda activate llama3

在这里插入图片描述
下面安装llama3.1的依赖：

pip install langchain==0.1.15
pip install streamlit==1.36.0
pip install transformers==4.44.0
pip install accelerate==0.32.1

在这里插入图片描述
安装好后，下载Llama3.1-88模型，由于平台已经预装了。可以直接使用以下指令高速在内网下载。

wget http://file.s3/damodel-openfile/Llama3/Llama-3.1-8B-Instruct.tar

完成后进行解压

tar -xf Llama-3.1-8B-Instruct.tar

Llama3的配置
创建一个名为llamaBot.py的文件，文件内容复杂以下内容：

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
import streamlit as st# 创建一个标题和一个副标题
st.title("💬 LLaMA3.1 Chatbot")
st.caption("🚀 A streamlit chatbot powered by Self-LLM")# 定义模型路径
mode_name_or_path = '/root/workspace/Llama-3.1-8B-Instruct'# 定义一个函数，用于获取模型和tokenizer
@st.cache_resource
def get_model():# 从预训练的模型中获取tokenizertokenizer = AutoTokenizer.from_pretrained(mode_name_or_path, trust_remote_code=True)tokenizer.pad_token = tokenizer.eos_token# 从预训练的模型中获取模型，并设置模型参数model = AutoModelForCausalLM.from_pretrained(mode_name_or_path, torch_dtype=torch.bfloat16).cuda()return tokenizer, model# 加载LLaMA3的model和tokenizer
tokenizer, model = get_model()# 如果session_state中没有"messages"，则创建一个包含默认消息的列表
if "messages" not in st.session_state:st.session_state["messages"] = []# 遍历session_state中的所有消息，并显示在聊天界面上
for msg in st.session_state.messages:st.chat_message(msg["role"]).write(msg["content"])# 如果用户在聊天输入框中输入了内容，则执行以下操作
if prompt := st.chat_input():# 在聊天界面上显示用户的输入st.chat_message("user").write(prompt)# 将用户输入添加到session_state中的messages列表中st.session_state.messages.append({"role": "user", "content": prompt})# 将对话输入模型，获得返回input_ids = tokenizer.apply_chat_template(st.session_state["messages"],tokenize=False,add_generation_prompt=True)model_inputs = tokenizer([input_ids], return_tensors="pt").to('cuda')generated_ids = model.generate(model_inputs.input_ids,max_new_tokens=512)generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)]response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]# 将模型的输出添加到session_state中的messages列表中st.session_state.messages.append({"role": "assistant", "content": response})# 在聊天界面上显示模型的输出st.chat_message("assistant").write(response)print(st.session_state)

在终端运行以下命令，启动streamlit服务，server.port可以更换端口

streamlit run llamaBot.py --server.address 0.0.0.0 --server.port 1024

服务地址务必指定为0.0.0.0,否则无法通过浏览器访问
最后我们需要把内网端口映射到公网

进入GPU云实例页面。点击操作-更多-访问控制
单击添加端口，添加streamlit服务对于端口
添加成功后，通过访问链接即可打开Llama3.1Chatbot交互界面。

4. 最终界面

在这里插入图片描述

丹摩征文活动｜实现Llama3.1大模型的本地部署

文章目录 1.前言2.丹摩的配置3.Llama3.1的本地配置4. 最终界面丹摩 1.前言 Llama3.1是Meta 公司发布的最新开源大型语言模型，相较于之前的版本，它在规模和功能上实现了显著提升，尤其是最大的 4050亿参数版本，成为开源社区中非常…...

编程日记 2024/11/26 20:21:58

Spring Boot 2 和 Spring Boot 3 中使用 Spring Security 的区别

文章目录 Spring Boot 2 和 Spring Boot 3 中使用 Spring Security 的区别1. Jakarta EE 迁移2. Spring Security 配置方式的变化3. PasswordEncoder 加密方式的变化4. permitAll() 和 authenticated() 的变化5. 更强的默认安全设置6. Java 17 支持与语法提升7. PreAuthorize、…...

编程日记 2024/11/26 20:19:56

【数据结构与算法】 LeetCode：回溯

文章目录回溯算法组合组合总和（Hot 100）组合总和 II电话号码的字母组合（Hot 100）括号生成（Hot 100）分割回文串（Hot 100）复原IP地址子集（Hot 100）全排列&…...

编程日记 2024/11/26 20:17:54

SpringBoot线程池的使用

SpringBoot线程池的使用在现代Web应用开发中，特别是在使用Spring Boot框架时，合理使用线程池可以显著提高应用的性能和响应速度。线程池不仅能够减少线程创建和销毁的开销，还能有效地控制并发任务的数量，避免因线程过多而导致的…...

编程日记 2024/11/26 20:15:53

Neural Magic 发布 LLM Compressor：提升大模型推理效率的新工具

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领…...

编程日记 2024/11/26 20:14:52

HttpServletRequest req和前端的关系，req.getParameter详细解释，req.getParameter和前端的关系

HttpServletRequest 对象在后端和前端之间起到了桥梁的作用，它包含了来自客户端的所有请求信息。通过 HttpServletRequest 对象，后端可以获取前端发送的请求参数、请求头、请求方法等信息，并根据这些信息进行相应的处理。以下是对 HttpServle…...

编程日记 2024/11/26 20:13:51

React-useEffect的使用

useEffect react提供的一个常用hook，用于在函数组件中执行副作用操作，比如数据获取、订阅或手动更改DOM。基本用法： 接受2个参数： 一个包含命令式代码的函数（副作用函数）。一个依赖项数组，用…...

编程日记 2024/11/26 20:12:50

MySQL数据库与Informix：能否创建同名表？

MySQL数据库与Informix：能否创建同名表？一、MySQL数据库中的同名表创建1. 使用CREATE TABLE ... SELECT语句2. 使用CREATE TABLE LIKE语句3. 复制表结构并选择性复制数据4. 使用同义词（Synonym）二、Informix数据库中的同名表创建1. 使用不同所有者2. 使用不同模式3. 复制表…...

编程日记 2024/11/26 20:10:49

爬虫实战：采集知乎XXX话题数据

目录反爬虫的本意和其带来的挑战目标实战开发准备代码开发发现问题1. 发现问题[01]2. 发现问题[02] 解决问题1. 解决问题[01]2. 解决问题[02] 最终结果结语反爬虫的本意和其带来的挑战在这个数字化时代社交媒体已经成为人们表达观点的重要渠道，对企业来说&…...

编程日记 2024/11/26 20:08:47

大数据新视界 -- Hive 数据桶原理：均匀分布数据的智慧（上）（9/ 30）

💖💖💖亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的…...

编程日记 2024/11/26 20:03:41

【小白学机器学习33】大数定律python的 pandas.Dataframe 和 pandas.Series基础内容

目录 0 总结 0.1pd.Dataframe有一个比较麻烦琐碎的地方，就是引号和括号 0.2 pd.Dataframe关于括号的原则 0.3 分清楚几个数据类型和对应的方法的范围 0.4 几个数据结构的构造关系 list → np.array(list) → pd.Series(np.array)/pd.Dataframe 1 python 里…...

编程日记 2024/11/26 19:57:35

【shodan】（五）网段利用

shodan基础（五） 声明：该笔记为up主泷羽的课程笔记，本节链接指路。警告：本教程仅作学习用途，若有用于非法行为的，概不负责。 nsa ip address range www.nsa.gov需科学上网搜索网段 shodan s…...

编程日记 2024/11/26 19:55:32

LeetCode739. 每日温度（2024冬季每日一题 15）

给定一个整数数组 temperatures ，表示每天的温度，返回一个数组 answer ，其中 answer[i] 是指对于第 i 天，下一个更高温度出现在几天后。如果气温在这之后都不会升高，请在该位置用 0 来代替。示例 1: 输入: temperatu…...

编程日记 2024/11/26 19:53:26

Node.js的http模块：创建HTTP服务器、客户端示例

新书速览|Vue.jsNode.js全栈开发实战-CSDN博客《Vue.jsNode.js全栈开发实战（第2版）（Web前端技术丛书）》(王金柱)【摘要书评试读】- 京东图书 (jd.com) 要使用http模块，只需要在文件中通过require(http)引入即可。…...

编程日记 2024/11/26 19:51:22

加菲工具 - 好用免费的在线工具集合

加菲工具 https://orcc.online AI 工具加菲工具集合了目前主流的，免费可用的ai工具文档处理加菲工具 pdf转word、office与pdf互转等等工具都有链接图片图标加菲工具统计了好用免费的在线工具编码解码加菲工具 base64编码解码、url编码解码、md5计算…...

编程日记 2024/11/26 19:49:19

.NET9 - 新功能体验（二）

书接上回，我们继续来聊聊.NET9和C#13带来的新变化。 01、新的泛型约束 allows ref struct 这是在 C# 13 中，引入的一项新的泛型约束功能，允许对泛型类型参数应用 ref struct 约束。可能这样说不够直观，简单来说就是Span、ReadO…...

编程日记 2024/11/26 19:45:13

map和redis关系

Map 和 Redis 都是用于存储和管理数据的工具，但它们在用途、实现和应用场景上有所不同。下面详细解释 Map 和 Redis 之间的关系和区别。 1. Map 数据结构定义 Map 是一种数据结构，用于存储键值对（key-value pairs）。每个键都是…...

编程日记 2024/11/26 19:43:09

《数据结构》学习系列——图（中）

系列文章目录目录图的遍历深度优先遍历递归算法堆栈算法广度优先搜索拓扑排序定义定理算法思想伪代码关键路径基本概念关键活动有关量数学公式伪代码时间复杂性图的遍历从给定连通图的某一顶点出发，沿着一些边访问遍图中所有的顶点，且使每个顶点…...

编程日记 2024/11/26 19:38:03

探索Python的HTTP之旅：揭秘Requests库的神秘面纱

文章目录 **探索Python的HTTP之旅：揭秘Requests库的神秘面纱**第一部分：背景介绍第二部分：Requests库是什么？第三部分：如何安装Requests库？第四部分：Requests库的五个简单函数使用方法第五部分&…...

编程日记 2024/11/26 19:36:59

Python 爬虫从入门到（不）入狱学习笔记

爬虫的流程：从入门到入狱 1 获取网页内容1.1 发送 HTTP 请求1.2 Python 的 Requests 库1.2 实战：豆瓣电影 scrape_douban.py 2 解析网页内容2.1 HTML 网页结构2.2 Python 的 Beautiful Soup 库 3 存储或分析数据（略） 一般爬虫的基…...

编程日记 2024/11/26 19:30:54

一键式自动化工具OneClickCopaw：从Shell脚本到CI/CD的部署实践

1. 项目概述与核心价值最近在折腾一些自动化脚本时，发现了一个挺有意思的项目，叫iwanglei1/OneClickCopaw。光看名字，你可能会有点懵，“Copaw”是什么？其实，这是一个典型的“一键式”自动化工具&#xff0c…...

编程新知 2026/5/12 4:49:39

AsyncRun.vim 项目根目录管理：智能识别和高效利用

AsyncRun.vim 项目根目录管理：智能识别和高效利用【免费下载链接】asyncrun.vim :rocket: Run Async Shell Commands in Vim 8.0 / NeoVim and Output to the Quickfix Window !! 项目地址: https://gitcode.com/gh_mirrors/as/asyncrun.vim AsyncRun.vim 是…...

编程新知 2026/5/12 4:43:23

不止于导航：用AI Habitat的语义分割数据，教你构建自己的室内物体识别与场景理解Pipeline

不止于导航：用AI Habitat的语义分割数据构建室内物体识别与场景理解Pipeline 在计算机视觉与机器人领域，室内场景理解一直是极具挑战性的研究方向。传统方法依赖于昂贵的传感器设备和人工标注数据，而仿真平台的出现为这一领域带来了革命性变…...

编程新知 2026/5/12 4:41:16

孤舟笔记 IO 与网络编程篇六什么是网络四元组？它是理解TCP连接的关键

文章目录一、先说结论：四元组核心事实二、四元组是什么？三、一个端口能建立多少连接？四、客户端的连接上限五、NAT 和四元组六、四元组在负载均衡中的应用网络四元组全景回答技巧与点评标准回答加分回答面试官点评个人网站面试官问"一个…...

编程新知 2026/5/12 4:23:00

3分钟快速上手：Android音频无线转发终极指南

3分钟快速上手：Android音频无线转发终极指南【免费下载链接】sndcpy Android audio forwarding PoC (scrcpy, but for audio) 项目地址: https://gitcode.com/gh_mirrors/sn/sndcpy 你是否曾经希望将手机上的音频内容同步到电脑上播放？无论是观看…...

编程新知 2026/5/12 3:36:39

Mixtral-8x7B模型在消费级GPU上推理：混合量化与动态专家卸载实战

1. 项目概述与核心思路拆解最近在折腾大语言模型本地部署的朋友，估计都对Mixtral-8x7B这个“庞然大物”又爱又恨。爱的是它作为开源MoE（专家混合）模型的标杆，性能强悍；恨的是它那惊人的参数量（约47B&#x…...

编程新知 2026/5/12 3:18:56

国际空间站工程知识共享：从太空协作到地面工程实践的启示

1. 国际空间站：一个工程师眼中的知识共享金矿作为一名在航天工程领域摸爬滚打了十几年的工程师，我常常被问到一个问题：耗资巨大的国际空间站（ISS），除了那些遥不可及的太空探索梦想，到底给我们这…...

编程新知 2026/5/12 3:01:25

基于微信小程序的民宿短租系统（30292）

有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码SQL脚本）配套文档（LWPPT开题报告/任务书）远程调试控屏包运行一键启动项目&…...

编程新知 2026/5/12 2:14:00

逻辑表达式与真值表转换

逻辑表达式与真值表转换真值表与逻辑表达式是数字电路设计的两种等价表示，掌握它们之间的转换是基本功。 🎯 本章学习要点理解真值表的结构和表示方法掌握从真值表写出逻辑表达式（最小项之和）掌握从逻辑表达式列出真值表了解最…...

编程新知 2026/5/12 1:58:54

文献阅读 260511-Wildfire damages and the cost-effective role of forest fuel treatments

Wildfire damages and the cost-effective role of forest fuel treatments 来自 <https://www.science.org/doi/10.1126/science.aea6463> ## Abstract: Gave the core question: Wildfires are among the most pressing environmental challenges of the 21st century,…...

编程新知 2026/5/12 1:33:50

文章目录

1.前言

2.丹摩的配置

3.Llama3.1的本地配置

4. 最终界面

相关文章：