当前位置: 首页 > news >正文

国产GPU中,VLLM0.5.0发布Qwen2.5-14B-Instruct-GPTQ-Int8模型,请求返回结果乱码

概述

国产GPU: 

         DCU Z100

推理框架:

          vllm0.5.0

docker容器化部署

运行如下代码:

  python -m vllm.entrypoints.openai.api_server --model /app/models/Qwen2.5-14B-Instruct-GPTQ-Int8 --served-model-name qwen-gptq --trust-remote-code --enforce-eager --max-model-len 256 --tensor-parallel-size 2 --dtype float16 --quantization gptq --port 8001 --host *.*.*.*

报:

解决方案

1.重新拉取docker容器

  docker pull image.sourcefind.cn:5000/dcu/admin/base/custom:vllm0.5.0-dtk24.04.1-ubuntu20.04-py310-zk-v1 

2.运行容器

docker run -it --name=dtk24041_qwen2_vllm -v /app/GLM-4-main:/work --privileged -v /app/models:/app/models -v /opt/hyhal:/opt/hyhal --device=/dev/kfd --device=/dev/dri --device=/dev/mkfd --security-opt seccomp=unconfined --ipc=host --network host --group-add video --ulimit memlock=-1:-1 --cap-add=SYS_PTRACE  023c9d2c0174  /bin/bash

3.进入容器 

docker exec -it dtk24041_qwen2_vllm  /bin/bash

4.运行

  python -m vllm.entrypoints.openai.api_server --model /app/models/Qwen2.5-14B-Instruct-GPTQ-Int8 --served-model-name qwen-gptq --trust-remote-code --enforce-eager --max-model-len 256 --tensor-parallel-size 2 --dtype float16 --quantization gptq --port 8001 --host *.*.*.*

5.调用

curl http://*.*.*.*:8001/v1/chat/completions -H "Content-Type: application/json" -d '{"model": "qwen-gptq","messages": [{"role": "system", "content": "你是一个乐于助人的助手。"},{"role": "user", "content": "讲个笑话"}],"stop": ["<|im_end|>", "<|endoftext|>"]}' 

相关文章:

国产GPU中,VLLM0.5.0发布Qwen2.5-14B-Instruct-GPTQ-Int8模型,请求返回结果乱码

概述 国产GPU: DCU Z100 推理框架&#xff1a; vllm0.5.0 docker容器化部署 运行如下代码&#xff1a; python -m vllm.entrypoints.openai.api_server --model /app/models/Qwen2.5-14B-Instruct-GPTQ-Int8 --served-model-name qwen-gptq --trust-remote-code --enforce…...

在 Vue 3 中实现点击按钮后禁止浏览器前进或后退

在 Vue 3 中实现点击按钮后禁止浏览器前进或后退&#xff0c;我们可以通过 ref 和 watch 来管理状态&#xff0c;同时使用 onBeforeUnmount 来清理事件监听。 使用 Vue 3 实现&#xff1a; <template><div><button click"disableNavigation">点击…...

Linux:软硬链接

目录 一、概念 软链接 硬链接 二、原理 硬链接 软链接 三、使用场景 硬链接 软链接 一、概念 软链接 在当前目录下&#xff0c;有一个普通文件a.txt。 ln -s a.txt a_soft.link结论&#xff1a; 软链接是一个文件。 观察inode_id&#xff0c;发现软链接有着独立…...

Delphi XE 安卓Web开发 错误:net::ERR_CLEARTEXT_NOT_PERMITTED

解决方法&#xff1a; 1、确保已经申明权限&#xff08;AndroidManifest.xml 文件&#xff09; 1 <uses-permission android:name"android.permission.INTERNET" /> 2、开启 usesCleartextTraffic 1 2 <application android:usesCleartextTraffic&qu…...

深入理解malloc与vector:内存管理的对比

引言‌ 在编程中&#xff0c;内存管理是一个至关重要的环节。无论是C语言中的malloc函数&#xff0c;还是C标准库中的vector容器&#xff0c;它们都在内存分配和释放上扮演着关键角色。然而&#xff0c;它们的设计理念和用法有着显著的不同。本文将深入探讨malloc和vector的区…...

多个输入框联合搜索

如果你有多个输入框&#xff0c;并希望进行联合精准搜索&#xff0c;可以通过组合多个输入框的值来过滤数据。在JavaScript中&#xff0c;常见的做法是先收集每个输入框的值&#xff0c;然后使用这些值过滤数据。 示例&#xff1a;多个输入框联合精准搜索 假设有多个输入框用…...

笔记03----NeurIPS2024 涨点!SSA:用于语义分割的语义和空间自适应像素级分类器(即插即用)

前言 文章标题&#xff1a;《SSA-Seg: Semantic and Spatial Adaptive Pixel-level Classiffer for Semantic Segmentation》 助力语义分割涨点!SSA:一种新颖的语义和空间自适应分类器&#xff0c;显著提高了基线模型的分割性能&#xff0c;比如SegNeXt、OCRNet和UperNet等模型…...

自定义比较函数 down 作为 sort 函数的参数实现数组元素从大到小排序

【自定义比较函数 down 作为 sort 函数的参数实现数组元素从大到小排序】 #include <bits/stdc.h> using namespace std;const int maxn1e35; int a[maxn];bool down(int u,int v) {return u>v; }int main() {int n;cin>>n;for(int i0; i<n; i) cin>>…...

在 Spring Boot 中使用 JPA(Java Persistence API)进行数据库操作

步骤 1: 添加依赖 在 pom.xml 文件中添加相关依赖&#xff1a; <dependencies><!-- Spring Boot Starter Web --><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId><…...

简单聊聊PLT和GOT

在 Linux 的动态链接中&#xff0c;PLT&#xff08;Procedure Linkage Table&#xff09; 和 GOT&#xff08;Global Offset Table&#xff09; 是动态链接机制中的两个关键组件&#xff0c;它们一起支持程序动态加载共享库以及在运行时解析符号地址。下面是它们的作用和原理&a…...

FaRM译文

No compromises: distributed transactions with consistency, availability, and performance Aleksandar Dragojevic, Dushyanth Narayanan, Edmund B. Nightingale, Matthew Renzelmann, Alex Shamis, Anirudh Badam, Miguel Castro Microsoft Research 目录 摘要 1. 引…...

用vue框架写一个时钟的页面

你可以使用Vue框架来创建一个简单的时钟页面。首先&#xff0c;你需要在HTML文件中引入Vue框架的CDN&#xff1a; <script src"https://cdn.jsdelivr.net/npm/vue"></script>然后&#xff0c;创建一个包含时钟功能的Vue实例&#xff1a; <div id&qu…...

HTML表单-第二部分

HTML表单 表单元素是允许用户在表单中输入内容&#xff0c;比如&#xff1a;文本域&#xff0c;下拉列表&#xff0c;单选框&#xff0c;复选框等等‘ 使用<from>标签创建 例如 <from> . input . </from> HTML表单-输入元素 <input>标签创建&#xff…...

PyQt5:一个逗号引发的闪退血案

【日常小计】 在开发PyQt5程序时&#xff0c;调用了一个写入excel表格的后端方法&#xff0c;但是每次打开页面点击对应的动作&#xff0c;窗口就会闪退&#xff0c;而且Python后台也没有提示出任何的异常堆栈&#xff0c;后来经过在后端一点一点的单点测试&#xff0c;终于发…...

AI智能体Prompt预设词指令大全+GPTs应用使用

AI智能体使用指南 直接复制在AI工具助手中使用&#xff08;提问前&#xff09; 可前往SparkAi系统用户官网进行直接使用 SparkAI系统介绍文档&#xff1a;Docs 常见AI智能体GPTs应用大全在线使用 自定义添加制作AI智能体进行使用&#xff1a; 文章润色器 你是一位具有敏锐洞察…...

SSM整合原理实战案例《任务列表案例》

一、前端程序搭建和运行: 1.整合案例介绍和接口分析: (1).案例功能预览: (2).接口分析: 学习计划分页查询 /* 需求说明查询全部数据页数据 请求urischedule/{pageSize}/{currentPage} 请求方式 get 响应的json{"code":200,"flag":true,"data&…...

在风能市场持续增长的情况下,全球【环氧活性稀释剂】的需求呈现明显上涨的趋势

摘要 据 HengCe 最新调研&#xff0c;2023年中国环氧活性稀释剂市场销售收入达到了 万元&#xff0c;预计2030年可以达到 万元&#xff0c;2024-2030期间年复合增长率(CAGR)为 %。本研究项目旨在梳理环氧活性稀释剂领域产品系列&#xff0c;洞悉行业特点、市场存量空间及增量空…...

CSS一些小点 —— 12.7

1. box-sizing: border-box box-sizing 属性&#xff0c;默认值为 content-box box-sizing: border-box 使padding和border的值不会再影响元素的宽高&#xff1b;padding和border的值算在指定宽高的内部&#xff08;但是外边距依然算做外部&#xff09; 2. overflow: hidden …...

[NeurlPS 2022] STaR 开源代码实现解读

STaR 方法代码开源&#xff0c;这里给出一个中文代码解读地址&#xff1a;repo入口点&#xff1a;iteration_train.py&#xff1b;关键代码&#xff1a;device_train.py, device_inference.py, and create_finetune_tfrecords.py&#xff1b;基于 JAX、RAY&#xff0c;在 Googl…...

Android笔记【15】跳转页面返回信息

一、问题 学习一段代码 val intent Intent(thisSecondActivity, MainActivity::class.java) intent.putExtra("extra_data", data) startActivity(intent) 二、内容 这段代码是在 Android 应用中启动一个新的活动&#xff08;Activity&#xff09;&#xff0c;具…...

MAX3421E USB主机控制器实战:为微控制器扩展USB外设连接能力

1. 项目概述&#xff1a;为你的微控制器打开USB主机世界的大门如果你玩过Arduino、ESP32或者树莓派Pico这类微控制器&#xff0c;肯定对它们的USB设备功能不陌生——插上电脑就能被识别成一个串口、一个键盘或者一个U盘。但你想过反过来吗&#xff1f;让你的微控制器项目变成“…...

专业解析开源AI浏览器助手:Page Assist的深度技术架构与实战应用

专业解析开源AI浏览器助手&#xff1a;Page Assist的深度技术架构与实战应用 【免费下载链接】page-assist Use your locally running AI models to assist you in your web browsing 项目地址: https://gitcode.com/GitHub_Trending/pa/page-assist Page Assist是一款革…...

解密工业通信调试:Wu.CommTool深度解析与实战指南

解密工业通信调试&#xff1a;Wu.CommTool深度解析与实战指南 【免费下载链接】Wu.CommTool 基于C#、WPF、Prism、MaterialDesign、HandyControl开发的通讯调试工具。支持Modbus Rtu调试、Mqtt调试、TCP调试、串口调试、UDP调试 项目地址: https://gitcode.com/gh_mirrors/wu…...

知识竞赛代表队分组方法详解

&#x1f3b2; 知识竞赛代表队分组方法详解公平 均衡 策略 让每一支队伍都在合适的起点&#x1f3af; 引言知识竞赛中&#xff0c;代表队的合理分组是赛事公平与精彩的基础。无论是学校比赛、企业活动还是大型公开赛&#xff0c;组织者都需要根据队伍数量和赛制选择合适的分…...

如何在macOS上运行Windows应用:Whisky完整使用指南

如何在macOS上运行Windows应用&#xff1a;Whisky完整使用指南 【免费下载链接】Whisky A modern Wine wrapper for macOS built with SwiftUI 项目地址: https://gitcode.com/gh_mirrors/wh/Whisky 想要在Mac上运行Windows专属软件和游戏&#xff1f;厌倦了虚拟机的高资…...

从指标到版图:基于Cadence与gmid方法的两级运放实战设计

1. 两级运放设计入门&#xff1a;从指标到晶体管的思维转换 第一次接触两级运放设计时&#xff0c;我盯着性能指标表发呆了半小时。AV≥10M、CL10pf、SR10V/us这些数字就像天书&#xff0c;直到导师扔给我一本《模拟集成电路设计艺术》和一份Cadence使用手册。现在回想起来&…...

保姆级教程:在Ubuntu 22.04上用ROS2 Humble和Gazebo搞定TurtleBot3仿真(从安装到建图导航)

保姆级教程&#xff1a;在Ubuntu 22.04上用ROS2 Humble和Gazebo搞定TurtleBot3仿真&#xff08;从安装到建图导航&#xff09; 机器人操作系统&#xff08;ROS&#xff09;正在重塑现代机器人开发流程。作为ROS2的最新长期支持版本&#xff0c;Humble Hawksbill为开发者带来了更…...

26-cv-2777、26-cv-2964、26-cv-3022、26-cv-3949、26-cv-4062、26-cv-5488 Winnie Rosaline Kan 版权画维权!

案号&#xff1a;26-cv-2777、26-cv-2964、26-cv-3022、26-cv-3949、26-cv-4062、26-cv-5488原告品牌&#xff1a;Winnie Rosaline Kan 版权画品牌方&#xff1a;Casetagram Limited起诉地&#xff1a;美国伊利诺伊州代理律所&#xff1a;Keith起诉时间&#xff1a;2026年03月1…...

蜡笔变蜡烛:DIY分层香薰蜡烛的材料原理与制作实践

1. 项目概述&#xff1a;当蜡笔遇见蜡烛&#xff0c;一次关于气味与色彩的记忆重塑不知道你有没有过这样的体验&#xff1a;打开一盒崭新的蜡笔&#xff0c;那股混合着油脂、黏土与淡淡皂感的独特气味扑面而来&#xff0c;瞬间就能将你拉回铺满画纸的童年午后。Crayola蜡笔的官…...

基于LoRA与SFT技术构建中文大语言模型:从词表扩展到指令微调实战

1. 项目概述&#xff1a;为什么我们需要中文专属的大语言模型底座&#xff1f; 如果你在过去一年里尝试过用开源的大语言模型&#xff08;LLM&#xff09;来处理中文任务&#xff0c;大概率会遇到过这样的尴尬&#xff1a;模型对英文指令理解得很好&#xff0c;但一换成中文&am…...