当前位置: 首页 > article >正文

避坑指南:在Ubuntu 22.04上用ipex-llm跑通Qwen1.5-7B-Chat-Int4模型的完整流程(含seen_tokens报错修复)

避坑指南Ubuntu 22.04部署Qwen1.5-7B-Chat-Int4全流程实战最近在部署Qwen1.5-7B-Chat-Int4模型时发现不少同行都卡在了seen_tokens这个报错上。这其实是一个典型的版本兼容性问题但解决它需要从环境搭建开始就做好规划。本文将分享一套经过验证的完整部署方案从零开始带你避开所有可能的坑点。1. 基础环境准备在Ubuntu 22.04上部署大模型首先需要建立一个干净的Python环境。我强烈建议使用Miniconda来管理环境这能有效避免系统Python环境被污染。# 安装Miniconda wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh bash Miniconda3-latest-Linux-x86_64.sh创建专用环境时Python版本的选择很关键。经过测试Python 3.11与ipex-llm的兼容性最佳conda create -n ipex-llm python3.11 -y conda activate ipex-llm系统依赖也不容忽视特别是CUDA和Intel相关组件sudo apt update sudo apt install -y build-essential cmake git libopenblas-dev2. 关键依赖安装策略这里最容易出问题的就是库版本的选择。盲目使用最新版往往会带来兼容性问题特别是transformers和ipex-llm这对组合。推荐版本组合库名称推荐版本备注transformers4.37.04.40.0会导致seen_tokens报错ipex-llm1.4.0需与特定transformers版本配合torch2.1.0使用Intel优化版安装命令需要特别注意顺序pip install torch2.1.0 --extra-index-url https://download.pytorch.org/whl/cpu pip install transformers4.37.0 pip install ipex-llm[all]1.4.0如果已经安装了错误版本可以先彻底卸载pip uninstall transformers ipex-llm torch -y3. 模型下载与运行环境就绪后下载量化版模型并准备测试脚本。这里推荐直接从ModelScope获取# Qwen1.5-generate.py示例脚本核心部分 from transformers import AutoModelForCausalLM, AutoTokenizer model_path Qwen1.5-7B-Chat-Int4-ipex-llm tokenizer AutoTokenizer.from_pretrained(model_path) model AutoModelForCausalLM.from_pretrained(model_path, device_mapauto) inputs tokenizer(你好介绍一下你自己, return_tensorspt) outputs model.generate(**inputs, max_new_tokens128) print(tokenizer.decode(outputs[0]))运行脚本时建议添加以下参数python Qwen1.5-generate.py \ --repo-id-or-model-path Qwen1.5-7B-Chat-Int4-ipex-llm \ --n-predict 128 \ --device mps # 如果是Intel设备4. 典型问题排查当遇到AttributeError: property seen_tokens of DynamicCache object has no setter错误时按照以下步骤排查确认transformers版本pip show transformers | grep Version版本降级方案pip install transformers4.37.0 -i https://mirrors.aliyun.com/pypi/simple/清理缓存rm -rf ~/.cache/huggingface/这个问题的根源在于transformers 4.40.0对DynamicCache的实现做了修改而ipex-llm 1.4.0还未适配这个变更。除了降级外也可以等待ipex-llm的更新版本。5. 性能优化技巧成功运行后可以通过以下方式提升推理速度量化参数对比参数默认值推荐值效果use_cacheTrueTrue减少重复计算low_cpu_mem_usageFalseTrue降低内存占用torch_dtypefloat32bfloat16加速推理在代码中这样应用model AutoModelForCausalLM.from_pretrained( model_path, device_mapauto, low_cpu_mem_usageTrue, torch_dtypetorch.bfloat16 )对于Intel CPU还可以启用特殊优化import intel_extension_for_pytorch as ipex model ipex.optimize(model, dtypetorch.bfloat16)6. 长期维护建议要保持环境稳定建议使用requirements.txt固定版本transformers4.37.0 ipex-llm[all]1.4.0 torch2.1.0定期检查ipex-llm的更新日志关注兼容性说明考虑使用Docker容器化部署避免环境污染在实际项目中我通常会为每个大模型单独创建conda环境并记录详细的版本信息。这样即使几个月后需要重新部署也能快速复现当时的工作环境。

相关文章:

避坑指南:在Ubuntu 22.04上用ipex-llm跑通Qwen1.5-7B-Chat-Int4模型的完整流程(含seen_tokens报错修复)

避坑指南:Ubuntu 22.04部署Qwen1.5-7B-Chat-Int4全流程实战 最近在部署Qwen1.5-7B-Chat-Int4模型时,发现不少同行都卡在了seen_tokens这个报错上。这其实是一个典型的版本兼容性问题,但解决它需要从环境搭建开始就做好规划。本文将分享一套经…...

Proxmox边缘计算容器化部署终极指南:10个轻量级服务快速配置技巧

Proxmox边缘计算容器化部署终极指南:10个轻量级服务快速配置技巧 【免费下载链接】Proxmox Proxmox VE Helper-Scripts 项目地址: https://gitcode.com/gh_mirrors/pr/Proxmox 在边缘计算场景中,高效部署和管理轻量级服务是提升系统性能的关键。P…...

终极Windows风扇控制指南:如何用FanControl实现专业级散热管理

终极Windows风扇控制指南:如何用FanControl实现专业级散热管理 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Tre…...

终极性价比指南:TRL大语言模型训练的硬件配置全解析

终极性价比指南:TRL大语言模型训练的硬件配置全解析 【免费下载链接】trl Train transformer language models with reinforcement learning. 项目地址: https://gitcode.com/GitHub_Trending/tr/trl TRL(Train transformer language models with…...

数学符号代码化:程序员快速掌握数学符号的终极指南

数学符号代码化:程序员快速掌握数学符号的终极指南 【免费下载链接】math-as-code a cheat-sheet for mathematical notation in code form 项目地址: https://gitcode.com/gh_mirrors/ma/math-as-code 数学符号代码化(math-as-code)是…...

copaWeb:基于状态机的Web应用逻辑漏洞自动化测试框架

1. 项目概述:一个被低估的Web应用安全测试利器如果你和我一样,长期混迹于Web安全、渗透测试或者应用开发领域,那么你一定对“自动化扫描工具”又爱又恨。爱的是它们能快速发现一些低垂的果实,恨的是它们往往误报率高、定制性差&am…...

终极FanControl教程:5分钟掌握Windows风扇控制神器

终极FanControl教程:5分钟掌握Windows风扇控制神器 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending/fa/Fa…...

从SMILES手性标记‘@@’与‘@’说起:深入理解RDKit的分子规范化与唯一性

从SMILES手性标记到分子唯一性:RDKit规范化机制深度解析 在药物研发和化学信息学领域,分子结构的精确表示是基础中的基础。当我们用SMILES字符串描述分子时,那些看似简单的""和""符号背后,隐藏着一套精妙的手…...

如何快速集成Mock Service Worker到Vue Material:构建高效API模拟的完整指南

如何快速集成Mock Service Worker到Vue Material:构建高效API模拟的完整指南 【免费下载链接】vue-material Vue.js Framework - ready-to-use Vue components with Material Design, free forever. 项目地址: https://gitcode.com/gh_mirrors/vu/vue-material …...

PaddleOCR-VL多模态文档解析技术解析与应用实践

1. 项目背景与核心价值在数字化转型浪潮中,文档解析技术正成为企业降本增效的关键工具。传统OCR(光学字符识别)系统在面对表格嵌套、多栏排版、图文混排等复杂文档时,识别准确率往往断崖式下跌。PaddleOCR-VL作为飞桨团队推出的多…...

SOGo ActiveSync配置指南:让移动设备随时随地同步工作数据

SOGo ActiveSync配置指南:让移动设备随时随地同步工作数据 【免费下载链接】sogo SOGo is a very fast and scalable modern collaboration suite (groupware). It offers calendaring, address book management, and a full-featured Webmail client along with re…...

手把手教你用ModelSim/QuestaSim仿真一个完整的FPGA数据链:从ADC采样、FIFO缓存到UART发送

FPGA数据链仿真实战:从ADC采样到UART发送的ModelSim验证指南 在FPGA开发中,构建一个可靠的数据采集与传输系统是许多项目的核心需求。想象一下这样的场景:您已经完成了ADC采样模块、FIFO缓存控制器和UART发送模块的独立验证,但当这…...

3分钟上手APK-Installer:Windows上最便捷的安卓应用安装方案

3分钟上手APK-Installer:Windows上最便捷的安卓应用安装方案 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 还在为Windows电脑无法直接运行Android应用而苦…...

Clipper2测试驱动开发:如何编写高质量的几何算法测试用例

Clipper2测试驱动开发:如何编写高质量的几何算法测试用例 【免费下载链接】Clipper2 Polygon Clipping, Offsetting & Triangulation in C, C# and Delphi 项目地址: https://gitcode.com/gh_mirrors/cl/Clipper2 Clipper2是一个强大的开源几何算法库&am…...

别再只盯着TTL了!用LVDS接口搞定高速PCB布线的实战避坑指南

别再只盯着TTL了!用LVDS接口搞定高速PCB布线的实战避坑指南 在嵌入式系统和高速数字电路设计中,信号完整性问题往往成为工程师的噩梦。当数据速率突破百兆大关时,传统TTL/CMOS接口的局限性开始暴露无遗——电磁干扰如影随形,电源噪…...

Agent Lightning终极指南:如何快速实现智能体训练的迁移学习

Agent Lightning终极指南:如何快速实现智能体训练的迁移学习 【免费下载链接】agent-lightning The absolute trainer to light up AI agents. 项目地址: https://gitcode.com/GitHub_Trending/ag/agent-lightning Agent Lightning是一款强大的AI智能体训练框…...

OBS-VST深度解析:专业音频处理在直播流中的架构设计与性能优化

OBS-VST深度解析:专业音频处理在直播流中的架构设计与性能优化 【免费下载链接】obs-vst Use VST plugins in OBS 项目地址: https://gitcode.com/gh_mirrors/ob/obs-vst 在直播音频处理领域,OBS-VST插件实现了将专业VST 2.x音频插件无缝集成到OB…...

FakeNet-NG多主机模式配置指南:搭建完整网络仿真环境

FakeNet-NG多主机模式配置指南:搭建完整网络仿真环境 【免费下载链接】flare-fakenet-ng FakeNet-NG - Next Generation Dynamic Network Analysis Tool 项目地址: https://gitcode.com/gh_mirrors/fla/flare-fakenet-ng FakeNet-NG是一款强大的下一代动态网…...

如何在多设备上获得统一的E-Hentai漫画阅读体验

如何在多设备上获得统一的E-Hentai漫画阅读体验 【免费下载链接】JHenTai A cross-platform manga app made for e-hentai & exhentai by Flutter 项目地址: https://gitcode.com/gh_mirrors/jh/JHenTai 你是否曾经在不同设备上使用E-Hentai时,因为界面不…...

captcha_break在Windows环境下的终极部署指南:10分钟完成验证码识别系统搭建

captcha_break在Windows环境下的终极部署指南:10分钟完成验证码识别系统搭建 【免费下载链接】captcha_break 验证码识别 项目地址: https://gitcode.com/gh_mirrors/ca/captcha_break captcha_break是一个高效的验证码识别项目,通过深度学习技术…...

卡尔曼滤波与贝叶斯滤波:从历史数据中精准提取趋势的终极指南

卡尔曼滤波与贝叶斯滤波:从历史数据中精准提取趋势的终极指南 【免费下载链接】Kalman-and-Bayesian-Filters-in-Python Kalman Filter book using Jupyter Notebook. Focuses on building intuition and experience, not formal proofs. Includes Kalman filters,e…...

【Python类型安全白皮书】:基于127个开源项目的实测数据——启用type checking后Bug率下降63.8%

更多请点击: https://intelliparadigm.com 第一章:Python类型安全白皮书核心结论与实证价值 Python 类型安全并非追求编译期强制约束,而是通过渐进式类型提示(PEP 484)、运行时验证与工具链协同,在不破坏动…...

RDP Wrapper Library:Windows远程桌面多用户连接的技术实现方案

RDP Wrapper Library:Windows远程桌面多用户连接的技术实现方案 【免费下载链接】rdpwrap RDP Wrapper Library 项目地址: https://gitcode.com/gh_mirrors/rd/rdpwrap 技术问题背景分析 Windows操作系统从Vista版本开始,在家庭版和基础版中限制…...

SOpt项目类型系统深度解析:静态类型与动态类型对比

SOpt项目类型系统深度解析:静态类型与动态类型对比 【免费下载链接】SOpt Cdigos soltos usados em respostas minhas no Stack Overflow em portugus 项目地址: https://gitcode.com/gh_mirrors/so/SOpt SOpt项目是GitHub加速计划中的重要组成部分&#xff…...

Python跨端打包体积暴增真相(包体压缩实战白皮书)

更多请点击: https://intelliparadigm.com 第一章:Python跨端打包体积暴增的底层归因分析 Python 跨端打包工具(如 PyInstaller、Briefcase、Nuitka)在构建 macOS、Windows 和 Linux 应用时,常出现最终二进制体积远超…...

5分钟快速上手:Onekey Steam清单下载器终极使用指南

5分钟快速上手:Onekey Steam清单下载器终极使用指南 【免费下载链接】Onekey Onekey Steam Depot Manifest Downloader 项目地址: https://gitcode.com/gh_mirrors/one/Onekey 你是否曾经因为Steam下载速度慢如蜗牛而烦躁?或是想要备份心爱的游戏…...

Service Mesh配置即代码(GitOps)落地难题全拆解:从CI/CD流水线集成到灰度发布策略原子化控制

更多请点击: https://intelliparadigm.com 第一章:Service Mesh配置即代码(GitOps)落地全景图 Service Mesh 的 GitOps 实践将 Istio、Linkerd 或 Open Service Mesh 的声明式配置全面纳入版本控制,使服务治理策略具备…...

终极Mako安全实践:保护你的Wayland通知系统免受恶意应用攻击

终极Mako安全实践:保护你的Wayland通知系统免受恶意应用攻击 【免费下载链接】mako A lightweight Wayland notification daemon 项目地址: https://gitcode.com/gh_mirrors/mak/mako Mako作为一款轻量级Wayland通知守护进程,在Sway等Wayland com…...

Equalizer APO终极指南:3步免费提升电脑音频音质,告别平淡声音

Equalizer APO终极指南:3步免费提升电脑音频音质,告别平淡声音 【免费下载链接】equalizerapo Equalizer APO mirror 项目地址: https://gitcode.com/gh_mirrors/eq/equalizerapo 你是否厌倦了电脑播放音乐时的单薄无力?看电影时低音不…...

QMCDecode终极指南:5分钟快速解锁QQ音乐加密文件,让音乐播放无限制!

QMCDecode终极指南:5分钟快速解锁QQ音乐加密文件,让音乐播放无限制! 【免费下载链接】QMCDecode QQ音乐QMC格式转换为普通格式(qmcflac转flac,qmc0,qmc3转mp3, mflac,mflac0等转flac),仅支持macOS,可自动识…...