当前位置: 首页 > article >正文

体验 ROCm 和 Strix Halo:从系统设置到模型运行全流程分享!

又一个博客在这里我将分享我对 ROCm 和 Strix Halo 的初印象以及我是如何完成所有设置的。操作系统选择与驱动安装我习惯使用 Ubuntu 系统所以这次依旧选择了受支持的 24.04 LTS 版本并按官方安装说明进行了操作。BIOS 更新似乎不更新 BIOS 很多功能都无法正常使用比如 PyTorch 就找不到 GPU。不过在 BIOS 设置中更新很简单它能连接我的 Wifi 网络并自动下载更新。BIOS 设置与 Grub 修改同样在 BIOS 设置中要确保将预留的显存设置为较低的值并通过 GTT 让 CPU 和 GPU 共享内存预留内存最低可设为 512MB。相关影响如下CPU 无法使用 GPU 的预留内存。GPU 可以使用预留内存和 GTT 的总和但由于碎片化和寻址开销同时使用两者的效率可能不如使用一个大的 GTT 池。遗憾的是一些旧游戏或软件可能会将 GPU 内存识别为 512MB 并拒绝运行不过我目前还没遇到这种情况。然后我在 /etc/default/grub 文件中做了如下修改GRUB_CMDLINE_LINUX_DEFAULTquiet splash ttm.pages_limit32768000 amdgpu.gttsize114688接着运行 sudo update-grub 命令。需要注意的是amdgpu.gttsize 不应包含整个系统内存为保证 Linux 内核的稳定性应该给 CPU 预留一些内存建议是 4GB 到 12GB即总内存减去预留的 GPU 内存再减去 GTT 内存。支持 UV 的 PyTorch由于 PyTorch 复杂的依赖关系这一步有点棘手但最终我还是通过以下配置让它正常工作了[project] name myproject version 0.1.0 description 在此添加你的描述 readme README.md requires-python 3.13 dependencies [ torch2.11.0rocm7.2, triton-rocm, ] [tool.uv] environments [sys_platform linux] [[tool.uv.index]] name pytorch-rocm url https://download.pytorch.org/whl/rocm7.2 explicit true [tool.uv.sources] torch { index pytorch-rocm } torchvision { index pytorch-rocm } triton-rocm { index pytorch-rocm }你甚至可以将以下内容添加到 .bashrc 文件中alias pytorchuvx --extra-index-url https://download.pytorch.org/whl/rocm7.2 \ --index-strategy unsafe-best-match \ --with torch2.11.0rocm7.2,triton-rocm \ ipython -c import torch; print(f\ROCM: {torch.version.hip}\); \ print(f\GPU 可用: {torch.cuda.is_available()}\); import torch.nn as nn -i Llama.cpppodman run --rm -it --name qwen-coder --device /dev/kfd --device /dev/dri \ --security-opt labeldisable --group-add keep-groups -e HSA_OVERRIDE_GFX_VERSION11.5.0 \ -p 8080:8080 -v /some_path/models:/models:z ghcr.io/ggml-org/llama.cpp:server-rocm \ -m /models/qwen3.6/model.gguf -ngl 99 -c 327680 --host 0.0.0.0 --port 8080 \ --flash-attn on --no-mmap你可以通过以下命令轻松下载模型uvx hf download Qwen/Qwen3.6-35B-A3B --local-dir /some_path/models/qwen3.6然后使用 llama.cpp 仓库中的 convert_hf_to_gguf.py 脚本将其转换为 gguf 格式git clone https://github.com/ggerganov/llama.cpp.git /some_path/llama.cpp cd /some_path/models/qwen3.6 uvx --extra-index-url https://download.pytorch.org/whl/rocm7.2 \ --index-strategy unsafe-best-match \ --with torch2.11.0rocm7.2,triton-rocm,transformers \ ipython /some_path/llama.cpp/convert_hf_to_gguf.py \ -- . --outfile model.ggufOpencode我使用 Podman 来运行 Opencode。以下是让它与 Llama.cpp 配合使用的配置{ $schema: https://opencode.ai/config.json, provider: { local: { options: { baseURL: http://localhost:8080/v1, apiKey: 任意字符串, reasoningEffort: 自动, textVerbosity: 高, supportsToolCalls: true }, models: { qwen-coder-local: {} } } }, model: local/qwen-coder-local, permission: { *: 询问, read: { *: 允许, *.env: 拒绝, **/secrets/**: 拒绝 }, bash: 允许, edit: 允许, glob: 允许, grep: 允许, websearch: 允许, codesearch: 允许, webfetch: 允许 }, disabled_providers: [ opencode ]}总结正如我之前所说我的初印象是目前一切都还不错我能够使用 PyTorch 并在 llama.cpp 上以大上下文窗口运行 Qwen3.6。虽然过程中有些小问题但我认为还是很值得的。那么你是否也想尝试一下呢

相关文章:

体验 ROCm 和 Strix Halo:从系统设置到模型运行全流程分享!

又一个博客在这里,我将分享我对 ROCm 和 Strix Halo 的初印象,以及我是如何完成所有设置的。操作系统选择与驱动安装我习惯使用 Ubuntu 系统,所以这次依旧选择了受支持的 24.04 LTS 版本,并按官方安装说明进行了操作。BIOS 更新似…...

跳跃表与跳跃树:Antithesis 如何用奇特数据结构解决测试难题?

BugBash 2026导航栏信息 导航栏包含产品相关、解决方案、公司信息和资源四个板块。产品相关板块有 What is Antithesis?、How Antithesis works、How were different 等内容;解决方案板块涵盖 Problems we solve、Security approach、Fintech、Blockchain、Databas…...

静态时序分析实战指南:深入解析set_multicycle_path的约束策略与场景应用

1. 什么是多周期路径约束 刚接触静态时序分析时,我最困惑的就是为什么需要多周期路径约束。记得第一次看到set_multicycle_path命令时,完全不明白这个"多周期"到底是什么意思。直到后来在实际项目中遇到一个典型的异步复位同步释放电路&#…...

从零到一:使用再生龙(Clonezilla)实现企业级系统镜像的标准化部署

1. 为什么企业需要系统镜像标准化部署 想象一下这样的场景:公司新采购了50台电脑,IT部门需要为每台设备手动安装操作系统、驱动程序和办公软件。这不仅耗时耗力,还容易出现人为失误导致的环境差异。更糟的是,当某台电脑系统崩溃时…...

C#连接OPC UA服务器的三种身份验证方式详解:匿名、用户名密码和证书(附完整代码)

C#连接OPC UA服务器的三种身份验证方式详解:匿名、用户名密码和证书(附完整代码) 在工业自动化领域,数据安全传输一直是系统集成中的核心挑战。OPC UA作为新一代工业通信标准,其安全机制设计尤为关键。本文将深入解析三…...

FanControl终极中文设置指南:5分钟让风扇控制说中文的完整教程

FanControl终极中文设置指南:5分钟让风扇控制说中文的完整教程 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Tre…...

eNSP云设备桥接实战:VirtualBox Host-Only网卡配置与连通性测试全记录

eNSP云设备桥接实战:VirtualBox Host-Only网卡配置与连通性测试全记录 在虚拟化技术日益普及的今天,网络工程师和IT从业者经常需要在模拟环境中构建复杂的网络拓扑,同时实现与物理设备的无缝对接。华为eNSP作为一款优秀的网络仿真平台&#…...

JavaScript正则表达式实战:从EDUCODER关卡解析到日常开发应用

JavaScript正则表达式实战:从EDUCODER关卡解析到日常开发应用 正则表达式就像程序员的瑞士军刀,能在文本处理中解决各种棘手问题。第一次接触正则时,那些看似神秘的符号组合让我望而生畏,直到在EDUCODER平台通过实战关卡逐步掌握…...

深入NRF52832 ESB协议栈:从状态机到PPI,剖析与NRF24L01通信的底层时序与避坑指南

深入NRF52832 ESB协议栈:从状态机到PPI的通信稳定性实战指南 1. 无线通信系统的核心挑战 在物联网和智能硬件领域,2.4GHz无线通信已成为设备互联的基础技术。NRF52832作为Nordic Semiconductor的旗舰级蓝牙低功耗SoC,其内置的Enhanced ShockB…...

从嵌入式春招到秋招:我用C语言刷动态规划(背包问题)的实战心得

从嵌入式春招到秋招:我用C语言刷动态规划(背包问题)的实战心得 去年春天,当我第一次打开某大厂的在线笔试系统时,手心里全是汗。作为嵌入式专业的学生,我本以为笔试会偏向硬件和底层开发,没想到…...

QtDataVisualization实战:用三维图表打造一个酷炫的数据仪表盘(附完整源码)

QtDataVisualization三维数据仪表盘开发实战 三维数据可视化在现代数据分析中扮演着越来越重要的角色。QtDataVisualization模块为开发者提供了强大的工具,能够将复杂数据转化为直观的三维图表。本文将带你从零开始,构建一个功能完善、视觉效果出色的数据…...

Kali Linux 2023 上 Burp Suite Pro 2024 的保姆级安装与激活指南(含JDK 11配置)

Kali Linux 2023 上 Burp Suite Pro 2024 的保姆级安装与激活指南(含JDK 11配置) 在渗透测试领域,Burp Suite Pro 一直是Web应用安全测试的黄金标准工具。随着2024版本的发布,其新增的智能扫描引擎和API测试模块让安全研究人员的工…...

SAP Analysis Office 部署与维护实战指南

1. SAP Analysis Office 环境准备与兼容性检查 第一次部署SAP Analysis Office(AO)时,我遇到最头疼的问题就是环境兼容性。记得有次给客户装AO 2.8,装完才发现他们用的是Excel 2016最新版,结果插件根本加载不出来。后来…...

软件市场管理中的目标客户选择

软件市场管理中的目标客户选择 在竞争激烈的软件市场中,精准选择目标客户是产品成功的关键。无论是初创企业还是行业巨头,都需要明确哪些用户群体最可能为产品买单,从而优化资源分配,提高市场推广效率。目标客户选择不仅关乎营销…...

【Java实战】告别繁琐!用poi-tl轻松玩转Word模板动态渲染与数据导出

1. 为什么我们需要poi-tl? 每次遇到要导出Word报告的需求,我就头疼。早些年用Apache POI直接操作Word文档,那代码写得叫一个酸爽——动不动就是几十行代码就为了插个表格,改个样式还得研究半天底层XML结构。后来试过Freemarker&am…...

AGI不是工具,而是对手:揭秘某国家级红队用LLM+AGI协同实施APT29变种攻击的完整TTPs链条

第一章:AGI作为新型对抗主体的范式跃迁 2026奇点智能技术大会(https://ml-summit.org) 传统网络安全对抗模型长期基于“人—工具—系统”三级结构,攻击者为人类或其代理程序(如自动化脚本、Botnet),防御方亦以人类策…...

你的IoT设备安全吗?从STM32的RNG寄存器配置到生成加密密钥的完整流程

你的IoT设备安全吗?从STM32的RNG寄存器配置到生成加密密钥的完整流程 在物联网设备爆炸式增长的今天,安全性已成为产品设计的核心考量。想象一下,当你的智能门锁、健康监测设备或工业传感器通过网络交换数据时,如果加密密钥可以被…...

【AGI可信性认证核心指标】:为什么92%的所谓“因果模型”连Pearl因果图第一关都未通过?

第一章:AGI可信性认证的因果推理范式重构 2026奇点智能技术大会(https://ml-summit.org) 当前AGI系统在决策可解释性、反事实鲁棒性与干预一致性等维度面临根本性可信缺口。传统基于统计相关性的验证框架无法支撑高危场景下的责任归属与归因审计,亟需以…...

从Linux到Uboot:手把手带你理解DM驱动模型的迁移与实战配置

从Linux到Uboot:深入解析DM驱动模型的迁移与实战配置 1. 嵌入式开发者的跨平台驱动认知重构 对于熟悉Linux设备驱动开发的工程师而言,初次接触Uboot的Driver Model(DM)架构往往会经历一段认知调适期。这种调适本质上是从一个成熟完备的驱动框架向一个精简…...

知识图谱化技术实体链接与知识推理的实现

知识图谱化技术:实体链接与知识推理的实现 在当今大数据时代,知识图谱作为结构化知识的重要载体,广泛应用于搜索引擎、智能问答和推荐系统等领域。其中,实体链接与知识推理是知识图谱构建与应用的核心技术。实体链接旨在将文本中…...

NX工程图实战技巧与高效出图指南(制图篇)

1. NX工程图模块基础操作精要 第一次打开NX工程图模块时,很多新手会被密密麻麻的工具栏吓到。其实掌握几个核心命令就能应付80%的常规出图需求。基本视图是工程图的起点,在插入视图时有个小技巧:按住Ctrl键拖动可以快速复制视图,这…...

别再为农田边界发愁了!用GEE的MODIS数据给Landsat影像‘开个挂’,30米精度轻松拿捏

农田边界提取革命:用GEE融合MODIS与Landsat实现亚像元级精度 当500米分辨率的MODIS遇上30米精度的Landsat,会产生怎样的化学反应?在农业遥感领域,这个看似不可能的组合正在颠覆传统农田边界提取的工作流程。本文将带您探索如何通过…...

深入open62541 PubSub:手把手教你用UDP组播实现无代理(Broker-less)数据分发

深入open62541 PubSub:UDP组播实现无代理数据分发的实战解析 在工业物联网和分布式系统中,实时数据分发一直是架构设计的核心挑战。传统基于代理的发布/订阅模式虽然成熟可靠,但在某些对延迟敏感、要求极致轻量级的场景中,无代理(…...

AGI平民化接入实战手册(SITS2026现场闭门报告首次公开)

第一章:SITS2026专家:AGI的民主化访问 2026奇点智能技术大会(https://ml-summit.org) 从封闭模型到开放协议 AGI能力正加速脱离专有云服务与高门槛API调用范式,转向基于轻量级推理引擎、可验证提示合约和联邦式知识更新的开放基础设施。SIT…...

StarUML插件DDL实战:5分钟搞定ER图到MySQL建表脚本(含Java代码生成)

StarUML插件DDL实战:5分钟搞定ER图到MySQL建表脚本(含Java代码生成) 在数据库设计领域,效率往往决定着项目推进的速度。想象一下这样的场景:产品经理刚刚确认完需求,开发团队需要在两小时内完成数据库设计并…...

从.map文件看透你的STM32程序:一份给嵌入式工程师的‘程序体检报告’解读指南

STM32程序体检报告:用.map文件透视嵌入式系统的健康密码 当你完成一个STM32项目的编译,除了熟悉的.hex或.bin文件,编译器还会生成一份名为.map的"体检报告"。这份看似晦涩的文本文件,实际上是了解程序在芯片内部真实运行…...

STM32外部中断实战:用红外传感器实现物体计数(附完整代码)

STM32外部中断与红外传感器计数系统实战指南 红外传感器计数系统概述 在工业自动化、智能仓储和生产线管理等领域,物体计数是一项基础而重要的功能。基于STM32微控制器和红外传感器的计数系统,以其高可靠性、低成本和非接触式检测等优势,成为…...

告别内存踩踏!用STM32的MPU给你的RTOS任务加把‘安全锁’(FreeRTOS实战)

告别内存踩踏!用STM32的MPU给你的RTOS任务加把‘安全锁’(FreeRTOS实战) 在嵌入式系统开发中,多任务环境下的内存管理一直是开发者面临的棘手问题。想象一下,当你的关键控制任务正在稳定运行,突然因为某个通…...

别再瞎调了!NRF52832蓝牙发射功率实战指南:从-40dBm到+4dBm,手把手教你平衡距离与功耗

NRF52832蓝牙发射功率调优实战:从理论到场景化配置的艺术 在物联网设备开发中,蓝牙低功耗(BLE)技术的应用越来越广泛,而NRF52832作为Nordic Semiconductor的明星芯片,其灵活的发射功率调节功能常常被开发者忽视或误用。很多工程师…...

【Allegro 17.4 实战指南】布线后DRC检查与工艺优化全解析

1. Allegro 17.4布线后DRC检查全流程 刚完成PCB布线的新手工程师经常会遇到这样的困惑:明明布线时已经小心翼翼,为什么投板生产后还是会出现各种问题?其实布线完成只是PCB设计的第一步,后续的DRC检查和工艺优化才是确保设计可靠性…...