当前位置: 首页 > article >正文

三、RA8D1 CoreMark测试GCC vs AC6和分散加载浅析

一、概述RA8D1 搭载 Cortex-M85 内核主频 480MHz使用 GCC(13.3.1) 和 AC6(Clang 20.0.0git) 两种工具链编译 CoreMark测试不同优化等级、内存布局CacheSRAM、TCM对跑分的影响二、测试环境项目参数芯片RA8D1内核Cortex-M85主频480MHzGCC 版本13.3.1 20240614AC6 版本Clang 20.0.0gitCoreMark Size666 (2K)Iterations80000三、GCC 跑分结果3.1 测试配置与结果编号配置Iterations/SecCoreMark/MHz1-Ofast fsp.ld默认链接2286.374.762-Ofast fsp.ld stack 放 DTCM2343.574.883-Ofast fsp_tcm.ldTCM链接2341.304.884-Ofast fsp_tcm.ld stack 放 DTCM2341.374.883.2 GCC 结果分析默认链接脚本4.76 CoreMark/MHz基线成绩Stack 放入 DTCM提升到 4.88 CoreMark/MHz提升约 2.5%TCM 链接脚本与 stack 放 DTCM 效果接近约 4.88 CoreMark/MHzGCC 下 TCM 带来的收益有限说明代码主要已在 Cache 中命中四、AC6 跑分结果4.1 测试配置与结果编号配置Iterations/SecCoreMark/MHz1-Ofast stack 放 DTCM2688.355.602-Ofast stack 放 DTCM fsp_tcm.scat2683.305.593-Omax fsp_tcm.scat2780.775.794-Omax fsp.scat默认链接2780.775.795-Omax stack 放 DTCM2974.976.204.2 AC6 结果分析-Ofast 基线5.60 CoreMark/MHz已明显高于 GCC 的 4.88-Omax开启 LTO5.79 CoreMark/MHz比 -Ofast 提升约 3.4%-Omax stack 放 DTCM6.20 CoreMark/MHz最高成绩AC6 整体比 GCC 高约 27%5.60 vs 4.76 基线对比五、GCC vs AC6 对比汇总对比维度GCC (-Ofast)AC6 (-Ofast)AC6 (-Omax)基线默认链接4.765.605.79Stack 放 DTCM4.885.606.20TCM 链接脚本4.885.595.79最高成绩4.885.606.20六、AC6 优化等级与 LTO 详解6.1 -Ofast vs -Omax优化等级LTO说明-Ofast不启用激进优化但不做跨模块链接时优化。允许浮点重结合等可能违反标准合规的变换-Omax默认启用最大优化等价于 -O3 -flto。启用所有优化包括跨模块内联、死代码消除和链接时优化6.2 什么是 LTOLink Time OptimizationLTO 是一种跨模块的过程间优化在链接阶段而非编译阶段执行编译阶段armclang 使用 -flto 时生成bitcode字节码文件而非标准 ELF 对象文件。Bitcode 包含源代码的中间表示IR和模块依赖信息链接阶段armlink 处理 bitcode 文件提取模块依赖信息传递给 llvm-lto 工具优化阶段链接时优化器分析所有模块移除未使用函数/数据执行跨模块内联生成优化后的 ELF 对象最终链接优化后的对象与其他 ELF 对象和预编译库链接生成最终可执行文件6.3 LTO 对 Scatter FileTCM 放置的限制LTO 的核心问题是原始对象文件边界被打破对象合并LTO 将所有 bitcode 合并为 lto-llvm-xxxxx.o 这样的单一对象原始 .o 文件不再独立存在Section 属性丢失__attribute__((section(.dtcm))) 指定的段属性在 bitcode 合并过程中可能被合并或重命名Scatter 文件匹配失败scatter 文件中基于对象名的模式如 version.o (RO)将无法匹配产生 L6314W 警告具体表现问题说明对象名引用失效scatter 文件中无法使用 xxx.o 显式引用对象因为代码已被合并到 lto-llvm-xxxxx.oSection 属性可能被合并命名段可能无法在 bitcode 合并过程中保留RAM 函数放置异常通过 scatter 文件放入 RAM 的函数可能被内联到 Flash 函数中破坏原有放置Scatter-loading of LTO objects is supported but its recommended for code and data thatdoesnt have a strict placement requirement.— Arm Employee, Arm Community6.4 如何规避 LTO 限制方法操作换用 -Ofast不使用 -Omax避免 LTOscatter 文件正常工作部分文件禁用 LTO对需要严格放置的文件编译时加 -fno-lto其余文件保持 -flto链接器禁用 LTO使用 --no_lto 参数使用段名而非对象名scatter 文件中使用 *(.dtcm) 而非 xxx.o (.dtcm)不保证可靠6.5 本次测试中的体现配置 3-Omax fsp_tcm.scat与配置 4-Omax fsp.scat成绩相同2780.77说明LTO 开启后 scatter 文件的 TCM 放置可能未生效配置 5-Omax stack 放 DTCM达到最高 2974.97说明通过 __attribute__((section())) 直接指定 stack 位置的方式在 LTO 下仍然有效若需要 scatter 文件精确控制 TCM 放置建议使用 -Ofast 而非 -Omax七、总结AC6 优于 GCCAC6 基线成绩比 GCC 高约 27%编译器优化能力更强-Omax 最快但有代价LTO 带来额外 3-6% 性能提升但限制了 scatter 文件的 TCM 精确放置TCM 收益Stack 放入 DTCM 在两种工具链下都有正向收益AC6 下提升更明显最佳实践追求极致性能用 AC6 -Omax stack 放 DTCM6.20 CoreMark/MHz需要精确内存布局用 AC6 -Ofast

相关文章:

三、RA8D1 CoreMark测试GCC vs AC6和分散加载浅析

一、概述RA8D1 搭载 Cortex-M85 内核,主频 480MHz使用 GCC(13.3.1) 和 AC6(Clang 20.0.0git) 两种工具链编译 CoreMark测试不同优化等级、内存布局(CacheSRAM、TCM)对跑分的影响二、测试环境项目参数芯片RA8D1内核Cortex-M85主频480MHzGCC 版…...

KART-RERANK模型解析:互联网时代信息过载的智能过滤利器

KART-RERANK模型解析:互联网时代信息过载的智能过滤利器 每天一睁眼,手机里就塞满了未读消息:几十条群聊、上百条朋友圈、几十个App推送,还有永远刷不完的新闻和短视频。想找昨天朋友分享的那篇有趣的文章?得在信息洪…...

golang如何实现知识库问答系统_golang知识库问答系统实现实践

最省事的是 Qdrant 或 Milvus——二者均有官方 Go SDK,支持 HTTP/gRPC,文档完备;Qdrant 适合中小规模,Milvus 适合横向扩展,但需锁死 SDK 版本至 v2.4.5。用什么向量数据库搭配 Go 最省事Go 原生不带向量检索能力&…...

终极 .NET 逆向工程指南:dnSpyEx 深度调试与程序集编辑完全攻略

终极 .NET 逆向工程指南:dnSpyEx 深度调试与程序集编辑完全攻略 【免费下载链接】dnSpy Unofficial revival of the well known .NET debugger and assembly editor, dnSpy 项目地址: https://gitcode.com/gh_mirrors/dns/dnSpy dnSpyEx 作为 .NET 调试与逆向…...

如何实现SQL复杂计算触发器原子性_利用触发器事务控制

是,触发器天然包含在主SQL事务中;其数据修改随主语句回滚,无需手动开启事务,但不可修改被主语句操作的同一张表。触发器里写复杂SQL计算,事务会自动包含吗会。只要触发器在支持事务的存储引擎(比如 InnoDB&…...

Audio Pixel Studio效果展示:1000字长文TTS生成耗时与内存占用实测

Audio Pixel Studio效果展示:1000字长文TTS生成耗时与内存占用实测 1. 语音合成效果实测 Audio Pixel Studio集成了Microsoft Edge TTS引擎,支持多国语言和多种高保真音色。本次测试将重点展示其在长文本合成时的性能表现。 1.1 测试环境配置 测试使…...

CLIP ViT-H-14惊艳效果:建筑图纸与实景照片在特征空间的跨域对齐

CLIP ViT-H-14惊艳效果:建筑图纸与实景照片在特征空间的跨域对齐 1. 项目概述 今天我们要介绍的是基于CLIP ViT-H-14模型的图像特征提取服务。这个服务能够将各种类型的图像转换为1280维的特征向量,特别擅长处理建筑图纸与实景照片之间的跨域对齐问题。…...

数据结构笔记2

一、红黑树(Red-Black Tree)1. 背景平衡二叉树(AVL)虽能保证查询复杂度稳定在O(logN),但旋转调整过于复杂,性能消耗较大;红黑树作为折中方案,兼顾稳定性和维护成本,是“最…...

创新高效的跨平台Steam创意工坊下载解决方案:WorkshopDL一站式开源工具

创新高效的跨平台Steam创意工坊下载解决方案:WorkshopDL一站式开源工具 【免费下载链接】WorkshopDL WorkshopDL - The Best Steam Workshop Downloader 项目地址: https://gitcode.com/gh_mirrors/wo/WorkshopDL 还在为Epic Games Store或GOG平台上的游戏无…...

告别熬夜守候:DouyinLiveRecorder让40+平台直播录制全自动

告别熬夜守候:DouyinLiveRecorder让40平台直播录制全自动 【免费下载链接】DouyinLiveRecorder 可循环值守和多人录制的直播录制软件,支持抖音、TikTok、Youtube、快手、虎牙、斗鱼、B站、小红书、pandatv、sooplive、flextv、popkontv、twitcasting、wi…...

Dell G15散热控制系统:WMI接口的Python实现与硬件控制深度解析

Dell G15散热控制系统:WMI接口的Python实现与硬件控制深度解析 【免费下载链接】tcc-g15 Thermal Control Center for Dell G15 - open source alternative to AWCC 项目地址: https://gitcode.com/gh_mirrors/tc/tcc-g15 Thermal Control Center for Dell G…...

我为什么开始安利 Hermes Agent:它和 OpenClaw 到底有什么不一样?

如果你最近在折腾 AI Agent,大概率已经见过一堆“能聊天、能调工具、能接 Telegram/Discord”的项目了。问题不在于有没有,而在于:哪个真的值得长期用,哪个只是演示时很猛,落地时很折磨。 这两天我认真装了一遍 Herme…...

大模型跨云推理延迟骤降62%:揭秘某千亿级AI平台落地K8s+Istio+OSS联邦的5步标准化流水线

第一章:大模型工程化跨云部署最佳实践 2026奇点智能技术大会(https://ml-summit.org) 大模型跨云部署已从概念验证阶段迈入规模化生产落地关键期。面对异构云环境(如 AWS、Azure、阿里云、华为云)的网络策略、存储接口、GPU驱动栈及安全合规…...

游戏串流技术选型指南:为什么Sunshine成为开源游戏串流首选方案

游戏串流技术选型指南:为什么Sunshine成为开源游戏串流首选方案 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine 在构建家庭游戏云或远程游戏串流系统时,技术…...

大模型工程化到底缺什么?——SITS2026白皮书披露行业首套成熟度评估矩阵(含自测工具)

第一章:SITS2026发布:大模型工程化白皮书下载 2026奇点智能技术大会(https://ml-summit.org) SITS2026(Scalable Intelligent Training & Serving Summit)正式发布《大模型工程化白皮书(2026版)》&am…...

为什么92%的大模型项目卡在L3?SITS2026圆桌解密工程化跃迁的3个断层与1套验证框架

第一章:SITS2026圆桌:大模型工程化的未来趋势 2026奇点智能技术大会(https://ml-summit.org) 在SITS2026圆桌讨论中,来自Meta、阿里云、Hugging Face与CNCF模型工作组的七位工程实践者共同指出:大模型工程化正从“能跑通”迈向“…...

Docker部署Ollama模型烫

前言 Kubernetes 本身并不复杂,是我们把它搞复杂的。无论是刻意为之还是那种虽然出于好意却将优雅的原语堆砌成 鲁布戈德堡机械 的狂热。平台最初提供的 ReplicaSets、Services、ConfigMaps,这些基础组件简单直接,甚至显得有些枯燥。但后来我…...

DSMR协议嵌入式解析库:低资源流式解析与OBIS映射实现

1. DSMR协议解析库技术深度解析:面向嵌入式电表数据采集的底层实现 1.1 DSMR协议背景与工程意义 DSMR(Dutch Smart Meter Requirements)是荷兰国家电网强制推行的智能电表通信标准,其核心目标是统一家庭/工商业电表与能源供应商之…...

.NET 磁盘BitLocker加密-技术选型览

在之前的文章中,我们花了大量的篇幅,从记录后端pod真实ip开始说起,然后引入envoy,再解决了各种各样的需求:配置自动重载、流量劫持、sidecar自动注入,到envoy的各种能力:熔断、流控、分流、透明…...

战地风云2042启动失败缺少dll文件?2026最新官方安全修复指南

满怀期待地打开《战地风云2042》,结果屏幕上弹出一个窗口,告诉你“缺少xxx.dll,无法继续执行代码”。这种报错直接浇灭了游戏的热情。很多玩家第一反应是去网上搜这个dll名字,然后找个网站下载下来,这是非常危险的。这…...

Qwen2-VL-2B-Instruct跨平台调用方案:从移动端App到桌面应用的集成实践

Qwen2-VL-2B-Instruct跨平台调用方案:从移动端App到桌面应用的集成实践 1. 引言:当AI能力需要无处不在 最近在做一个项目,需要把视觉语言模型的能力塞进各种客户端里——手机App、桌面软件都得用上。一开始觉得挺简单,不就是调个…...

从“支付”到“取货”:售货机取货码方案设计与实现

一、背景与问题 🤔随着无人零售与智能售货机的普及,传统“扫码支付→立即出货”的模式,已经逐渐不够用了。毕竟,现在的玩法越来越“骚”:做个任务就能领饮料 🧃员工每天白嫖一瓶快乐水 😎发个笔…...

终极指南:使用ncmdump免费解密网易云音乐NCM文件,轻松转换MP3格式

终极指南:使用ncmdump免费解密网易云音乐NCM文件,轻松转换MP3格式 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 你是否曾经下载了网易云音乐的歌曲,却发现只能在特定播放器中播放?&a…...

GLM-4-9B-Chat-1M惊艳效果:1M上下文下‘反事实推理’能力边界测试

GLM-4-9B-Chat-1M惊艳效果:1M上下文下反事实推理能力边界测试 1. 引言:当AI能读完200万字,会发生什么? 想象一下,你面前摆着一套《三体》全集,大概100多万字。现在有个AI告诉你:我能一口气读完…...

CKKS 同态加密数学基础推导诺

背景 StreamJsonRpc 是微软官方维护的用于 .NET 和 TypeScript 的 JSON-RPC 通信库,以其强大的类型安全、自动代理生成和成熟的异常处理机制著称。在 HagiCode 项目中,为了通过 ACP (Agent Communication Protocol) 与外部 AI 工具(如 iflow …...

1979年11月3日晚上21-23点出生性格、运势和命运

在1979年11月3日晚上21 - 23点出生之人,其性格往往有着独特的烙印。这个时间段出生的人,性格多沉稳内敛,有着自己的思考方式和行事准则。他们通常具备较强的观察力,能敏锐地察觉到周围环境的细微变化,在与人交往中&…...

MOOTDX终极指南:免费构建你的股票量化分析系统

MOOTDX终极指南:免费构建你的股票量化分析系统 【免费下载链接】mootdx 通达信数据读取的一个简便使用封装 项目地址: https://gitcode.com/GitHub_Trending/mo/mootdx 你是否曾因股票数据获取困难而放弃量化分析的想法?是否被高昂的数据费用吓退…...

2026年黑龙江市场,这些专业装修公司值得你深入了解!

在黑龙江装修市场,选择一家靠谱的装修公司至关重要。下面为大家深入分析几家值得关注的装修公司,其中为尚奢享凭借其独特优势在市场中脱颖而出。为尚奢享:施工与服务双优典范为尚奢享即哈尔滨为尚装饰设计有限公司,成立十年来&…...

itop3-基于rockylinux8的itsm工具安装部署

目录 1.LAMP环境部署 1.1准备工作 1.2下载安装脚本 1.3使用自动模式安装lamp 1.4运维信息 2.itop安装 2.1itop下载 2.2配置itop 1.LAMP环境部署 https://www.lamp.sh/autoinstall.html 1.1准备工作 [rootitop3 ~]# yum -y install wget git Upgraded: wget-1.19.5-1…...

如何高效使用TrollInstallerX:从安装到精通的完整指南

如何高效使用TrollInstallerX:从安装到精通的完整指南 【免费下载链接】TrollInstallerX A TrollStore installer for iOS 14.0 - 16.6.1 项目地址: https://gitcode.com/gh_mirrors/tr/TrollInstallerX 你是否曾经希望在未越狱的iOS设备上自由安装第三方应用…...