当前位置: 首页 > article >正文

保姆级教程:在Ubuntu 20.04上为RISC-V芯片(如玄铁C910)编译运行CoreMark v1.01

RISC-V平台CoreMark性能测试全流程实战指南在嵌入式开发领域选择适合的基准测试工具对处理器性能进行准确评估至关重要。CoreMark作为业界公认的轻量级测试标准特别适合评估RISC-V这类精简指令集架构的核心处理能力。本文将手把手带你完成从工具链配置到结果分析的全过程涵盖玄铁C910等RISC-V芯片的专项优化技巧。1. 环境准备与工具链配置1.1 交叉编译工具链安装RISC-V开发的首要步骤是建立可靠的交叉编译环境。推荐使用官方预编译的工具链wget https://github.com/riscv-collab/riscv-gnu-toolchain/releases/download/2023.06.09/riscv64-unknown-linux-gnu-x86_64-20230609.tar.gz tar xvf riscv64-unknown-linux-gnu-x86_64-20230609.tar.gz export PATH$PATH:~/riscv64-unknown-linux-gnu/bin验证安装是否成功riscv64-unknown-linux-gnu-gcc --version注意若需支持C扩展指令集需在编译工具链时添加--with-archrv64gc参数1.2 依赖库检查确保主机系统已安装基础开发工具sudo apt update sudo apt install build-essential git wget libncurses-dev flex bison2. CoreMark源码获取与结构解析2.1 获取最新源码直接从EEMBC官方仓库克隆git clone https://github.com/eembc/coremark.git cd coremark关键目录说明barebones/裸机环境移植模板linux/Linux平台参考实现core_portme.[ch]平台适配层代码2.2 RISC-V专用目录创建复制Linux参考实现作为基础cp -r linux64 riscv643. RISC-V专项适配改造3.1 编译器配置修改编辑riscv64/core_portme.makCC riscv64-unknown-linux-gnu-gcc CFLAGS -marchrv64imafdc -mabilp64d LFLAGS_END -lrt -lpthread3.2 多核支持优化对于支持多核的RISC-V处理器如玄铁C910需添加线程支持make PORT_DIRriscv64 XCFLAGS-DMULTITHREAD4 -DUSE_PTHREAD常见问题解决**错误undefined reference topthread_create** 确保LFLAGS_END包含-lpthread警告incompatible implicit declaration添加-D_XOPEN_SOURCE600到CFLAGS4. 编译与部署实战4.1 单核版本编译基础编译命令make PORT_DIRriscv64 XCFLAGS-DPERFORMANCE_RUN1生成文件说明coremark.rvexeRISC-V可执行文件run1.log测试结果输出4.2 目标板卡部署通过SCP传输到开发板scp coremark.rvexe usertarget-board:/tmp/在目标板执行chmod x /tmp/coremark.rvexe /tmp/coremark.rvexe5. 结果分析与优化建议典型输出示例2K performance run parameters for coremark. CoreMark 1.0 : 6.000000 / GCC8.3.0 -O2 -marchrv64imafdc关键指标解读Iterations/Sec每秒迭代次数值越高性能越好CoreMark/MHz每MHz频率得分用于跨平台比较优化方向编译器选项调优CFLAGS -O3 -funroll-loops -flto内存对齐优化#define MEM_ALIGN 64指令集扩展检测riscv64-unknown-linux-gnu-gcc -marchrv64imafdc -dM -E - /dev/null | grep RV646. 高级技巧与深度优化6.1 静态链接优化减少动态依赖LDFLAGS -static6.2 性能计数器集成通过RISC-V PMU获取精确周期数unsigned long get_cycles(void) { unsigned long cycles; asm volatile (rdcycle %0 : r (cycles)); return cycles; }6.3 多核负载均衡针对NUMA架构的优化策略cpu_set_t cpuset; CPU_ZERO(cpuset); CPU_SET(core_id, cpuset); pthread_setaffinity_np(pthread_self(), sizeof(cpu_set_t), cpuset);7. 行业对比与趋势洞察主流RISC-V芯片CoreMark得分参考单核1GHz芯片型号CoreMarkCoreMark/MHz玄铁C9106.126.12SiFive U745.415.41Kendryte K5103.893.89性能提升建议启用编译器PGO优化使用RVV向量化扩展调整L1缓存预取策略在实际项目中我们发现玄铁C910的乱序执行单元对CoreMark分数提升显著。通过-mtunec910参数可激活特定优化相比通用编译选项可获得约12%的性能提升。

相关文章:

保姆级教程:在Ubuntu 20.04上为RISC-V芯片(如玄铁C910)编译运行CoreMark v1.01

RISC-V平台CoreMark性能测试全流程实战指南 在嵌入式开发领域,选择适合的基准测试工具对处理器性能进行准确评估至关重要。CoreMark作为业界公认的轻量级测试标准,特别适合评估RISC-V这类精简指令集架构的核心处理能力。本文将手把手带你完成从工具链配置…...

终极Windows系统清理工具Win11Debloat:一键释放性能,还原纯净体验

终极Windows系统清理工具Win11Debloat:一键释放性能,还原纯净体验 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other chang…...

NCM文件解密技术深度解析:ncmdumpGUI开源工具实战指南

NCM文件解密技术深度解析:ncmdumpGUI开源工具实战指南 【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换,Windows图形界面版本 项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI ncmdumpGUI是一个基于C#开发的Windows图形界…...

如何彻底解决Windows游戏乱码问题:Locale Remulator终极指南

如何彻底解决Windows游戏乱码问题:Locale Remulator终极指南 【免费下载链接】Locale_Remulator System Region and Language Simulator. 项目地址: https://gitcode.com/gh_mirrors/lo/Locale_Remulator 你是否曾经遇到过这样的烦恼?下载了一款日…...

ESP8266实战:手把手教你用AT指令对接OneNET物联网平台

1. 从零开始:认识ESP8266与OneNET平台 第一次接触物联网开发的朋友可能会被各种专业术语吓到,但其实用ESP8266模块对接OneNET平台比你想象中简单得多。ESP8266是一款性价比极高的Wi-Fi模块,价格不到20元却能实现完整的网络连接功能。而OneNET…...

Ubuntu系统MPI并行计算环境搭建实战

1. 为什么需要MPI并行计算环境 在科研和工程计算领域,我们经常会遇到需要处理海量数据或者进行复杂模拟的情况。这时候单台计算机的性能就显得捉襟见肘了。记得我第一次做流体力学模拟时,一个简单的模型跑了整整三天还没出结果,导师看了直摇头…...

别再只测理论值了!手把手教你用ZCU104实测AXI DMA真实带宽(附Vivado工程与源码)

ZCU104实战:AXI DMA真实带宽测试与性能优化全解析 在FPGA开发中,AXI DMA的性能直接影响着视频流处理、高速数据采集等关键应用的实时性。很多开发者习惯依赖理论峰值带宽作为设计依据,却在实际部署时遭遇性能瓶颈。本文将带您深入ZCU104开发板…...

别再混淆了!RDMA的RC、UC、UD、RD服务类型,到底该怎么选?(附场景对比表)

RDMA服务类型深度解析:如何为高性能场景选择最佳方案 在分布式存储、AI训练和金融交易系统中,网络延迟往往是性能瓶颈的关键所在。RDMA(远程直接内存访问)技术通过绕过操作系统内核和CPU干预,实现了超低延迟的数据传输…...

从二维照片到三维世界:MicMac摄影测量软件完全指南

从二维照片到三维世界:MicMac摄影测量软件完全指南 【免费下载链接】micmac Free open-source photogrammetry software tools 项目地址: https://gitcode.com/gh_mirrors/mi/micmac 你是否曾想过,如何将普通的二维照片转化为精确的三维模型&…...

Python的__complex__方法支持复数比较与排序在数值运算中的完整实现

Python作为一门强大的编程语言,其数值运算能力一直备受推崇。复数在Python中的比较与排序却是一个容易被忽视的领域。复数默认不支持直接比较,这在某些科学计算或工程应用中可能带来不便。本文将深入探讨如何通过实现__complex__方法,为复数赋…...

第X讲:C# 条件逻辑实战:从if else到Razor页面中的智能决策(黄菊华NET网站开发、C#网站开发、Razor网站开发教程)

1. 从控制台到网页:if else的华丽转身 第一次接触C#的if else语句时,我还在用控制台程序判断奇偶数。那时候觉得,这不就是个简单的判断题吗?直到开始用ASP.NET Core开发网站后台管理系统,才发现条件逻辑简直是动态网页…...

树莓派 4B EEPROM 升级实战:从原理到三种更新方法详解

1. 树莓派4B EEPROM的核心作用 当你第一次接触树莓派4B时,可能会好奇这个小板子是怎么启动系统的。与传统电脑不同,树莓派4B使用了一种叫做EEPROM的特殊芯片来存储启动代码。这就像给电脑装了一个永远不会丢失的"开机说明书",即使拔…...

别再手动分桶了!用torch.compile的dynamic模式,让PyTorch模型自动适应各种输入尺寸

解放生产力:用torch.compile动态模式实现PyTorch模型的自动尺寸适应 想象一下这样的场景:你正在开发一个在线图像处理服务,用户上传的照片分辨率千差万别——从手机拍摄的竖屏照片到专业相机的高清横图。或者你负责一个NLP推理API&#xff0c…...

3分钟终极指南:如何免费解锁Spotify高级功能并永久屏蔽广告

3分钟终极指南:如何免费解锁Spotify高级功能并永久屏蔽广告 【免费下载链接】BlockTheSpot Video, audio & banner adblock/skip for Spotify 项目地址: https://gitcode.com/gh_mirrors/bl/BlockTheSpot 还在为Spotify的频繁广告而烦恼吗?想…...

从UDS报文到故障灯:手把手拆解DTC状态字节(0xAF, 0x24)的每一个bit

从UDS报文到故障灯:手把手拆解DTC状态字节(0xAF, 0x24)的每一个bit 当仪表盘上的故障灯突然亮起,背后隐藏的是一套精密的诊断通信系统在运作。对于汽车诊断工程师而言,理解故障码(DTC)的状态字…...

上下文感知力决定AI编码生产力,从Token截断到意图延续:工程师必须掌握的4类动态上下文注入技术

第一章:智能代码生成上下文理解优化 2026奇点智能技术大会(https://ml-summit.org) 现代智能代码生成系统(如Copilot、CodeWhisperer、DeepSeek-Coder)的性能瓶颈正从模型规模转向上下文建模精度。当输入提示(prompt&#xff09…...

运维实战:K8s节点维护,用cordon、drain还是delete?一张图帮你做决策

Kubernetes节点维护决策指南:cordon、drain与delete的深度实践 在Kubernetes集群的日常运维中,节点维护是每个工程师都无法回避的挑战。无论是计划内的内核升级、硬件更换,还是应对突发的节点故障,如何优雅地处理节点下线与恢复&a…...

LaTeX排版中文论文时,你踩过这几个坑吗?关于字体、行距和页边距的避坑指南

LaTeX中文排版实战:避开字体、行距与页边距的五大深坑 第一次用LaTeX写中文论文时,我对着屏幕上那堆乱码和错位的格式足足发呆了半小时——明明按照教程一步步操作,为什么标题变成了黑块?为什么行距设置完全无效?如果你…...

揭秘GitHub Copilot在Scrum中的真实落地路径:从Sprint Planning到Daily Standup的5个关键嵌入点

第一章:智能代码生成在敏捷开发中的应用 2026奇点智能技术大会(https://ml-summit.org) 智能代码生成正深度融入敏捷开发的迭代闭环,成为提升交付速度与代码一致性的关键杠杆。它不再仅作为辅助补全工具,而是嵌入用户故事拆解、测试驱动开发…...

Windows 11终极优化指南:如何用Win11Debloat一键打造纯净高效系统

Windows 11终极优化指南:如何用Win11Debloat一键打造纯净高效系统 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declu…...

从SocketTimeoutException到连接优化:实战解析Java网络超时陷阱

1. 当你的Java应用突然卡死:SocketTimeoutException的典型场景 第一次见到java.net.SocketTimeoutException: 30,000 milliseconds timeout这个报错时,我正在调试一个电商平台的搜索功能。控制台突然弹出的红色错误让我心头一紧——明明本地测试好好的功…...

Apex Legends智能压枪终极指南:免费开源工具实现精准射击

Apex Legends智能压枪终极指南:免费开源工具实现精准射击 【免费下载链接】Apex-NoRecoil-2021 Scripts to reduce recoil for Apex Legends. (auto weapon detection, support multiple resolutions) 项目地址: https://gitcode.com/gh_mirrors/ap/Apex-NoRecoil…...

从AD18到AD23:这些年Altium Designer为‘人性化’做了哪些升级?附与PADS/Allegro操作习惯的对比

Altium Designer的进化之路:从AD18到AD23的UX革命与行业启示 在电子设计自动化(EDA)领域,软件工具的交互体验往往决定着工程师的工作效率和创意发挥空间。作为PCB设计领域的标杆产品,Altium Designer(AD&am…...

JSqlParser实战:动态SQL生成与优化的高效解决方案

1. JSqlParser入门:SQL解析与生成的瑞士军刀 第一次接触JSqlParser是在三年前的一个报表系统项目中,当时需要动态生成上百种复杂查询条件。手动拼接SQL字符串不仅容易出错,还面临SQL注入风险。直到发现了这个神器,才真正体会到什…...

EndNote X8保姆级教程:从文献导入到Word引用一键搞定(含GB/T 7714格式配置)

EndNote X8科研文献管理全攻略:从零掌握GB/T 7714到论文高效排版 第一次接触学术论文写作时,最让人头疼的莫过于文献管理。记得我研一那年,为了调整参考文献格式,整整花了三天时间手动修改编号——直到实验室师兄推荐了EndNote X8…...

YOLO 系列:低分辨率克星!YOLOv8 替换 SPD-Conv(空间深度转换卷积),突破低像素检测瓶颈

引言:当YOLO遭遇低分辨率之痛 在计算机视觉的诸多应用场景中,低分辨率图像和小目标检测一直是难以逾越的技术鸿沟。想象一下这样的场景:监控摄像头拍摄的远距离行人、无人机航拍的密集车辆、医疗影像中的微小病灶、工业质检中毫米级缺陷……这些目标在画面中往往只占据几十…...

Qwen3-ASR-1.7B应用案例:法律庭审录音转文字+关键语句高亮提取

Qwen3-ASR-1.7B应用案例:法律庭审录音转文字关键语句高亮提取 想象一下,一位律师或书记员需要从长达数小时的庭审录音中,快速找到“被告当庭承认”、“关键证据质证”或“法官最终裁定”等核心片段。传统方法需要人工反复听录音、做标记&…...

从std::pair到std::tuple:C++多返回值处理的优雅进化史(C++11/14/17对比)

从std::pair到std::tuple:C多返回值处理的优雅进化史 在C的世界里,数据打包和传递一直是开发者们日常面对的挑战。想象一下,当你需要从函数返回多个值时,传统的做法可能是定义一个临时结构体,或者通过引用参数来"…...

别再死记硬背了!一张图看懂UE4委托:单播、多播、动态委托的区别与选用场景

UE4委托系统实战指南:单播、多播与动态委托的智能选择 第一次接触UE4的委托系统时,那些DECLARE_DELEGATE、DECLARE_MULTICAST_DELEGATE开头的宏定义确实让人眼花缭乱。但当我真正理解了它们的设计哲学后,发现这套系统其实非常优雅——就像游戏…...

保姆级避坑指南:用Python脚本一键搞定ROS xacro到MuJoCo XML的完整转换(附UR5实例)

保姆级避坑指南:用Python脚本一键搞定ROS xacro到MuJoCo XML的完整转换(附UR5实例) 在机器人仿真领域,ROS和MuJoCo的结合正成为越来越多开发者的选择。然而,从ROS的xacro文件到MuJoCo的XML模型转换过程,往往…...