算法基础 -- ARM 体系架构设计专家的算法提升目标
算法提升目标:ARM 体系架构设计专家
1. 位运算优化
相关 ARM 知识点:SIMD、NEON、SVE、低功耗优化、加密计算、数据压缩
推荐题目:
- 136. 只出现一次的数字(异或运算)
- 190. 颠倒二进制位(位反转,ARM
rbit指令) - 191. 位1的个数(Hamming Weight,ARM
popcnt指令) - 338. 比特位计数(动态规划优化位计算)
- 461. 汉明距离(XOR 计算)
- 693. 交替位二进制数(逻辑运算优化)
- 868. 二进制间距(ARM NEON 指令优化)
ARM 体系应用:
- SIMD 优化:NEON 指令支持
vbitcnt计算 Hamming Weight,可用于优化位运算题目。 - 低功耗优化:位运算可以减少分支预测失败的影响,降低功耗。
2. 数组与矩阵优化
相关 ARM 知识点:SVE/SVE2、矩阵乘法优化(GEMM)、FFT/卷积计算、Cache 友好访问模式
推荐题目:
- 48. 旋转图像(矩阵旋转,ARM SIMD 加速)
- 73. 矩阵置零(空间优化)
- 118. 杨辉三角(动态规划)
- 240. 搜索二维矩阵 II(二分优化搜索)
- 378. 有序矩阵中第 K 小的元素(Heap + 分治)
- 542. 01 矩阵(BFS + DP)
- 733. 图像渲染(BFS/DFS)
ARM 体系应用:
SVE/SVE2加速矩阵运算,如 GEMM(通用矩阵乘法)。FFT在 ARM NEON 中有加速指令,常用于计算机视觉、信号处理。- Cache 友好的访问模式(行优先 vs. 列优先)可以减少 Cache Miss。
3. 栈与队列
相关 ARM 知识点:LIFO/FIFO 结构、Cache 友好性、TLB 访问优化、硬件调度
推荐题目:
- 20. 有效的括号(栈基础)
- 155. 最小栈(双栈优化)
- 225. 用队列实现栈(双队列)
- 232. 用栈实现队列(双栈)
- 239. 滑动窗口最大值(单调队列优化)
- 394. 字符串解码(递归栈)
ARM 体系应用:
- ARMv8-A 架构的
SP(Stack Pointer)优化栈访问,提高访问效率。 - ARMv9 的
MTE(Memory Tagging)可用于检测栈溢出问题。
4. 哈希与前缀和
相关 ARM 知识点:Cache 友好性、Bloom Filter、哈希表优化(CRC32/SHA 加速)、预取机制
推荐题目:
- 1. 两数之和(哈希映射)
- 560. 和为 K 的子数组(前缀和 + 哈希表)
- 974. 和可被 K 整除的子数组(前缀和优化)
ARM 体系应用:
CRC32指令优化哈希函数计算,提高数据校验速度。Prefetch机制优化大规模哈希访问,减少 Cache Miss。
5. 动态规划(DP)
相关 ARM 知识点:并行优化、分块计算、低功耗优化(WFE/WFI)、TLB 热映射
推荐题目:
- 70. 爬楼梯(Fibonacci 动态规划)
- 198. 打家劫舍(动态规划优化)
- 322. 零钱兑换(完全背包 DP)
- 300. 最长递增子序列(O(nlogn) 优化)
- 1143. 最长公共子序列(字符串 DP)
ARM 体系应用:
TLB热映射优化内存访问,提高 DP 计算效率。SVE2可用于加速Fibonacci级别的 DP 计算。
6. 并发与锁
相关 ARM 知识点:Mutex、Spinlock、CAS(Compare-And-Swap)、MPAM(Memory Partitioning)
推荐题目:
- 1114. 按序打印(多线程同步)
- 1115. 交替打印 FooBar(互斥锁)
- 1116. 打印零与奇偶数(原子操作)
ARM 体系应用:
LDAXR/STLXR(Load Acquire / Store Release)用于 ARM 原子操作。WFE/WFI指令可降低 CPU 空转,提高多线程调度效率。
总结
以上 LeetCode 题目覆盖了 ARM 体系结构的多个关键优化方向,包括:
- 位运算加速(NEON/SVE)
- 矩阵优化(Cache 友好、FFT 加速)
- 数据结构与缓存(L1/L2/L3 Cache 交互)
- 并行与多线程(多核调度、Spinlock)
如果你的目标是 ARM 体系结构优化,可以先刷 位运算 + 数组 + DP,再深入 并发控制与高性能计算 相关的题目。
相关文章:
算法基础 -- ARM 体系架构设计专家的算法提升目标
算法提升目标:ARM 体系架构设计专家 1. 位运算优化 相关 ARM 知识点:SIMD、NEON、SVE、低功耗优化、加密计算、数据压缩 推荐题目: 136. 只出现一次的数字(异或运算)190. 颠倒二进制位(位反转,ARM rbit…...
不同开发语言对字符串的操作
一、字符串的访问 Objective-C: 使用 characterAtIndex: 方法访问字符。 NSString *str "Hello, World!"; unichar character [str characterAtIndex:0]; // 访问第一个字符 H NSLog("%C", character); // 输出: H NSString 内部存储的是 UTF-16 编…...
Oracle Linux Server 7.9安装fail2ban
yum search oracle-epel-release yum install oracle-epel-release-el7 search fail2ban yum install fail2ban nano /etc/fail2ban/jail.d/00-firewalld.conf # defalut这里是设定全局设置,如果下面的监控没有设置就以全局设置的值设置。 [DEFAULT] # 用于指定哪…...
FPGA|Verilog-SPI驱动
最近准备蓝桥杯FPGA的竞赛,因为感觉官方出的IIC的驱动代码思路非常好,写的内容非常有逻辑并且规范。也想学习一下SPI的协议,所以准备自己照着写一下。直到我打开他们给出的SPI底层驱动,我整个人傻眼了,我只能说&#x…...
Windows11 新机开荒(二)电脑优化设置
目录 前言: 一、注册微软账号绑定权益 二、此电脑 桌面图标 三、系统分盘及默认存储位置更改 3.1 系统分盘 3.2 默认存储位置更改 四、精简任务栏 总结: 前言: 本文承接上一篇 新机开荒(一) 上一篇文章地址&…...
关于deepseek R1模型分布式推理效率分析
1、引言 DeepSeek R1 采用了混合专家(Mixture of Experts,MoE)架构,包含多个专家子网络,并通过一个门控机制动态地激活最相关的专家来处理特定的任务 。DeepSeek R1 总共有 6710 亿个参数,但在每个前向传播…...
揭秘大数据 | 9、大数据从何而来?
在科技发展史上,恐怕没有任何一种新生事物深入人心的速度堪比大数据。 如果把2012年作为数据量爆发性增长的第一年,那么短短数年,大数据就红遍街头巷尾——从工业界到商业界、学术界,所有的行业都经受了大数据的洗礼。从技术的迭…...
使用Dependency Walker和Beyond Compare快速排查dll动态库损坏或被篡改的问题
目录 1、问题描述 2、用Dependency Walker工具打开qr.dll库,查看库与库的依赖关系以及接口调用情况,定位问题 3、使用Beyond Compare工具比较一下正常的msvcr100d.dll和问题msvcr100d.dll的差异 4、最后 C软件异常排查从入门到精通系列教程ÿ…...
3.14学习总结 排序算法
插入排序: 1.直接插入排序 维护一个有序区,把元素一个个插入有序区的适当位置,直到所有元素都有序为止。 for (int i 0;i < n - 1;i) {//升序int end i;int temp k[end 1];while (end > 0) {if (temp < k[end]) {k[end 1] …...
Hadoop、Spark、Flink Shuffle对比
一、Hadoop的shuffle 前置知识: Map任务的数量由Hadoop框架自动计算,等于分片数量,等于输入文件总大小 / 分片大小,分片大小为HDFS默认值128M,可调 Reduce任务数由用户在作业提交时通过Job.setNumReduceTasks(int)设…...
本地部署 RAGFlow - 修改默认端口
本地部署 RAGFlow - 修改默认端口 1. 前提条件2. 部署 RAGFlow 1. 前提条件 确保 vm.max_map_count 不小于 262144: 如需确认 vm.max_map_count 的大小: sysctl vm.max_map_count如果 vm.max_map_count 的值小于 262144,可以进行重置&…...
repo init 错误 Permission denied (publickey)
一、已经生成ssh-key并设置到gerrit上 二、已经设置.gitconfig (此步骤是公司要求,设置gerrit地址为一个别名之类的,有的公司不需要) 然后出现下面的错误,最后发现忘记设置git的用户名和邮箱 1. git config --globa…...
Django settings.py 文件全解析
本篇详细介绍 Django settings.py 文件各个配置项的教程,涵盖核心配置项的作用及最佳实践 一、基础配置 1. BASE_DIR BASE_DIR Path(__file__).resolve().parent.parent作用:项目根目录路径,用于构建其他路径(如模板、静态…...
TSB - AD 解读 — 迈向可靠、透明的 TSAD 任务
目录 一 文章动机 二 TSAD 领域内的两类缺陷 三 数据集的构建 四 实验结果及结论 项目宣传链接:TSB-AD 代码链接: TheDatumOrg/TSB-AD: TSB-AD: Towards A Reliable Time-Series Anomaly Detection Benchmark 原作者解读:NeurIPS 2…...
下载 CSS 文件阻塞,会阻塞构建 DOM 树吗?会阻塞页面的显示吗?
下载 CSS 文件会对页面的渲染过程产生影响,具体是否阻塞 DOM 树的构建和页面的显示,取决于浏览器的渲染机制。 1. CSS 文件下载是否会阻塞 DOM 树的构建? 一般情况下,CSS 文件下载不会阻塞 DOM 树的构建: DOM 树的构建…...
6个月的Go语言学习甘特图路线图 从零基础到项目实战
以下是为期6个月的Go语言学习甘特图(2025年4月-2025年10月),包含详细阶段划分、对应资源及项目产出文档说明: #mermaid-svg-yQbkZCpCAXv6iXKC {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fi…...
论文阅读:2023-arxiv Can AI-Generated Text be Reliably Detected?
总目录 大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328 文章目录 Abstract(摘要)1 Introduction(引言)Conclusion(结论) Can AI-Generated Text be Reliably D…...
查看IP地址/Ping 命令
目录 Windows Linux macOS Ping 命令 Windows 使用终端: 按下 Win R 键,打开“运行”对话框,输入 cmd 并按 Enter。 在命令提示符中输入 ipconfig,按 Enter。系统会显示网络适配器的详细信息,包括 IPv4 地址、子…...
Language Models are Few-Shot Learners,GPT-3详细讲解
GPT的训练范式:预训练Fine-Tuning GPT2的训练范式:预训练Prompt predict (zero-shot learning) GPT3的训练范式:预训练Prompt predict (few-shot learning) GPT2的性能太差,新意高&…...
鸿蒙编译框架@ohos/hvigor FileUtil用法
ohos/hvigor FileUtil用法 在鸿蒙(HarmonyOS)开发中,ohos/hvigor 的 FileUtil 是用于文件操作的实用工具类,提供了跨平台的文件读写、路径处理等常用方法。以下是其核心用法和示例: 一、核心方法说明 方法名功能描…...
Hoppscotch 开源API 开发工具
Hoppscotch 是一个开源的 API 开发工具,旨在为开发者提供一个轻量级、快速且功能丰富的 API 开发和调试平台。以下是对其主要特性和功能的详细介绍: 1. 轻量级与高效 Hoppscotch 采用简约的 UI 设计,注重易用性和高效性。它支持实时发送请求…...
Infura 简介
文章目录 Infura 简介Infura 的主要功能Infura 的替代方案(类似服务)AlchemyQuickNodeAnkrMoralisPocket Network 什么时候选择 Infura? Infura 简介 Infura 是一个 区块链基础设施即服务(BaaS, Blockchain as a Service…...
【芯片验证】面试题·对深度为60的数组进行复杂约束的技巧
朋友发给我的芯片验证笔试题,觉得很有意思,和大家分享一下。 面试题目 class A中一个长度为60的随机数组rand int arr[60],如何写约束使得: 1.每个元素的值都在(0,100]之间,且互不相等; 2.最少有三个元素满足勾股数要求,比如数组中包含3,4,5三个点; 请以解约束最快…...
Manus “Less structure,More intelligence ”独行云端处理器
根据市场调研机构Statista数据显示,全球的AR/AR的市场规模预计目前将达到2500亿美元,Manus作为VR手套领域的领军企业,足以颠覆你的认知。本篇文章将带你解读Manus产品,针对用户提出的种种问题,Manus又将如何解决且让使…...
【再读】R1-Onevision通过跨模态形式化为复杂多模态推理任务提供了系统性解决方案
R1-Onevision:跨模态形式化驱动的多模态推理技术突破,R1-Onevision通过跨模态形式化、双阶段训练和教育级基准测试,为多模态推理树立了新标杆。其技术创新不仅提升了模型在复杂任务中的表现,更重要的是为行业提供了一种可解释、可迁移的多模态处理范式。随着形式化方法的不断…...
Mysql-经典实战案例(3): pt-archiver 实现 MySQL 千万级大表分库分表(上)
零基础实战:使用 pt-archiver 实现 MySQL 千万级大表的水平分表(Hash分片) 本文适合人群:MySQL新手、想低成本实践数据库分表的开发者 环境要求:MySQL 5.7、Linux系统(建议CentOS/Ubuntu) 你将学…...
使用JSON存储数据的场景
Json 作为一种通用的数据格式,由于其结构灵活、可拓展等特点,在某些场景下我们也会直接将数据以 Json 格式存储到数据库中。 本文将探讨在开发中使用 JSON 存储数据的常见场景,并通过具体的实例帮助大家更好地理解其应用。 1. 半结构化数据…...
文生图网站推荐(2025.3)
以下是2024-2025年期间值得推荐的文生图网站,综合了免费性、中文友好度、操作便捷性及功能特色,涵盖不同用户需求: 一、国内主流平台 通义万相(阿里云) 特点:每日免费50次生成,模型和风格多样&a…...
网页制作代码html制作一个网页模板
制作一个简单而实用的网页模板:HTML基础入门 在数字时代,网页已成为信息展示和交流的重要平台。HTML(HyperText Markup Language)作为网页制作的基础语言,为开发者提供了构建网页的基本框架。本文将带你了解如何使用H…...
AI视觉测试工具实战评测:以Applitools为例的技术解析与行业应用
在数字化转型的浪潮中,软件界面(UI/UX)的复杂性与迭代速度呈指数级增长。传统的人工视觉测试不仅耗时费力,且难以应对多平台、多分辨率下的界面一致性问题。AI视觉测试工具的出现,通过智能图像识别与自动化对比&#x…...
