当前位置: 首页 > article >正文

回头看,FPGA+RK3576方案的功耗性能优势

作者:Hello,Panda

各位朋友,大家好,熊猫君这次开个倒车,在这个广泛使用Xilinx(Altera)高端SoC的时代,分享一个“FPGA+ARM”实现的低功耗高性能传统方案。

图1 瑞芯微RK3576电路

当前,包含FPGA和硬核处理器的SoC主要集中于以下几个系列:

1、Xilinx(现在的AMD):(1)高端的VerSal系列,集成超大容量的FPGA和双核Cortex-A72/Cortex-A78E处理器;(2)中端的ZYNQ MPSoC,集成中等容量的FPGA和双核或四核的Cortex-A53处理器;(3)通用的ZYNQ-7000系列SoC,集成一般容量的FPGA和单/双核的Cortex-A9处理器。

2、Altera(现在的Intel可编程逻辑业务):(1)高端的Agilex和Stratix 10系列SoC均采用四核Cortex-A53处理和超大规模的FPGA;(2)通用的Arria 10和Cyclone V系列SoC均采用单/双/四核的 Cortex-A9处理器。

3、其他,包括高云、安陆等国内厂家,均有提供集成FPGA和硬核处理器的SoC。硬核处理器大多为ARM Cortex-M3/M4(搭配中小规模FPGA使用)或RISC-V处理(搭配较大规模的FPGA使用),主要还是适合在一些不太复杂的控制领域使用。

通过以上总结可以看到,Xilinx和Altera的大规模和超大规模SoC主要用于验证AISC设计或原理样机验证,不大可能用到量产工业或消费产品中去。中低端的FPGA处理器性能又普遍偏弱,在一些图形图像中的处理能力偏弱,功耗也不低,形成优势产品的难度较大。

在一些手持设备、电池供电的系统或对发热敏感的高性能图像应用系统,常常需要在功耗、面积、性能上找到一个最优解。对一个图像系统而言,常常需要FPGA来做图像采集、控制和其它接口扩展,处理一些适合Pipeline的图像或图像算法等等,同时又需要ARM或DSP做一些较为复杂的应用算法、图像效果或数据库等等。这种情况下,封装尺寸小的“低功耗FPGA+低功耗ARM SoC”分立方案反而成了最优解。

这里一个最典型的应用就是红外热成像领域,具有100%指征:

(1)非制冷的手持设备和电池供电设备:对热量敏感,机器内部发热会严重影响成像效果,带来灵敏度降低(NETD),热辐射“锅盖”现象等;对续航敏感,无论是测温设备、穿戴设备还是仪器仪表,都要求待机时间越长越好,因此对低功耗要求高;对计算要求较高,这些机器里面通常需要运行一些图像处理类的算法外,还需要运行图像融合,检测、识别、跟踪等算法或是较为复杂的图形界面、样本数据库等等,所以这些设备的计算性能要求绝对不低。

当然,也有部分非制冷探测器应用集成封装FPGA,如国内某头部红外制造商堆栈封装了易灵思Ti60 FPGA;

(2)制冷型的红外设备:此类设备主要用于仪器和特殊领域使用,虽然对续航时间没有要求,但其对发热和性能的要求同样高,一句话就是:性能尽量高,发热要小。

一、低功耗FPGA

现在咱们聊一聊低功耗的FPGA。咱们暂且分为国产和进口两大类。

(1)进口低功耗FPGA:说到功耗低、不发热,性能又比较好的,必须是Lattice,尤其是其Crosslink-NX系列(包括该系列的国内马甲芯片),可以说是排在低功耗性能器件的首位;其次是MicroChip的,功耗是真的低,但是容量和性能也是真的低;再次就是Altera的Max10系列,内部集成了Flash和ADC等,功耗性能比上也还是很不错的(缺点是没有mipi核,40k以上逻辑没有小封装)。综上:进口低功耗FPGA首选Lattice Crosslink-NX 40K逻辑器件,压榨其资源(尽可能能用的资源都用上,不含PCIe器件)平均实测功耗≤500mW,直观的用手去摸芯片表面,基本感受不到发热(测试FPGA型号为LIFCL-40-7MG121I)。

图2  :Lattice LIFCL-40电路图

(2)国产低功耗FPGA:严格意义上,国产器件没有专门的低功耗设计,其功耗由流片工艺决定。高云小蜜蜂、智多晶、京微齐力、紫光同创、安陆等等功耗较低的器件普遍容量小,接口和性能上也差事儿,能做的事情不多。目前来讲,可用的主要是高云的GW5A和易灵思的TI60(集成HyperRAM和QSPI Flash)两个系列的器件上。从实测效果上看,选用GW5AT-60 MG132封装和Ti60 100pin封装两颗器件(逻辑量均为60k),运行相同功能的逻辑,用手接触芯片表面明显发热,整体功耗也在1200mW以上。在对国产化要求有硬性指标的应用场合,这个大概是最佳选项。

图3 高云GW5AT-LV60UG225电路图

图4 易灵思Ti60电路图

下面是Lattice、高云、易灵思三家器件的对照表:

二、低功耗SoC

SoC的功耗直接与其制程和性能相关。咱们这里不讨论国外的如英伟达、高通、TI之类的,主要还是选国产,按照其能打程度,主要还是海思、瑞芯微和全志三大家,但是这三家又各有特点:

(1)海思SoC主要针对图像处理,ISP性能强,但是自其恢复供货后,受制造工艺限制,功耗高了不少;

(2)瑞芯微主要针对通用处理,其ISP性能较弱,但是通用计算能力强,接口也很丰富;

(3)全志比较低调,就是纯ARM SoC,没有较强的图像图形处理能力,且没有工业和车载等级器件。

从以上三家的情况来看,“FPGA+ARM”方案,ARM SoC主要承担的是应用处理算法和图形、数据处理能力,因此选用瑞芯微器件会更加合适。

下表是RK3576、RK3588和海思Hi3559AV100参数对照表。

实际上,低功耗视觉应用场景图像的分辨率不会太大,对应的图像链路的处理负载和内存消耗不会太大,对应的输入输出接口和Codec的功耗也会较小。其功耗消耗主要是运行前述的复杂算法。

三、案例

以下是一个常规的双光融合设备的框图,如前面内容所述,FPGA和RK3576各自分工承担计算负载,如下图5所示。像这样的一个典型应用方案,处理板上的功耗约4瓦(常温25°C时,不含屏)。

图5  FPGA+RK3576双光融合方案框图

今天就聊这么多,分享结束,感谢大家阅读,希望能起到抛砖引玉的作用。

相关文章:

回头看,FPGA+RK3576方案的功耗性能优势

作者:Hello,Panda 各位朋友,大家好,熊猫君这次开个倒车,在这个广泛使用Xilinx(Altera)高端SoC的时代,分享一个“FPGAARM”实现的低功耗高性能传统方案。 图1 瑞芯微RK3576电路 当前&#xff0c…...

csharp ef入门

全局安装 dotnet ef 命令行工具 要 全局安装 dotnet ef 命令行工具(即在任何项目目录下都能使用 dotnet ef 命令),请按以下步骤操作: ✅ 全局安装步骤(推荐) 在终端中运行以下命令: bash复制…...

长短期记忆网络:从理论到创新应用的深度剖析

一、引言 1.1 研究背景 深度学习在人工智能领域的发展可谓突飞猛进,而长短期记忆网络(LSTM)在其中占据着至关重要的地位。随着数据量的不断增长和对时序数据处理需求的增加,传统的神经网络在处理长序列数据时面临着梯度消失和梯…...

LiveNVR 直播流拉转:Onvif/RTSP/RTMP/FLV/HLS 支持海康宇视天地 SDK 接入-视频广场页面集成与视频播放说明

LiveNVR直播流拉转:Onvif/RTSP/RTMP/FLV/HLS支持海康宇视天地SDK接入-视频广场页面集成与视频播放说明 一、视频页面集成1.1 关闭接口鉴权1.2 视频广场页面集成1.2.1 隐藏菜单栏1.2.2 隐藏播放页面分享链接 1.3 其它页面集成 二、播放分享页面集成2.1 获取 iframe 代…...

MySQL索引与性能优化入门:让查询提速的秘密武器【MySQL系列】

本文将深入讲解 MySQL 索引的底层原理、常见类型、使用技巧,并结合 EXPLAIN 工具分析查询执行计划,配合慢查询日志识别瓶颈,逐步建立起系统的 MySQL 查询优化知识体系。适合有一定基础、希望在数据量增长或面试中脱颖而出的开发者阅读。 一、…...

进程间通信IV System V 系列(linux)

目录 消息队列 原理 操作 补充概念 信号量 (原子性计数器) 原理 操作 (和共享内存相似) 总结 小知识 消息队列 原理 在内核中建立一个队列,进程可以相互进行通信,通过队列进行IPC,就是进程之间发送带类型的数据块。 操作 接口和共享…...

设计模式——建造者设计模式(创建型)

摘要 本文详细介绍了建造者设计模式,这是一种创建型设计模式,旨在将复杂对象的构建过程与其表示分离,便于创建不同表示。文中阐述了其设计意图,如隐藏创建细节、提升代码可读性和可维护性,并通过构建电脑的示例加以说…...

AWS WebRTC:获取ICE服务地址(part 3):STUN服务和TURN服务的作用

STUN服务和TURN服务的作用: 服务全称作用是否中继流量适用场景STUNSession Traversal Utilities for NAT 协助设备发现自己的公网地址(srflx candidate) ❌ 不中继,仅辅助NAT 穿透成功时使用TURNTraversal Using Relays around N…...

使用Yolov8 训练交通标志数据集:TT100K数据集划分

使用Yolov8 训练交通标志数据集:TT100K数据集划分(一) 一、数据集下载二、划分数据集三、目录放置 一、数据集下载 官方网址:TT100K 数据集对比 源码如下: def classes(filedir):with open(filedir) as f:classes …...

NLP学习路线图(十三):正则表达式

在自然语言处理(NLP)的浩瀚宇宙中,原始文本数据如同未经雕琢的璞玉。而文本预处理,尤其是其中至关重要的正则表达式技术,正是将这块璞玉转化为精美玉器的核心工具集。本文将深入探讨正则表达式在NLP文本预处理中的原理…...

[VMM]现代 CPU 中用于加速多级页表查找的Page‐Table Entry原理

现代 CPU 中用于加速多级页表查找的Page‐Table Entry原理 摘要:以下从背景、结构、查找流程、一致性与性能影响等方面,详细介绍现代 CPU 中用于加速多级页表查找的 Page-Walk Cache(也称 Walker Cache 或 Page‐Table Entry Cache&#xff0…...

javaweb-maven以及http协议

1.maven坐标: 坐标是资源的唯一标识,通过该坐标可以唯一定位资源位置; 2.坐标的组成: groupId:定义当前项目隶书的组织名称; artifactId:定义当前maven项目名称 version:定义项目版本 3.依…...

华为OD机试真题—— 最少数量线段覆盖/多线段数据压缩(2025A卷:100分)Java/python/JavaScript/C++/C语言/GO六种最佳实现

2025 A卷 100分 题型 本文涵盖详细的问题分析、解题思路、代码实现、代码详解、测试用例以及综合分析; 并提供Java、python、JavaScript、C++、C语言、GO六种语言的最佳实现方式! 2025华为OD真题目录+全流程解析/备考攻略/经验分享 华为OD机试真题《最少数量线段覆盖/多线段数…...

C语言创意编程:用趣味实例玩转基础语法(2)

文章目录 0. 前言1. 📊 动态条形图1.1 程序效果展示1.2 完整代码解析1.3 关键技术详解1.3.1 Unicode字符应用1.3.2 函数封装思想1.3.3 输入处理1.3.4 跨平台考虑 2. 🔤 字母金字塔2.1 程序效果展示2.2 完整代码解析2.3 关键技术详解2.3.1 嵌套循环结构2.…...

关于近期中国移动民用家庭网络,新增的UDP网络限制。

在近期中国移动在全国一定范围普及新的打击 “PCDN、P2P、HY/HY2” 等流氓网络应用的技术方案,并接入在 “省/州” 的边界网关路由上。 根据遥测数据的具体研究分析,且本人曾非常生气的详细质询过,移动城域网管理人员,可以确认该技…...

OpenCV CUDA模块图像处理------颜色空间处理之GPU 上对两张带有 Alpha 通道的图像进行合成操作函数alphaComp()

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 该函数用于在 GPU 上对两张带有 Alpha 通道的图像进行合成操作。支持多种常见的 Alpha 合成模式(Porter-Duff 合成规则)&…...

OpenWebUI(1)源码学习构建

1. 前言 通过docker镜像拉取安装就不介绍了,官方的命令很多。本节主要撸一撸源码,所以,本地构建 2. 技术框架和启动环境 后端python,前端svelte 环境要求:python > 3.11 ,Node.js > 20.10 3. 源…...

npm error Cannot find module ‘negotiator‘ 的处理

本想运行npm create vuelatest,但提示: npm error code MODULE_NOT_FOUND npm error Cannot find module negotiator npm error Require stack: npm error - C:\Users\Administrator\AppData\Roaming\nvm\v18.16.1\node_modules\npm\node_modules\tuf-j…...

爬虫入门指南-某专利网站的专利数据查询并存储

免责声明 本教程仅用于教育目的,演示如何合法获取公开专利数据。在实际操作前,请务必: 1. 仔细阅读目标网站的robots.txt文件和服务条款 2. 控制请求频率,避免对服务器造成负担 3. 仅获取和使用公开数据 4. 不用于商业用途或…...

SQL(Database Modifications)

目录 Insertion Specifying Attributes in INSERT Adding Default Values(缺省值) Inserting Many Tuples Creating a Table Using the SELECT INTO Statement Deletion Example: Deletion Semantics of Deletion Updates Example: Update Sev…...

【android bluetooth 案例分析 04】【Carplay 详解 2】【Carplay 连接之手机主动连车机】

1. 背景 在【android bluetooth 案例分析 04】【Carplay 详解 1】【CarPlay 在车机侧的蓝牙通信原理与角色划分详解】中我们从整理上介绍了车机中 carplay 相关基础概念。 本节 将详细分析 iphone手机主动 连接 车机carplay 这一过程。 先回顾一下 上一节, carpla…...

maven离线将jar包导入到本地仓库中

想将本地的 jnetpcap.jar 包安装到 Maven 的本地仓库中,以便在项目中通过如下依赖方式引用。 <dependency><groupId>org.jnetpcap</groupId><artifactId>jnetpcap...

【仿muduo库实现并发服务器】实现时间轮定时器

实现时间轮定时器 1.时间轮定时器原理2.项目中实现目的3.实现功能3.1构造定时任务类3.2构造时间轮定时器每秒钟往后移动添加定时任务刷新定时任务取消定时任务 4.完整代码 1.时间轮定时器原理 时间轮定时器的原理类似于时钟&#xff0c;比如现在12点&#xff0c;定一个3点的闹…...

Conda更换镜像源教程:加速Python包下载

Conda更换镜像源教程&#xff1a;加速Python包下载 为什么要更换conda镜像源&#xff1f; Conda作为Python的包管理和环境管理工具&#xff0c;默认使用的是国外镜像源&#xff0c;在国内下载速度往往较慢。通过更换为国内镜像源&#xff0c;可以显著提高包下载速度&#xff…...

蓝桥杯 盗墓分赃2

原题目链接 问题描述 在一个探险者的团队中&#xff0c;小明和小红是合作的盗墓贼。 他们成功盗取了一座古墓中的宝藏&#xff0c;包括 n 件不同重量的珍贵文物和黄金&#xff0c;第 i 件宝藏的重量为 ai。 现在&#xff0c;他们希望公平地分配这些宝藏&#xff0c;使得小明…...

深度解读 Qwen3 大语言模型的关键技术

一、模型架构设计 Qwen3 延续了当前主流大型语言模型的 Transformer 架构,并在此基础上进行了多项增强设计,包含特殊的 Transformer 变体、位置编码机制改进、混合专家 (MoE) 技术引入,以及支持多模态和双重思考模式的新特性。 1. Transformer 基础架构与增强 基础架构:…...

使用 mysqldump 获取 MySQL 表的完整创建 DDL

要获取 MySQL 中某个表的完整创建 DDL&#xff08;仅结构&#xff0c;不含数据&#xff09;&#xff0c;可以使用 mysqldump 工具的以下命令&#xff1a; 基本命令格式 bash mysqldump -h [主机名] -u [用户名] -p --no-data --single-transaction --routines --triggers --…...

day15 leetcode-hot100-28(链表7)

2. 两数相加 - 力扣&#xff08;LeetCode&#xff09; 1.模拟 思路 最核心的一点就是将两个链表模拟为等长&#xff0c;不足的假设为0&#xff1b; &#xff08;1&#xff09;设置一个新链表newl来代表相加结果。 &#xff08;2&#xff09;链表1与链表2相加&#xff0c;具…...

阿里云云效对接SDK获取流水线制品

参考文档&#xff1a; API旧版 企业令牌 https://help.aliyun.com/zh/yunxiao/developer-reference/api-reference API新版 个人令牌 https://help.aliyun.com/zh/yunxiao/developer-reference/api-reference-standard-proprietary API 个人令牌 https://www.alibabacloud.com…...

Qt 相关 编译流程及交叉编译 部署所遇到的问题总结-持续更新

准备环境和工具 1、主机环境 ubuntu20 2、交叉编译器 gcc-linaro-6.3.1…arm-linux-gnuebihf 3、QT5源码包qt-5.11.3_sources 下载qt-5.11.3的包&#xff0c;自己想办法下载 网盘啥的 都ok&#xff0c;再访问下载目录就可以显示了。 Index of /archive/qt 4、依赖库安装 sudo …...