当前位置：首页 > news >正文

树莓派4B的测试记录（CPU、FFMPEG）

news 2026/4/25 6:34:06

本文是用来记录树莓派 4B 的一些测试记录。

温度

下面记录中的风扇和大风扇是这样的：

请添加图片描述

为什么要用大风扇呢？因为小风扇在外壳上，气流通过外壳的珊格会有啸叫，声音不大但是很烦人，大风扇没这个问题，并且同样使用树莓派的 USB 进行供电，而且由于树莓派在大硬盘旁边，还能顺道一起散热。

空载情况

情形	温度（摄氏度）
无散热片+无风扇	41.3
有散热片+无风扇	38.9
有散热片+有风扇	36.5
有散热片+有大风扇	29.7

满载情况

情形	温度（摄氏度）
有散热片+无风扇	69.6
有散热片+有风扇	56.9
有散热片+有大风扇	50.6

读取速度

树莓派 4B Micro SD 读写速度均为 45 MB/s，跑不满 UHS-I 的约 100MB/s 的速度（Jeff 测试第五代是可以跑满的）。

CPU性能

使用 Clang 和 ISPC（并行计算）编写的程序来测试 CPU 的一些性能数据。考虑到受写入速度的影响，这里均使用不存储的程序进行测试。

4096x4096 Float64 矩阵计算

如果均拆分 4 块进行并行计算：

设备	串行	并行
树莓派4B（4C4T）	66.12s	51.72s
（对比组）Mac mini 2018 i5（6C6T）	17.76s	6.08s

进程占用内存约 192.8 MB。可以看到树莓派 4B 使用并行计算加上分割任务带来的提升并没有接近预期的 4 倍。

个人猜测是每次处理的块大大超出每个核心的 32kB data L1 cache 的大小了，那么如果单个块更小一些呢？理论上是在16x16上最快，也就是分成 256 块，因为 32kB 单次可以存放的最大 64 位浮点数矩阵是 22x22，16 刚好小于这个值。

下列每个测试是相同的矩阵：

分块（每块大小）	测试1	测试2	测试3	测试4
4(1024x1024)	40s	39s	47s	41s
8（512x512）	56s	47s	55s	48s
16（256x256）	37s	39s	40s	46s
32（128x128）	38s	49s	48s	50s
64（64x64）	45s	49s	45s	42s
128（32x32）	41s	37s	43s	40s
256（16x16）	38s	38s	43s	37s

可以看到虽然不一定每次都是 16x16 最快，但是在多次测试中可以看到，16x16 一定是第一梯队的。这里按40s的话，也就是达到了串行的 1.653 倍，这个值接近 2 倍了。

优化过的矩阵乘法（测浮点性能）

使用优化过的矩阵和算法，然后再进行分块处理。这个测试在某些能达到 70%～90% 的浮点性能，实际情况还得看设备当时的运行状态和系统以及其他配置。

设备	浮点性能（GFLOPS）
树莓派4B	11.91
（对比组）Mac mini 2018 i5	200.03

这里对比组达到了理论性能的 70%（200/288），树莓派比上面一次测试得出的浮点值高了不少。

排序

设备	并行计算+分割任务
树莓派4B（4C4T）	2.45x
（对比组）Mac mini 2018 i5（6C6T）	5.86x

进程占用内存约 192.8 MB。可以看到树莓派 4B 使用并行计算加上分割任务带来的提升并没有接近预期的 4 倍，也是在 2 倍左右。

生成 mandelbrot 图

设备	并行计算+分割任务
树莓派4B（4C4T）	8.58x
（对比组）Mac mini 2018 i5（6C6T）	44.03x
（对比组）Intel E5-2690 v4 x2（28C58T）	130.18x

这里可以看到各个设备的提升均达到了核心数的两倍。

一些想法

证明了 BCM2711 的低缓存（每核心 32kB 数据 + 48kB 指令 L1 cache 和共 1MB L2 cache）导致一旦计算所需的数据稍大一些，那么并行性能就大幅度下降，无法发挥所有核心的性能。

当然我怀疑这也和新系统没有优化完善有关，看看后续会不会好一些。

FFMPEG

有些时候需要对一些视频进行格式转换、转码修复问题等，我用 ffmpeg 比较多，偶尔转换分辨率和裁切有时候用 macOS 自带的也很方便。

这里说明一下测试中的单位x，在使用 ffmpeg 的时候，速度是用类似123x的格式来显示的。这表示当前一秒处理的帧数和视频平均帧数的比值，比如说视频是 24hz 的，那么如果一秒钟处理了48帧，则会显示2x；如果只处理了 12 帧，那么则会显示0.5x。

测试项目：对一个约 950MB 的 FLV 格式的抖音录播进行操作，平均码率约 500K。

转化格式

转换格式最快的办法是直接拷贝流，如下：

$ ffmpeg -i input.mkv -c copy out.mp4

这种格式不会对任何音视频、编码器、码率进行修改，是直接抓流到新的格式里（就是需要注意字幕和音轨的选择）。

树莓派 4 的成绩和对比成绩如下：

设备	速度
树莓派 + Micro SD（45MB/s）	35x
树莓派 + USB NVMe SSD (约 350MB/s)	617x
（对比组）Mac mini 2018 i5（读2400写1200）	2410x

可以看到随着硬盘速度的提升，速度有着巨幅提升。

需要说明一下，上面这个USB SSD 的速度是固态硬盘本身的限制，因为使用的是 BG4，没有内存作为缓冲，那么由于单闪存颗粒加上 TLC 导致使用 USB 外接的时候 IOPS 性能不光难以达到内接（内接会用系统内存作为缓冲），也比不过带内存颗粒缓冲或者多闪存颗粒的其他 SSD。

IOPS 是每秒可读写数，会影响系统的响应速度。

转码

这里模拟平时最简单的命令，码率一般在 1500～3000K：

$ ffmpeg -i in.flv out.mp4

设备	速度
树莓派 + Micro SD（45MB/s）	0.23x
树莓派 + USB NVMe SSD (约 350MB/s)	0.452x
（对比组）Mac mini 2018 i5（读2400写1200）	2.7x

硬件加速转码

在树莓派上使用硬件加速转码需要使用：

ffmpeg -i in.flv -c:v h264_v4l2m2m -b:v 1500k out.mp4

这里的1500k不是视频本身的码率，而是上一节中自动转码的码率，这样可以作为对比。我也测了一下其他码率，速度差不多：

设备	速度
树莓派 + Micro SD（45MB/s）	2.1x
树莓派 + USB NVMe SSD (约 350MB/s)	2.36x
（对比组）Mac mini 2018 i5 UHD 630（读2400写1200）	4.36x

可以看到树莓派 4B 在使用硬件加速之后，速度提升了 6～10 倍。不过需要注意一点，h264_v4l2m2m是有 CPU 占用率的，如果你在跑其他程序，那么性能会降低一些。

为什么还是买了树莓派 4

最后记录一下为什么虽然树莓派 5 已经发布了，但是我又重新买了台树莓派 4B，因为考虑到几点：

功耗涨了 10 W，不光充电器得特別买（4B直接用现在的很多手机充电器都行，甚至显示器上的充电接口都可以），如果想无散热无风扇使用不太可能（Jeff 测试结果证明了这一点）。
虽然树莓派 5 的性能提升了 2～3 倍，但是实际价格也涨了不少。可能你会说官方售价不过涨了 5 美元哎，也不多啊。但是需要考虑到用的 5V5A 充电器目前并不是很多，而且必须用散热器。那么根据官方指定商家的过期链接的价格（4GB 550）再加上官方充电器（69）和散热器（99），也就是七百（不用官方充电器便宜 50），而且这个价格我能买到两倍性能并且直接有 M.2 + SATA 接口的 N100 主机了。
我要用来调试树莓派 Pico，这个在树莓派上刚好有调试接口，这也不要求什么性能。
树莓派 5 刚出可能会有一些问题，我想长期使用，不想当小白鼠，现在树莓派 4B 卖出了至少 300 万台，出现严重问题的可能性不大。
说实话我上次买树莓派 4B 就没用满。树莓派 5 也没有公开说支不支持 OpenCL，4B 是不能用的。
最关键的是，树莓派 5 在国内还没开始卖呢，而且双十一补贴树莓派 4B 4GB 裸板只要330，这还要啥自行车。

希望能帮到有需要的人～

树莓派4B的测试记录（CPU、FFMPEG）

本文是用来记录树莓派 4B 的一些测试记录。温度下面记录中的风扇和大风扇是这样的： 为什么要用大风扇呢？因为小风扇在外壳上，气流通过外壳的珊格会有啸叫，声音不大但是很烦人，大风扇没这个问题，并且同样…...

编程日记 2023/11/10 7:05:04

物联网AI MicroPython学习之语法二进制与ASCII转换

学物联网，来万物简单IoT物联网！！ ubinascii 介绍 ubinascii模块实现了二进制数据与各种ASCII编码之间的转换。接口说明 a2b_base64 - 解码base64编码的数据函数原型：ubinascii.a2b_base64(data)注意事项： 在解码…...

编程日记 2023/11/10 7:04:04

学之思项目的搭建部署打jar包失败的解决方法

学之思系统介绍部署java环境安装maven安装node.js前端打包工具命令npmGit命令获取源代码安装配置mysql前端打包打包jar包服务上线!!!打jar包失败的解决方法学之思系统介绍学之思开源考试系统是一款 java vue 的前后端不分离的考试系统。主要优点是开发、部署简单快捷、界面…...

编程日记 2023/11/10 7:03:02

[100天算法】-定长子串中元音的最大数目（day 67）

题目描述给你字符串 s 和整数 k 。请返回字符串 s 中长度为 k 的单个子字符串中可能包含的最大元音字母数。英文中的元音字母为（a, e, i, o, u）。示例 1：输入：s "abciiidef", k 3 输出：3 解释&#xf…...

编程日记 2023/11/10 7:02:01

Elastic Observability 8.11：ES|QL、APM 中的通用分析和增强的 SLOs

作者：Tom Grabowski, Katrin Freihofner, Israel Ogbole Elastic Observability 8.11 引入了 ES|QL for Observability（技术预览版）、Universal ProfilingTM 和 Elastic APM 集成，以及针对 Elastic Observability 的新 SLO &#…...

编程日记 2023/11/10 7:01:01

TexGen简单模型对应inp文件简单梳理-2

模型默认最简单的编织复材，编辑材料属性时发现基体属性设置正常，各向同性材料，但是纱线的材料属性却没有弹性性能的设置。导出inp文件后，导入ABAQUS中其实可以看到有两种材料，纱线也是有属性的。 ABAQUS中修改属性的…...

编程日记 2023/11/10 6:59:58

VUE获取当前日期的周日和周六

<template><div><div click"handleLast()">上一周</div><div click"handleNext()">下一周</div><el-calendarref"monChild"v-model"value":first-day-of-week"7":range"[sta…...

编程日记 2023/11/10 6:57:56

K8S篇之k8s containerd模式fail to pull image certificate signed by unknown authority

"k8s containerd模式fail to pull image certificate signed by unknown authority"的问题解决方案：您有两个选择：配置证书或禁用证书验证。配置证书：您可以为 containerd 配置证书，使其信任由未知机构签名的证书。具…...

编程日记 2023/11/10 6:56:55

算法进阶指南图论最优贸易

最优贸易题目描述 C C C 国有 n n n 个大城市和 m m m 条道路，每条道路连接这 n n n 个城市中的某两个城市。任意两个城市之间最多只有一条道路直接相连。这 m m m 条道路中有一部分为单向通行的道路，一部分为双向通行的道路，双向通行的…...

编程日记 2023/11/10 6:55:53

【Android】Debug时禁用主线程ANR限制

ANR全称Application Not Response，指主线程超过5s无响应，应用会自动退出由于这个线程，如果我们给主线程加了断点，就会触发ANR，导致调试时应用退出这样调试起来会非常麻烦，其实对于Debug应用&#xff0c…...

编程日记 2023/11/10 6:53:50

P6入门：项目初始化1-项目详情介绍

前言使用项目详细信息查看和编辑有关所选项目的详细信息，在项目创建完成后，初始化项目是一项非常重要的工作，涉及需要设置的内容包括项目名，ID,责任人，日历，预算，资金，分类码等等&…...

编程日记 2023/11/10 6:52:49

前置条件 public class Shop {private final String name;private final Random random;public Shop(String name) {this.name name;random new Random(name.charAt(0) * name.charAt(1) * name.charAt(2));}public double getPrice(String product) {return calculatePrice…...

编程日记 2023/11/10 6:51:48

温度