当前位置：首页 > news >正文

Benchmark学习笔记

news 2026/2/9 14:03:10

小记一篇Benchmark的学习笔记

1.什么是benchmark

在维基百科中，是这样子讲的

“As computer architecture advanced, it became more difficult to compare the performance of various computer systems simply by looking at their specifications.Therefore, tests were developed that allowed comparison of different architectures.”

大致意思就是，随着计算机体系结构的进步，我们无法再简简单单的从他们的特性去比较计算机系统的性能，所以就诞生了我们今天的主角 `Benchmark` !!

Benchmark : "基准测试" 是一种用于衡量和评估系统性能的方法。在计算机领域，它通常指的是通过运行一系列标准化的测试来评估硬件或软件的性能。基准测试可以帮助人们比较不同系统、不同组件或不同配置之间的性能差异！！！

其实，用自己的话来说就是：

通过相应的工具，手段，对硬件组件，软件应用程序如CPU性能、内存带宽、硬盘读写速度等单个组件或整个系统进行测试，并且将多次测量得到的结果用于性能的评估和比较，优化和调整，成为日后产品上市的决策支持等！！

下面，我们就来详细的讲解一下Benchmark的过程！！

2.确认测试的目标

对于每一次测试，我们都要选择对应的目标，这样才便于我们后续的数据分析和对比

如果目标是一个数据库，那么就可以从以下角度出发

查询性能：就拿mysql为例子，像这种查询遇到数据量大的，可以通过记录查询的执行时间或者查询的吞吐量来评估
并发连接数 ：在现实生活中，我们可能会遇到大量用户同时对数据库进行查询，那么我们通过增加并发的数据库连接数，并观察数据库的响应时间和系统资源利用率来评估。
数据插入和更新性能：在sql注入中，有一些服务器会对User_Agent Cookie Refer头进行存储，那么就会用到mysql里面的 update 或者insert，那么，我们就可以观察插入和更新大量数据时的性能表现，包括单条数据的插入/更新性能和批量数据的插入/更新性能

如果他是一个网络服务系统，那么我们就可以从以下角度出发

响应时间 :用户在对服务其发送请求，然后经过服务器的处理，再返回给用户，这期间需要的时间就是响应时间我们通过记录这些时间，可以评估整个请求-响应周期的性能表现。
吞吐量：吞吐量可以表示为每秒处理的请求数量或每秒传输的数据量，它反映了系统的处理能力和性能瓶颈。
并发连接数：我们可以通过一些测试软件，如jmeter等工具，在一瞬间建立多并发连接数量，用来模拟在某一时刻的大量用户涌入的情景，然后通过观察系统的响应时间和资源利用率，可以评估系统的并发性能和资源消耗情况
稳定性和可靠性 ，在上面建立多并发的基础上我们还可以通过观察系统的稳定性和异常处理能力，可以评估系统在各种条件下的表现

3.选择合理的测试工具

还是拿上面的两个测试目标来举例子

网络服务系统

Apache JMeter：Apache JMeter是一款功能强大的开源性能测试工具，主要用于测试各种类型的网络服务系统，包括Web应用程序、Web服务、数据库服务器等。它支持多线程测试、分布式测试、图形化测试结果展示等功能，非常适合进行负载测试和压力测试。
这个工具经常用来压力测试
Gatling：Gatling是一款基于Scala语言开发的现代化性能测试工具，特别适用于高并发场景下的性能测试。它采用基于DSL（领域特定语言）的方式进行测试脚本编写，支持使用Scala语言进行自定义脚本开发，具有良好的可扩展性和灵活性。
Wrk：Wrk是一款简单而强大的HTTP性能测试工具，适用于对HTTP服务进行高并发的压力测试。它采用多线程和非阻塞I/O的方式进行测试，并能够生成详细的测试报告和统计信息。

相信大家都发现了，只要是网络服务系统，压测它的工具一般都多并发，多线程的压力测试工具

数据库

SysBench：SysBench 是一个跨平台的基准测试工具，支持多种数据库系统，包MySQL、PostgreSQL、MariaDB 等。它可以用于测试数据库的性能、并发连接数、事务处理能力等
HammerDB：HammerDB 是一个开源的基准测试工具，主要用于测试关系型数据库系统，如 Oracle、SQL Server、DB2 等。它提供了丰富的基准测试场景和工具，可以模拟真实的数据库工作负载并评估数据库的性能表现
Percona Toolkit：Percona Toolkit 是一个由 Percona 公司提供的一套 MySQL 和 MongoDB 管理工具，其中包括一些基准测试工具，如 pt-query-digest、pt-upgrade 等，可以用于评估和优化数据库的性能。

4.准备测试环境

这个也是非常重要的一步，我们需要保测试环境的稳定性和一致性，包括硬件配置、操作系统版本、驱动程序版本等。关闭不必要的后台任务和服务，以确保测试结果的准确性。

5.执行基准测试

当变量都设置好之后，现在开始进行测试。从基准线开始进行测试(已知的起点)，并有系统地调整服务器设置。每个测试序列都会有一个结果，记录结果以便以后引用。在这种情况下，一个测试序列可看做是一次硬件设置更改。每应用一次新的设置，都必须重新进行测试并记录结果。一旦有足够的运行周期，工程师应该有一份完整的数据以完成他们的推论。

6.收集测试执行结果

其中包括各种性能指标的数据，如响应时间、吞吐量、并发连接数等。使用工具提供的报告功能或自定义脚本来自动化数据收集过程。

7.分析和比较结果

在这个步骤中，我们需要进行以下步骤

总体性能评估：首先，对系统的总体性能进行评估。这包括查看各项性能指标的平均值、中位数、标准差等统计数据，以了解系统的整体表现。
识别性能瓶颈：通过分析测试结果，识别系统性能的瓶颈所在。这可能包括响应时间较长的操作、吞吐量不足的任务、并发连接数过高导致的系统资源耗尽等。通过识别性能瓶颈，可以确定优化的重点和方向。
比较不同场景下的性能数据：如果进行了多个测试场景的基准测试，需要比较不同场景下的性能数据。这可以帮助确定系统在不同条件下的性能表现，并找出最佳的配置和参数组合。
对比不同系统或组件的性能：如果进行了多个系统或组件的基准测试，需要对比它们的性能数据。这可以帮助选择最适合自己需求的系统或组件，并确定哪些系统或组件需要进一步优化。
查找异常数据和趋势：检查测试结果中的异常数据和趋势。这可能包括某些测试任务的性能突然下降或波动、系统资源利用率异常高或异常低等。通过查找异常数据和趋势，可以发现系统中的问题并及时解决。

这个步骤就像计算机取证的分析的重要性一样

通过分析和比较基准测试结果意味着对测试数据进行详细的研究和比较，以便从中获取有用的见解和信息。这个过程的目的是为了理解系统的性能表现，识别潜在的问题或瓶颈，并确定优化的方向。

8.提出优化建议

Benchmark的一个最终的目的，就是提出优化建议

在测试中通常会选择一个或多个基准模型作为比较的标准。这些基准模型可以是已知的、在该任务上表现良好的模型，用来与新的方法进行比较

当然了，除了需要从网上寻求相应的标准来进行对比以外，我们还需要根绝自身的特殊情况（如服务器的运存等条件）进行综合的测试

分析问题原因：针对性能瓶颈和问题，深入分析其根本原因。这可能涉及到系统的架构设计、代码实现、数据库优化、网络配置等方面的问题。通过分析问题原因，可以确定优化的方向和重点。

9.验证和重复测试

你以为做完上面的就完事了吗？？肯定不是！！！

当我们得到了上面的测试和分析结果之后，我们还要去对这些结果进行进一步测试，因为我们不确定时候改进后的参数是否还会符合要求 理由如下：

确认优化效果：优化措施的实施并不总是能立即带来明显的改善。通过验证和重复测试，可以确认优化措施的实际效果是否与预期一致。这有助于确定哪些优化是有效的，哪些需要进一步改进。
评估系统稳定性：优化措施可能会对系统的稳定性产生影响。通过验证和重复测试，可以评估优化措施对系统稳定性的影响，并及时发现和解决潜在的问题，以确保系统的稳定运行。
排除误差和变化：基准测试结果可能受到各种因素的影响，如测试环境的变化、测试工具的误差等。通过重复测试，可以排除这些误差和变化的影响，确保测试结果的可靠性和一致性。
验证优化建议的可行性：重复测试可以验证提出的优化建议的可行性和有效性。如果优化建议在多次测试中都能得到相似的结果，那么说明该建议是可行的，并且对系统性能有实际的改进作用。
持续改进和优化：系统的性能优化是一个持续改进的过程。通过验证和重复测试，可以不断地评估系统的性能，并根据测试结果进行调整和优化，以满足不断变化的需求和挑战。

10.做出最终的建议

通过与第一次的结果进行对比，选出最优的结果，并且根据以下参考，做出建议

数据库优化：

索引优化：评估数据库的索引使用情况，根据查询模式和频率优化索引设计。
查询优化：审查并优化复杂、低效的查询语句，确保查询执行效率高。
表结构优化：评估数据库表结构，合理设计和规划表之间的关系，以及字段的数据类型和长度。
缓存策略优化：考虑使用缓存技术来减轻数据库压力，提高数据访问速度。

网络服务优化：

响应时间优化：优化网络服务的响应时间，包括优化代码、减少网络延迟、使用高效的数据传输协议等。
并发处理优化：评估系统的并发处理能力，优化并发处理策略和线程池配置，提高系统的并发处理能力。
负载均衡优化：考虑使用负载均衡技术来平衡服务器负载，确保系统的稳定性和可靠性。

应用程序优化：

代码优化：审查并优化应用程序的代码，提高代码的执行效率和性能。
内存管理优化：优化内存使用，包括减少内存泄漏、优化内存分配和释放策略等。
异步处理优化：考虑使用异步处理技术来提高系统的并发处理能力和响应速度。

等等.........

Benchmark学习笔记

小记一篇Benchmark的学习笔记 1.什么是benchmark 在维基百科中，是这样子讲的 “As computer architecture advanced, it became more difficult to compare the performance of various computer systems simply by looking at their specifications.Therefore, te…...

编程日记 2024/3/3 2:45:43

Linux中的动静态库

目录一、静态库 （1）静态库的优缺点： （2）Linux下静态库的创建和执行 1.直接编译编辑 2.指定路径和库名 3.用LIBRARY_PATH环境变量来配置路径二、动态库 （1）动态库的优缺点 &#xff…...

编程日记 2024/3/3 2:44:41

C/C++基础语法

C/C基础语法文章目录 C/C基础语法头文件经典问题链表链表基础操作秒数转换闰年斐波那契数列打印n阶菱形曼哈顿距离菱形图案的定义大数计算输入输出格式化输入输出getline()函数解决cin只读入一个单词的问题fgets读入整行输出字符数组（两种方式puts和printf&#…...

编程日记 2024/3/3 2:42:40

Home Assistant：基于Python的智能家居开源系统详解

Home Assistant：基于Python的智能家居开源系统详解在数字化和智能化的时代，智能家居系统成为了现代家庭的新宠。它们能够让我们更加方便地控制家中的各种设备，实现自动化和个性化的居住体验。其中，Home Assistant作为一款基于Pyt…...

编程日记 2024/3/3 2:40:38

使用vscode进行简单的多文件编译

安装好必要的插件后（如C/C，code runner等）默认生成task.json即可进行单文件运行涉及到多文件情况可以修改task.json如下： {"version": "2.0.0","tasks": [{"type": "cppbuild&quo…...

编程日记 2024/3/3 2:34:32

Python实现PPT演示文稿中视频的添加、替换及提取

无论是在教室、会议室还是虚拟会议中，PowerPoint 演示文稿都已成为一种无处不在的工具，用于提供具有影响力的可视化内容。PowerPoint 提供了一系列增强演示的功能，在其中加入视频的功能可以大大提升整体体验。视频可以传达复杂的概念、演示产…...

编程日记 2024/3/3 2:30:29

Mysql学习之MVCC解决读写问题

多版本并发控制什么是MVCC MVCC （Multiversion Concurrency Control）多版本并发控制。顾名思义，MVCC是通过数据行的多个版本管理来实现数据库的并发控制。这项技术使得在InnoDB的事务隔离级别下执行一致性读操作有了保证。换言之&#xff0…...

编程日记 2024/3/3 2:29:27

Linux下如何生成coredump文件

引言在linux下执行程序，当出现coredump时，却发现没有生成core文件，或者生成了core文件却不知道在哪里，下面就讲述如何产出core文件，以及指定core文件的产出格式与路径。打开core文件的大小限制 ulimit -c unlimit…...

编程日记 2024/3/3 2:28:26

eltable 合计行添加tooltip

eltable 合计行添加tooltip 问题描述： eltable 合计行单元格内容过长会换行，需求要求合计行数据超长显示 … ，鼠标 hover 时显示提示信息。解决方案：eltable合计行没有对外的修改接口，想法是自己实现一个tooltip&a…...

编程日记 2024/3/3 2:26:25

Secure Boot（安全启动）

Secure Boot（安全启动）的原理基于链式验证，这是一种确保计算机在启动过程中只加载和执行经过认证的软件的机制。这个过程涉及到硬件、固件和操作系统的多个层面。以下是Secure Boot的基本原理： 密钥和证书：Secure Boot…...

编程日记 2024/3/3 2:25:24

大厂面试经验：如何对加密后的数据进行模糊查询操作

加密后的数据对模糊查询不是很友好，本篇就针对加密数据模糊查询这个问题来展开讲一讲实现的思路。为了数据安全我们在开发过程中经常会对重要的数据进行加密存储，常见的有：密码、手机号、电话号码、详细地址、银行卡号、信用卡验证码等信息…...

编程日记 2024/3/3 2:24:23

修改docker默认存储位置【高版本的docker】

一、修改docker默认存储位置 1、停服务 systemctl stop docker 2、修改/etc/docker/daemon.json添加新的dcoker路径如"data-root": "/mnt/hdd1/docker" 3、保存后重启服务：systemctl restart docker 二、其他服务的命令 systemctl disab…...

编程日记 2024/3/3 2:19:17

CleanMyMac X2024免费Mac电脑清理和优化工具

CleanMyMac X是一款专业的 Mac 清理和优化工具，它具备一系列强大的功能，可以帮助用户轻松管理和维护他们的 Mac 电脑。以下是一些关于 CleanMyMac X 的主要功能和特点： 智能清理：CleanMyMac X 能够智能识别并清理 Mac 上的无用文件…...

编程日记 2024/3/3 2:18:16

吴恩达机器学习全课程笔记第四篇

目录前言 P61-P68 激活函数 Softmax算法 P69-P73 Adam算法更多类型的层模型评估 P74-P79 偏差和方差建立表现基准学习曲线偏差和方差与神经网络前言这是吴恩达机器学习笔记的第四篇，第三篇笔记请见： 吴恩达机器学习全课程笔记第…...

编程日记 2024/3/3 2:17:15

大数据分析师常用函数

常用函数当进行大数据分析时，SQL中的函数非常丰富，以下是更详细的展开：窗口函数 (Window Functions): ROW_NUMBER(): 为结果集中的每一行分配一个唯一的整数，用于排序。RANK(): 为结果集中的每一行分配一个排名，相同值会有相同的排名，但会跳过相同排名数量。DENSE_RAN…...

编程日记 2024/3/3 2:15:14

MySQL 主从读写分离入门——基本原理以及ProxySQL的简单使用

一、读写分离工作原理读写分离的工作原理：在大型网站业务中，当单台数据库无法满足并发需求时，通过主从同步方式同步数据。设置一台主服务器负责增、删、改，多台从服务器负责查询，从服务器从主服务器同步数据以保持一…...

编程日记 2024/3/3 2:14:12

ROS2从入门到精通：理论与实战

ROS是什么？ 随着人工智能技术的飞速发展与进步，机器人的智能化已经成为现代机器人发展的终极目标。机器人发展的速度在不断提升，应用范围也在不断拓展，例如自动驾驶、移动机器人、操作机器人、信息机器人等。机器人系统是很多复杂…...

编程日记 2024/3/3 2:13:11

docker 安装minio 一脚shell脚本

要创建一个用于安装Minio的Docker的Shell脚本，你可以按照以下步骤进行。这个脚本会执行以下操作： 拉取Minio的Docker镜像。创建一个Docker容器并映射端口。设置Minio的访问密钥和秘密密钥。持久化存储数据到本地目录。以下是一个简单的Shell脚本示例&…...

编程日记 2024/3/3 2:12:10

【数据库】mybatis使用总结

文章目录 1. 批量插入、检索<foreach>2. <if> 判断等于情况3. 模糊查询(pgsql为例)4. 分页5. <resultMap > 中collection 和association 6. no conflict do update 1. 批量插入、检索<foreach> <insert id"insertSystemService" >in…...

编程日记 2024/3/3 2:09:05

VR元宇宙的概念|VR体验店加盟|虚拟现实设备销售

VR元宇宙是一个结合了虚拟现实（Virtual Reality）和增强现实（Augmented Reality）等技术的概念，代表着一个虚拟的多维度世界。它是一个由数字化的空间构成的虚拟环境，可以通过虚拟现实设备进行交互和探索。元…...

编程日记 2024/3/3 2:06:02

深入剖析AI大模型：大模型时代的 Prompt 工程全解析

今天聊的内容，我认为是AI开发里面非常重要的内容。它在AI开发里无处不在，当你对 AI 助手说 "用李白的风格写一首关于人工智能的诗"，或者让翻译模型 "将这段合同翻译成商务日语" 时，输入的这句话就是 Prompt。…...

编程新知 2026/2/8 20:42:53

React第五十七节 Router中RouterProvider使用详解及注意事项

前言在 React Router v6.4 中，RouterProvider 是一个核心组件，用于提供基于数据路由（data routers）的新型路由方案。它替代了传统的 <BrowserRouter>，支持更强大的数据加载和操作功能（如 loader 和…...

编程新知 2026/2/9 6:48:42

练习（含atoi的模拟实现,自定义类型等练习）

一、结构体大小的计算及位段 （结构体大小计算及位段详解请看：自定义类型：结构体进阶-CSDN博客） 1.在32位系统环境，编译选项为4字节对齐，那么sizeof(A)和sizeof(B)是多少？ #pragma pack(4)st…...

编程新知 2026/1/30 15:16:30

苍穹外卖--缓存菜品

1.问题说明用户端小程序展示的菜品数据都是通过查询数据库获得，如果用户端访问量比较大，数据库访问压力随之增大 2.实现思路通过Redis来缓存菜品数据，减少数据库查询操作。缓存逻辑分析： ①每个分类下的菜品保持一份缓存数据…...

编程新知 2026/2/7 15:39:49

零基础设计模式——行为型模式 - 责任链模式

第四部分：行为型模式 - 责任链模式 (Chain of Responsibility Pattern) 欢迎来到行为型模式的学习！行为型模式关注对象之间的职责分配、算法封装和对象间的交互。我们将学习的第一个行为型模式是责任链模式。核心思想：使多个对象都有机会处…...

编程新知 2026/1/31 9:33:18

sipsak：SIP瑞士军刀！全参数详细教程！Kali Linux教程！

简介 sipsak 是一个面向会话初始协议 (SIP) 应用程序开发人员和管理员的小型命令行工具。它可以用于对 SIP 应用程序和设备进行一些简单的测试。 sipsak 是一款 SIP 压力和诊断实用程序。它通过 sip-uri 向服务器发送 SIP 请求，并检查收到的响应。它以以下模式之一…...

编程新知 2026/1/29 8:51:33

视频行为标注工具BehaviLabel（源码+使用介绍+Windows.Exe版本）

前言： 最近在做行为检测相关的模型，用的是时空图卷积网络（STGCN），但原有kinetic-400数据集数据质量较低，需要进行细粒度的标注，同时粗略搜了下已有开源工具基本都集中于图像分割这块&#xff0c…...

编程新知 2026/2/6 5:04:18

Python训练营-Day26-函数专题1：函数定义与参数

题目1：计算圆的面积任务： 编写一个名为 calculate_circle_area 的函数，该函数接收圆的半径 radius 作为参数，并返回圆的面积。圆的面积 π * radius (可以使用 math.pi 作为 π 的值)要求：函数接收一个位置参数 radi…...

编程新知 2026/1/31 0:07:38

sshd代码修改banner

sshd服务连接之后会收到字符串： SSH-2.0-OpenSSH_9.5 容易被hacker识别此服务为sshd服务。是否可以通过修改此banner达到让人无法识别此服务的目的呢？ 不能。因为这是写的SSH的协议中的。也就是协议规定了banner必须这么写。 SSH- 开头&#xff0c…...

编程新知 2026/2/8 22:30:28

AxureRP-Pro-Beta-Setup_114413.exe （6.0.0.2887）

Name：3ddown Serial：FiCGEezgdGoYILo8U/2MFyCWj0jZoJc/sziRRj2/ENvtEq7w1RH97k5MWctqVHA 注册用户名：Axure 序列号：8t3Yk/zu4cX601/seX6wBZgYRVj/lkC2PICCdO4sFKCCLx8mcCnccoylVb40lP...

编程新知 2026/2/4 19:42:20