当前位置: 首页 > news >正文

STM32G474--Whetstone程序移植(单精度)笔记

1 准备基本工程代码

参考这篇笔记从我的仓库中选择合适的基本工程,进行程序移植。这里我用的是stm32g474的基本工程。
使用git clone一个指定文件或者目录

2 移植程序

2.1 修改Whetstone.c

主要修改原本变量定义的类型,以及函数接口全部更换为单精度类型。其次在计时方式上这里使用的是DWT的方式计时,比TM32G474–Whetstone程序移植(双精度)笔记的计时方式更好一些,但需要更加注意溢出的问题。

#include <stdlib.h>
#include <stdio.h>
#include <string.h>
#include <math.h>// 添加头文件
#include "main.h"
#include <stdint.h>
#include "stm32g4xx_hal.h"//stm32G4的hal库头文件,若更换芯片型哈需要更改
#include "debug_PmuDwt.h"/* map the FORTRAN math functions, etc. to the C versions */
#define DSIN    sinf
#define DCOS    cosf
#define DATAN   atanf
#define DLOG    logf
#define DEXP    expf
#define DSQRT   sqrtf
#define IF      if/* function prototypes */
void POUT(long N, long J, long K, float X1, float X2, float X3, float X4);
void PA(float E[]);
void P0(void);
void P3(float X, float Y, float *Z);
#define USAGE   "usage: whetdc [-c] [loops]\n"//#define PRINTOUT 1float time_in_secs(uint64_t ticks);/*COMMON T,T1,T2,E1(4),J,K,L
*/
float T,T1,T2,E1[5];
int J,K,L;
int argc = 0;   //Mod for nucleo. Change in code below if you want non-default loop count//************************************
//**    Whetstone    64b-DP         **
//**        SUB                     **
//************************************
int Whetstone(void) // ------------ Metoda -----------
{printf("Beginning Whetstone benchmark at ");printf(" %d MHz ...\n\n", SystemCoreClock/1000000);/* used in the FORTRAN version */long I;long N1, N2, N3, N4, N6, N7, N8, N9, N10, N11;float X1,X2,X3,X4,X,Y,Z;long LOOP;int II, JJ;/* added for this version */long loopstart = 0;uint64_t startsec,finisec = 0;uint32_t delta=0;float KIPS;int continuous;loopstart = 40000;       /* 1000 see the note about LOOP below */continuous = 0;II = 1;     /* start at the first arg (temp use of II here) */LCONT:
/*
********************************************
*   Start benchmark timing at this point.
********************************************
*/startsec = 0;finisec = 0;delta = PMU_DWT_CounterCalibrate();startsec = PMU_DWT_CounterGet();/*
********************************************
*   The actual benchmark starts here.
********************************************
*/T  = .499975f;T1 = 0.50025f;T2 = 2.0f;
/*
********************************************
*   With loopcount LOOP=10, one million Whetstone instructions
*   will be executed in EACH MAJOR LOOP..A MAJOR LOOP IS EXECUTED
*   'II' TIMES TO INCREASE WALL-CLOCK TIMING ACCURACY.
*
*   LOOP = 1000;
*/LOOP = loopstart;II   = 1;JJ = 1;IILOOP:N1  = 0;N2  = 12 * LOOP;N3  = 14 * LOOP;N4  = 345 * LOOP;N6  = 210 * LOOP;N7  = 32 * LOOP;N8  = 899 * LOOP;N9  = 616 * LOOP;N10 = 0;N11 = 93 * LOOP;
/*
********************************************
*   Module 1: Simple identifiers
********************************************
*/X1  =  1.0f;X2  = -1.0f;X3  = -1.0f;X4  = -1.0f;for (I = 1; I <= N1; I++){X1 = (X1 + X2 + X3 - X4) * T;X2 = (X1 + X2 - X3 + X4) * T;X3 = (X1 - X2 + X3 + X4) * T;X4 = (-X1+ X2 + X3 + X4) * T;}
#ifdef PRINTOUTIF (JJ==II) POUT(N1,N1,N1,X1,X2,X3,X4);
#endif/*
********************************************
*   Module 2: Array elements
********************************************
*/E1[1] =  1.0f;E1[2] = -1.0f;E1[3] = -1.0f;E1[4] = -1.0f;for (I = 1; I <= N2; I++){E1[1] = ( E1[1] + E1[2] + E1[3] - E1[4]) * T;E1[2] = ( E1[1] + E1[2] - E1[3] + E1[4]) * T;E1[3] = ( E1[1] - E1[2] + E1[3] + E1[4]) * T;E1[4] = (-E1[1] + E1[2] + E1[3] + E1[4]) * T;}#ifdef PRINTOUTIF (JJ==II) POUT(N2,N3,N2,E1[1],E1[2],E1[3],E1[4]);
#endif/*
********************************************
*  Module 3: Array as parameter
********************************************
*/for (I = 1; I <= N3; I++){PA(E1);}
#ifdef PRINTOUTIF (JJ==II) POUT(N3,N2,N2,E1[1],E1[2],E1[3],E1[4]);
#endif/*
********************************************
*   Module 4: Conditional jumps
********************************************
*/J = 1;for (I = 1; I <= N4; I++){if (J == 1)J = 2;elseJ = 3;if (J > 2)J = 0;elseJ = 1;if (J < 1)J = 1;elseJ = 0;}#ifdef PRINTOUTIF (JJ==II) POUT(N4,J,J,X1,X2,X3,X4);
#endif/*
********************************************
*   Module 5: Omitted
*   Module 6: Integer arithmetic
********************************************
*/J = 1;K = 2;L = 3;for (I = 1; I <= N6; I++){J = J * (K-J) * (L-K);K = L * K - (L-J) * K;L = (L-K) * (K+J);E1[L-1] = J + K + L;E1[K-1] = J * K * L;}#ifdef PRINTOUTIF (JJ==II) POUT(N6,J,K,E1[1],E1[2],E1[3],E1[4]);
#endif/*
********************************************
*   Module 7: Trigonometric functions
********************************************
*/X = 0.5f;Y = 0.5f;for (I = 1; I <= N7; I++){X = T * DATAN(T2*DSIN(X)*DCOS(X)/(DCOS(X+Y)+DCOS(X-Y)-1.0f));Y = T * DATAN(T2*DSIN(Y)*DCOS(Y)/(DCOS(X+Y)+DCOS(X-Y)-1.0f));}#ifdef PRINTOUTIF (JJ==II)POUT(N7,J,K,X,X,Y,Y);
#endif/*
********************************************
*   Module 8: Procedure calls
********************************************
*/X = 1.0;Y = 1.0;Z = 1.0;for (I = 1; I <= N8; I++){P3(X,Y,&Z);}
#ifdef PRINTOUTIF (JJ==II)POUT(N8,J,K,X,Y,Z,Z);
#endif/*
********************************************
*   Module 9: Array references
********************************************
*/J = 1;K = 2;L = 3;E1[1] = 1.0;E1[2] = 2.0;E1[3] = 3.0;for (I = 1; I <= N9; I++){P0();}
#ifdef PRINTOUTIF (JJ==II) POUT(N9,J,K,E1[1],E1[2],E1[3],E1[4]);
#endif/*
********************************************
*   Module 10: Integer arithmetic
********************************************
*/J = 2;K = 3;for (I = 1; I <= N10; I++){J = J + K;K = J + K;J = K - J;K = K - J - J;}#ifdef PRINTOUTIF (JJ==II) POUT(N10,J,K,X1,X2,X3,X4);
#endif/*
********************************************
*   Module 11: Standard functions
********************************************
*/X = 0.75;for (I = 1; I <= N11; I++){X = DSQRT(DEXP(DLOG(X)/T1));}
#ifdef PRINTOUTIF (JJ==II) POUT(N11,J,K,X,X,X,X);
#endif/*
********************************************
*      THIS IS THE END OF THE MAJOR LOOP.
********************************************
*/if (++JJ <= II)goto IILOOP;/*
********************************************
*      Stop benchmark timing at this point.
********************************************
*/// finisec = time(0);finisec = PMU_DWT_CounterGet();//timer.reset();/*
*--------------------------------------------------------------------
*      Performance in Whetstone KIP's per second is given by
*
*   (100*LOOP*II)/TIME
*
*      where TIME is in seconds.
*--------------------------------------------------------------------
*/float vreme;vreme = time_in_secs(finisec - startsec - delta);if (vreme <= 0){printf("Insufficient duration- Increase the LOOP count \n");finisec = 0; startsec = 0;return 1;}printf("Loops: %ld , \t Iterations: %d, \t Duration: %.3f sec. \n",LOOP, II, vreme);KIPS = (100.0f * LOOP * II) / vreme ;if (KIPS >= 1000.0f)printf("C Converted Float Precision Whetstones: %.3f MIPS \n\n", KIPS / 1000);elseprintf("C Converted Float Precision Whetstones: %.3f KIPS \n\n", KIPS);if (continuous)goto LCONT;finisec = 0; startsec = 0;return 1;
}void PA(float E[])
{J = 0;L10:E[1] = ( E[1] + E[2] + E[3] - E[4]) * T;E[2] = ( E[1] + E[2] - E[3] + E[4]) * T;E[3] = ( E[1] - E[2] + E[3] + E[4]) * T;E[4] = (-E[1] + E[2] + E[3] + E[4]) / T2;J += 1;if (J < 6)goto L10;
}void P0(void)
{E1[J] = E1[K];E1[K] = E1[L];E1[L] = E1[J];
}void P3(float X, float Y, float *Z)
{float X1, Y1;X1 = X;Y1 = Y;X1 = T * (X1 + Y1);Y1 = T * (X1 + Y1);*Z  = (X1 + Y1) / T2;
}float time_in_secs(uint64_t ticks)
{// scale timer down to avoid uint64_t -> double conversion in RV32uint32_t scale = 170000000;float delta = (float)(ticks*(1.0f)) / scale;return delta;
}#ifdef PRINTOUT
void POUT(long N, long J, long K, float X1, float X2, float X3, float X4)
{printf("%7ld %7ld %7ld %12.4e %12.4e %12.4e %12.4e\n",N, J, K, X1, X2, X3, X4);
}
#endif

2.2 修改main.c

删除示例工程中测试基本功能的一小段函数,将以下这段函数放置在while前执行即可。

  printf("\nMy Benchmark example for Whetstones \n");printf("Whetstone ");PMU_DWT_Initialize();// 初始化DWTWhetstone();// 测试函数

2.3 修改main.h

和双精度的示例相同,需要添加测试函数的声明。

int Whetstone(void);

3 测试结果

在这里插入图片描述
暂时没有具体分析细节问题,只是跑通了

相关文章:

STM32G474--Whetstone程序移植(单精度)笔记

1 准备基本工程代码 参考这篇笔记从我的仓库中选择合适的基本工程&#xff0c;进行程序移植。这里我用的是stm32g474的基本工程。 使用git clone一个指定文件或者目录 2 移植程序 2.1 修改Whetstone.c 主要修改原本变量定义的类型&#xff0c;以及函数接口全部更换为单精度…...

Spring Boot 3.4 中 MockMvcTester 的新特性解析

引言 在 Spring Boot 3.4 版本中&#xff0c;引入了一个全新的 MockMvcTester 类&#xff0c;使 MockMvc 测试可以直接支持 AssertJ 断言。本文将深入探讨这一新特性&#xff0c;分析它如何优化 MockMvc 测试并提升测试的可读性。 Spring MVC 示例 为了演示 MockMvcTester 的…...

java 读取sq3所有表数据到objectNode

1.实现效果&#xff1a;将sq3中所有表的所有字段读到objectNode 对象中&#xff0c;兼容后期表字段增删情况&#xff0c;数据组织形式如下图所示&#xff1a; 代码截图&#xff1a; 代码如下&#xff1a; package com.xxx.check.util;import java.sql.*; import java.util.Arr…...

网络计算机的五个组成部分

单个计算机是无法进行通信的。所以需要借助网络。 下面介绍一些在网络里常见的设备。 一、服务器 服务器是在网络环境中提供计算能力并运行软件应用程序的特定IT设备 它在网络中为其他客户机&#xff08;如个人计算机、智能手机、ATM机等终端设备&#xff09;提供计算或者应用…...

jakarta EE学习笔记-个人笔记

WebServlet注解&#xff1a;声明一个类为Servlet Target({ElementType.TYPE}) Retention(RetentionPolicy.RUNTIME) Documented public interface WebServlet {// 指定Servlet的影子String name() default ""; // 匹配地址映射(URL)String[] value() default {};// …...

vue3-响应式 toRefs

在Vue 3中&#xff0c;toRefs是一个非常有用的组合式API&#xff08;Composition API&#xff09;函数&#xff0c;它主要用于将响应式对象&#xff08;通常是由reactive创建的对象&#xff09;转换为单独的响应式引用对象。这样做的好处是可以将这些响应式引用解构出来&#x…...

学习threejs,使用Lensflare模拟镜头眩光

&#x1f468;‍⚕️ 主页&#xff1a; gis分享者 &#x1f468;‍⚕️ 感谢各位大佬 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! &#x1f468;‍⚕️ 收录于专栏&#xff1a;threejs gis工程师 文章目录 一、&#x1f340;前言1.1 ☘️THREE.Lensflare 二、&…...

redis高级数据结构布隆过滤器

文章目录 背景什么是布隆过滤器Redis 中的布隆过滤器布隆过滤器使用注意事项实现原理空间占用估计 背景 我们在使用新闻客户端看新闻时&#xff0c;它会给我们不停地推荐新的内容&#xff0c;它每次推荐时要去重&#xff0c;去掉那些已经看过的内容。问题来了&#xff0c;新闻…...

mysql 5.7安装

基础环境&#xff1a;centos7.9 创建日志存放目录 mkdir -p /opt/supervisor/log安装相关工具 yum install -y perl net-tools numactl gcc python-devel配置yum源 sudo vim /etc/yum.repos.d/mysql-community.repo [mysql-connectors-community] nameMySQL Connectors Com…...

Golang:精通sync/atomic 包的Atomic 操作

在本指南中&#xff0c;我们将探索sync/atomic包的细节&#xff0c;展示如何编写更安全、更高效的并发代码。无论你是经验丰富的Gopher还是刚刚起步&#xff0c;你都会发现有价值的见解来提升Go编程技能。让我们一起开启原子运算的力量吧&#xff01; 理解Go中的原子操作 在快…...

微信小程序如何使用decimal计算金额

第三方库地址&#xff1a;GitHub - MikeMcl/decimal.js: An arbitrary-precision Decimal type for JavaScript 之前都是api接口走后端计算&#xff0c;偶尔发现这个库也不错&#xff0c;计算简单&#xff0c;目前发现比较准确 上代码 导入js import Decimal from ../../uti…...

最新Modular公司之MAX和Mojo作者 克里斯·拉特纳简介

Chris Lattner&#xff08;克里斯拉特纳&#xff09; 是一位著名的计算机科学家和软件工程师&#xff0c;以其在编程语言、编译器技术和软件开发工具领域的贡献而闻名。以下是关于他的详细介绍&#xff1a; 1. 主要成就 &#xff08;1&#xff09;LLVM 项目的创始人 Chris La…...

Redis数据库篇 -- Pipeline

一. 什么是Pipeline 在传统的请求-响应模式中&#xff0c;客户端与服务器之间的通信流程如下&#xff1a; 客户端发送一个命令到服务器。服务器接收命令并执行。服务器将执行结果返回给客户端。客户端接收结果后&#xff0c;发送下一个命令 在这种传统的模式下&#xff0c;…...

爬虫自动化(DrissionPage)

目录 ?一.介绍: 下载DrissionPage,还是我们熟悉的pip&#xff1a; 环境准备&#xff1a; ?二.基本代码&#xff1a; 它对于的导包和类使用&#xff1a; 窗口的设置&#xff1a; 和获取的页面的滑动&#xff1a; 3.进一步认识DrissionPage&#xff1a; 浏览器可以多开…...

常见string库中的函数(C语言超详细)

文章目录 strcspnstrcpystrncpystrcatstrncatstrcmpstrncmpstrchrstrrchrstrstrstrtokstrlenstrnlen strcspn 原型: size_t strcspn(const char *str1, const char *str2);功能&#xff1a; strcspn 会扫描 str1&#xff0c;并返回一个整数&#xff0c;表示 str1 中第一个匹配…...

单例模式几种实现

静态内部类holder实现&#xff08;推荐&#xff09; public class UniqueIdGenerator {public static final UniqueIdGenerator INSTANCE Holder.INSTANCE;// Private holder class for lazy initializationprivate static class Holder {static final UniqueIdGenerator INS…...

android中关于CheckBox自定义选中图片选中无效问题

在android xml 布局中&#xff0c;使用CheckBox控件设置选中背景图代码如下 <CheckBoxandroid:layout_width"wrap_content"android:layout_height"wrap_content"android:button"drawable/dfrd_common_selecotr_check"android:paddingStart&q…...

虚拟局域网之详解(Detailed Explanation of Virtual Local Area Network)

虚拟局域网之详解 VLAN (virtual localArea network)是一种虚拟局域网技术&#xff0c;它可以将一个物理局域网划分为多个逻辑上的虚拟局域网。 基于交换式以太网的虚拟局域网在交换式以太网中&#xff0c;利用VLAN技术&#xff0c;可以将由交换机连接成的物理网络划分成多个…...

双亲委派(JVM)

1.双亲委派 在 Java 中&#xff0c;双薪委派通常是指双亲委派模型&#xff0c;它是 Java 类加载器的一种工作模式&#xff0c;用于确保类加载的安全性和一致性。以下是其相关介绍&#xff1a; 定义与作用 定义&#xff1a;双亲委派模型要求除了顶层的启动类加载器外&#xf…...

第二十一章:考研的艰难抉择与放弃入学的转折

深秋时节&#xff0c;校园宛如被大自然精心雕琢的艺术殿堂。金黄的银杏叶在阳光的轻抚下&#xff0c;闪烁着细碎的光芒&#xff0c;微风拂过&#xff0c;叶片相互摩挲&#xff0c;发出沙沙的轻响&#xff0c;仿佛在低声诉说着岁月的故事。一片片银杏叶悠悠然飘落&#xff0c;宛…...

RocketMQ延迟消息机制

两种延迟消息 RocketMQ中提供了两种延迟消息机制 指定固定的延迟级别 通过在Message中设定一个MessageDelayLevel参数&#xff0c;对应18个预设的延迟级别指定时间点的延迟级别 通过在Message中设定一个DeliverTimeMS指定一个Long类型表示的具体时间点。到了时间点后&#xf…...

日语学习-日语知识点小记-构建基础-JLPT-N4阶段(33):にする

日语学习-日语知识点小记-构建基础-JLPT-N4阶段(33):にする 1、前言(1)情况说明(2)工程师的信仰2、知识点(1) にする1,接续:名词+にする2,接续:疑问词+にする3,(A)は(B)にする。(2)復習:(1)复习句子(2)ために & ように(3)そう(4)にする3、…...

剑指offer20_链表中环的入口节点

链表中环的入口节点 给定一个链表&#xff0c;若其中包含环&#xff0c;则输出环的入口节点。 若其中不包含环&#xff0c;则输出null。 数据范围 节点 val 值取值范围 [ 1 , 1000 ] [1,1000] [1,1000]。 节点 val 值各不相同。 链表长度 [ 0 , 500 ] [0,500] [0,500]。 …...

什么?连接服务器也能可视化显示界面?:基于X11 Forwarding + CentOS + MobaXterm实战指南

文章目录 什么是X11?环境准备实战步骤1️⃣ 服务器端配置(CentOS)2️⃣ 客户端配置(MobaXterm)3️⃣ 验证X11 Forwarding4️⃣ 运行自定义GUI程序(Python示例)5️⃣ 成功效果![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/55aefaea8a9f477e86d065227851fe3d.pn…...

Angular微前端架构:Module Federation + ngx-build-plus (Webpack)

以下是一个完整的 Angular 微前端示例&#xff0c;其中使用的是 Module Federation 和 npx-build-plus 实现了主应用&#xff08;Shell&#xff09;与子应用&#xff08;Remote&#xff09;的集成。 &#x1f6e0;️ 项目结构 angular-mf/ ├── shell-app/ # 主应用&…...

【Linux系统】Linux环境变量:系统配置的隐形指挥官

。# Linux系列 文章目录 前言一、环境变量的概念二、常见的环境变量三、环境变量特点及其相关指令3.1 环境变量的全局性3.2、环境变量的生命周期 四、环境变量的组织方式五、C语言对环境变量的操作5.1 设置环境变量&#xff1a;setenv5.2 删除环境变量:unsetenv5.3 遍历所有环境…...

LCTF液晶可调谐滤波器在多光谱相机捕捉无人机目标检测中的作用

中达瑞和自2005年成立以来&#xff0c;一直在光谱成像领域深度钻研和发展&#xff0c;始终致力于研发高性能、高可靠性的光谱成像相机&#xff0c;为科研院校提供更优的产品和服务。在《低空背景下无人机目标的光谱特征研究及目标检测应用》这篇论文中提到中达瑞和 LCTF 作为多…...

使用SSE解决获取状态不一致问题

使用SSE解决获取状态不一致问题 1. 问题描述2. SSE介绍2.1 SSE 的工作原理2.2 SSE 的事件格式规范2.3 SSE与其他技术对比2.4 SSE 的优缺点 3. 实战代码 1. 问题描述 目前做的一个功能是上传多个文件&#xff0c;这个上传文件是整体功能的一部分&#xff0c;文件在上传的过程中…...

Vue 3 + WebSocket 实战:公司通知实时推送功能详解

&#x1f4e2; Vue 3 WebSocket 实战&#xff1a;公司通知实时推送功能详解 &#x1f4cc; 收藏 点赞 关注&#xff0c;项目中要用到推送功能时就不怕找不到了&#xff01; 实时通知是企业系统中常见的功能&#xff0c;比如&#xff1a;管理员发布通知后&#xff0c;所有用户…...

用神经网络读懂你的“心情”:揭秘情绪识别系统背后的AI魔法

用神经网络读懂你的“心情”:揭秘情绪识别系统背后的AI魔法 大家好,我是Echo_Wish。最近刷短视频、看直播,有没有发现,越来越多的应用都开始“懂你”了——它们能感知你的情绪,推荐更合适的内容,甚至帮客服识别用户情绪,提升服务体验。这背后,神经网络在悄悄发力,撑起…...