RISC-V基础之浮点指令(包含实例)
RISC-V体系结构定义了可选的浮点扩展,分别称为RVF、RVD和RVQ,用于操作单精度、双精度和四倍精度的浮点数。RVF/D/Q定义了32个浮点寄存器,f0到f31,它们的宽度分别为32位、64位或128位。当一个处理器实现了多个浮点扩展时,它使用浮点寄存器的低位部分来执行低精度的指令。f0到f31与程序(也称为整数)寄存器x0到x31是分开的。与程序寄存器一样,浮点寄存器也按照约定用于某些特定的目的
RISC-V的浮点指令分为以下几类:
- 浮点加载和存储指令:用来在内存和浮点寄存器之间传输浮点数。例如,FLW指令从内存加载一个单精度浮点数到浮点寄存器,FSW指令将一个单精度浮点数从浮点寄存器存储到内存。
- 浮点计算指令:用来在浮点寄存器之间进行浮点数的加、减、乘、除、平方根等运算。例如,FADD.S指令将两个单精度浮点数相加,FDIV.D指令将两个双精度浮点数相除。
- 浮点转换指令:用来在不同的浮点数格式或整数格式之间转换浮点数。例如,FCVT.S.D指令将一个双精度浮点数转换为一个单精度浮点数,FCVT.W.S指令将一个单精度浮点数转换为一个32位整数。
- 浮点比较指令:用来在浮点寄存器之间进行浮点数的相等、小于、小于等于等比较,并将布尔结果记录在整数寄存器中。例如,FEQ.S指令判断两个单精度浮点数是否相等,FLT.D指令判断两个双精度浮点数是否小于。
- 浮点移动指令:用来在整数寄存器和浮点寄存器之间传输数据,不改变数据的位模式。例如,FMV.X.W指令将一个单精度浮点数从浮点寄存器移动到整数寄存器,FMV.W.X指令将一个32位整数从整数寄存器移动到浮点寄存器。
- 浮点类别化指令:用来判断一个浮点数是否属于某个特定的类别,如正无穷、负无穷、非数字(NaN)等,并将布尔结果记录在整数寄存器中。例如,FCLASS.S指令将一个单精度浮点数的类别编码为一个12位的位向量,并放入整数寄存器。
```riscv
# RISC-V floating-point program to calculate pi
# using the Gregory-Leibniz series
# pi/4 = 1 - 1/3 + 1/5 - 1/7 + ...
# f0: the result (pi)
# f1: the current term
# f2: the denominator
# f3: the sign (-1 or 1)
# f4: the constant 4.0
# f5: the constant 1.0
# f6: the constant -1.0
# t0: the loop counter.datan: .word 1000000 # number of terms to compute.text# initialize registersflw f4, =4.0 # f4 = 4.0flw f5, =1.0 # f5 = 1.0flw f6, =-1.0 # f6 = -1.0fmv.s f0, f5 # f0 = 1.0 (result)fmv.s f1, f5 # f1 = 1.0 (term)fmv.s f2, f5 # f2 = 1.0 (denominator)fmv.s f3, f5 # f3 = 1.0 (sign)lw t0, n # t0 = n (loop counter)loop:# update the resultfsub.s f0, f0, f1 # f0 = f0 - f1# update the termfadd.s f2, f2, f4 # f2 = f2 + 4.0fdiv.s f1, f3, f2 # f1 = f3 / f2# update the signfneg.s f3, f3 # f3 = -f3# update the loop counteraddi t0, t0, -1 # t0 = t0 - 1# check the loop conditionbnez t0, loop # if t0 != 0, go to loop# multiply the result by 4fmul.s f0, f0, f4 # f0 = f0 * 4.0# return the result in a0fcvt.w.s a0, f0 # a0 = (int)f0
这个程序示例是用RISC-V的单精度和双精度浮点指令来计算圆周率近似值的。它使用了Gregory-Leibniz级数,这一般项是(-1)^n / (2n+1),它的和等于pi/4。也就是说,pi/4 = 1 - 1/3 + 1/5 - 1/7 + …。这个程序使用了递归函数来计算这个级数的前n项的和,其中n是一个全局变量,可以在程序中修改。
它的功能是将数组中的每个元素加上10,并将结果存回数组中。它的主要步骤如下:
- 首先,代码在s0寄存器中存放了数组scores的基地址,这个数组有200个元素,每个元素占4个字节。代码还在s1寄存器中初始化了一个循环计数器i为0,在t2寄存器中存放了一个循环终止条件200,在t3寄存器中存放了一个常数10,在ft0浮点寄存器中存放了一个单精度浮点数10.0。
- 然后,代码进入一个for循环,每次循环都对数组中的一个元素进行操作。循环的条件是i < 200,如果不满足就跳转到done标签处结束程序。
- 在循环体中,代码首先计算数组中第i个元素的地址,方法是将i左移2位(相当于乘以4),然后加上s0(基地址)。这个地址被保存在t3寄存器中。
- 然后,代码使用flw指令从t3寄存器指向的内存地址加载一个单精度浮点数到ft1浮点寄存器中,这个浮点数就是scores[i]。
- 接着,代码使用fadd.s指令将ft1和ft0两个浮点寄存器中的值相加,并将结果保存在ft1中。这相当于执行了scores[i] = scores[i] + 10.0。
- 然后,代码使用fsw指令将ft1寄存器中的值存储到t3寄存器指向的内存地址中,这相当于将修改后的scores[i]写回数组中。
- 最后,代码使用addi指令将s1寄存器(循环计数器i)加上1,并跳转到for标签处继续下一次循环。
相关文章:

RISC-V基础之浮点指令(包含实例)
RISC-V体系结构定义了可选的浮点扩展,分别称为RVF、RVD和RVQ,用于操作单精度、双精度和四倍精度的浮点数。RVF/D/Q定义了32个浮点寄存器,f0到f31,它们的宽度分别为32位、64位或128位。当一个处理器实现了多个浮点扩展时࿰…...

前端生成图片验证码怎么做?
##题记:我们实现一个功能首先想一下我们需要做哪些工作,比如我们需要生成一个随机的图片验证码,我们需要一个就是点击事件获取验证码,通过接口我们去获取图片路径进行渲染就行,这里边还要牵扯一件事情就是获取一个随机…...

【Java】springboot框架 粮油质量溯源MES生产加工管理系统源码
粮油质量溯源MES生产加工管理系统源码,实现一物一码,全程追溯,正向追踪,逆向溯源。技术架构:spring bootmybatiseasyuimysql 。 粮油生产质量追溯系统实现种植主体、种植基地、生产计划、压榨、精炼、包装、销售、物料…...

macOS install redis遇到的bug(tar包,homebrew安装,守护进程redis.conf配置)
官网下载tar包再make install 首先是sudo make test的时候一直报 !!! WARNING The following tests failed: *** [err]: trim on SET with big value in tests/unit/type/string.tcl Expected [r memory usage key] < 42000 (context: type source line 478 file /usr/loca…...

面试题:创建JS对象的几种方式?构造函数是什么?new操作符具体干了什么?为什么字符串可以使用length?
内置构造函数还未更新完,待更新。。。 js创建对象的三种方式?构造函数是什么?new操作符具体干了什么?为什么字符串可以使用length? 内置构造函数还未更新完,待更新。。。一、利用对象字面量创建对象二、利用…...

LabVIEW深度相机与三维定位实战(下)
🏡博客主页: virobotics的CSDN博客:LabVIEW深度学习、人工智能博主 🎄所属专栏:『LabVIEW深度学习实战』 🍻上期文章:『LabVIEW深度相机与三维定位实战(上)』 &#…...

【基础类】—CSS盒模型的全面认识
一、基本概念:标准IE模型 盒模型:margin border padding content 标准模型:将元素的宽度和高度仅计算为内容区域的尺寸(content-box,默认) 当CSS盒模型为 标准盒模型 (box-sizing: conten…...

ATFX汇评:非农就业报告来袭,汇市或迎剧烈波动
ATFX汇评:美国非农就业报告每月发布一次,其中非农就业人口和失业率两项数据最受关注。7月季调后非农就业人口,将于今日20:30公布,前值为20.9万人,预期值20万人;7月失业率,同一时间公布ÿ…...
SpringBoot的常用注解的服用方式
1. SpringBootApplication 1.1 概述 SpringBootApplication是SpringBoot应用程序的核心注解,通常用于主类上。它包含了以下三个注解: Configuration:表示该类是一个配置类,用于定义Spring的配置信息。EnableAutoConfiguration&…...
[课程][原创]CMakeLists编写实战linux版
课程地址:https://edu.csdn.net/course/detail/38887 课程介绍课程目录讨论留言 你将收获 学会如何编写CMakeLIsts 学会如何调试自己cmake项目 学会如何引用头文件和库 学会如何调用开源库 适用人群 对CMakeLists感兴趣的入门学者 课程介绍 CMake是一个跨…...

静态路由下一跳地址怎么确定(静态路由配置及讲解)
一、用到的所有命令及功能 ①ip route-static 到达网络地址 子网掩码 下一跳 // 配置静态路由下一跳指的是和当前网络直接连接的路由器的接口地址非直连网段必须全部做路由路径是手工指定的,在大规模网络上不能用,效率低,路径是固定的稳定的…...

SPSS‖参数与非参数检验对比课程中的 配对样本T检验
特点:在配对样本T检验中,强调被试一定要同质(同一样本,不同变量环境),其目的就为了消除目的是额外变量的影响,更能反映自变量和因变量之间的关系。 •配对样本t检验的过程,是对两个…...

AI赋能转型升级 助力打造“数智辽宁”——首次大模型研讨沙龙在沈成功举行
当前,以“ChatGPT”为代表的大模型正在引领新一轮全球人工智能技术发展浪潮,推动人工智能从以专用小模型定制训练为主的“手工作坊时代”,迈入以通用大模型预训练为主的“工业化时代”,正不断加速实体经济智能化升级,深…...

JVM、Redis、反射
JVM JVM是Java virtual machine(Java虚拟机)的缩写,是一种用于计算机的规范,是通过在实际计算机上仿真模拟各种计算机功能来实现的。 主要组件构成: 1.类加载器 子系统负责从文件系统或者网络中加载Class文件&…...

【Spring练习项目】博客系统
目录 1.项目展示2.项目结构设计3.项目功能设计4 数据库准备4.1 建表4.2 DB相关数据 5.项目模块6.添加项目公共模块6.1 common6.2 实现前端界面 7.功能实现7.1实现博客列表约定前后端交互接口实现服务器代码实现客户端代码 7.2实现博客详情约定前后端交互接口实现服务器代码实现…...

神策新一代分析引擎架构演进
近日,神策数据已经推出全新的神策分析 2.5 版本,该版本支持分析模型与外部数据的融合性接入,构建全域数据融合模型,实现从用户到经营的全链路、全场景分析。新版本的神策分析能够为企业提供更全面、更有效的市场信息和经营策略&am…...

Systemui的介绍以及与普通应用的差异
一.SystemUI的介绍 简介 SystemUI是Android操作系统的一个关键组件,主要负责管理和提供用户界面的核心元素,如状态栏、导航栏和锁屏界面等。从下面两点出发了解SystemUI的特性: 一下就是systemui的部分界面,还包括锁屏界面&…...
群狼调研—产业园物业满意度的调研对象
群狼调研**(湖南物业满意度调查)**受顾客委托开展产业园物业满意度调查,产业园物业满意度调研对象:产业园物业满意度调研的对象主要是产业园内的企业和租户。这包括在产业园内租用场地或办公空间的企业、工厂、工作室等࿰…...

想参加华为杯竞赛、高教社杯和数学建模国赛的小伙伴看过来
本文目录 ⭐ 赛事介绍⭐ 辅导比赛 ⭐ 赛事介绍 ⭐ 参赛好处 ⭐ 辅导比赛 ⭐ 写在最后 ⭐ 赛事介绍 华为杯全国研究生数学建模竞赛是由华为公司主办的一项面向全国研究生的数学建模竞赛。该竞赛旨在通过实际问题的建模和解决,培养研究生的创新能力和团队合作精神&a…...

ELK 企业级日志分析系统
目录 ELK 概述 1、ELK 简介 2、为什么要使用 ELK: 3、完整日志系统基本特征 4、ELK 的工作原理: 总结 ELK Elasticsearch 集群部署(在Node1、Node2节点上操作) 1.环境准备 2.部署 Elasticsearch …...
2024年赣州旅游投资集团社会招聘笔试真
2024年赣州旅游投资集团社会招聘笔试真 题 ( 满 分 1 0 0 分 时 间 1 2 0 分 钟 ) 一、单选题(每题只有一个正确答案,答错、不答或多答均不得分) 1.纪要的特点不包括()。 A.概括重点 B.指导传达 C. 客观纪实 D.有言必录 【答案】: D 2.1864年,()预言了电磁波的存在,并指出…...

微信小程序 - 手机震动
一、界面 <button type"primary" bindtap"shortVibrate">短震动</button> <button type"primary" bindtap"longVibrate">长震动</button> 二、js逻辑代码 注:文档 https://developers.weixin.qq…...
C++中string流知识详解和示例
一、概览与类体系 C 提供三种基于内存字符串的流,定义在 <sstream> 中: std::istringstream:输入流,从已有字符串中读取并解析。std::ostringstream:输出流,向内部缓冲区写入内容,最终取…...

RNN避坑指南:从数学推导到LSTM/GRU工业级部署实战流程
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。 本文全面剖析RNN核心原理,深入讲解梯度消失/爆炸问题,并通过LSTM/GRU结构实现解决方案,提供时间序列预测和文本生成…...

优选算法第十二讲:队列 + 宽搜 优先级队列
优选算法第十二讲:队列 宽搜 && 优先级队列 1.N叉树的层序遍历2.二叉树的锯齿型层序遍历3.二叉树最大宽度4.在每个树行中找最大值5.优先级队列 -- 最后一块石头的重量6.数据流中的第K大元素7.前K个高频单词8.数据流的中位数 1.N叉树的层序遍历 2.二叉树的锯…...
Python 训练营打卡 Day 47
注意力热力图可视化 在day 46代码的基础上,对比不同卷积层热力图可视化的结果 import torch import torch.nn as nn import torch.optim as optim from torchvision import datasets, transforms from torch.utils.data import DataLoader import matplotlib.pypl…...
Spring Security 认证流程——补充
一、认证流程概述 Spring Security 的认证流程基于 过滤器链(Filter Chain),核心组件包括 UsernamePasswordAuthenticationFilter、AuthenticationManager、UserDetailsService 等。整个流程可分为以下步骤: 用户提交登录请求拦…...

uni-app学习笔记三十五--扩展组件的安装和使用
由于内置组件不能满足日常开发需要,uniapp官方也提供了众多的扩展组件供我们使用。由于不是内置组件,需要安装才能使用。 一、安装扩展插件 安装方法: 1.访问uniapp官方文档组件部分:组件使用的入门教程 | uni-app官网 点击左侧…...

AD学习(3)
1 PCB封装元素组成及简单的PCB封装创建 封装的组成部分: (1)PCB焊盘:表层的铜 ,top层的铜 (2)管脚序号:用来关联原理图中的管脚的序号,原理图的序号需要和PCB封装一一…...
鸿蒙HarmonyOS 5军旗小游戏实现指南
1. 项目概述 本军旗小游戏基于鸿蒙HarmonyOS 5开发,采用DevEco Studio实现,包含完整的游戏逻辑和UI界面。 2. 项目结构 /src/main/java/com/example/militarychess/├── MainAbilitySlice.java // 主界面├── GameView.java // 游戏核…...