当前位置: 首页 > news >正文

数字IC前端学习笔记:数字乘法器的优化设计(Dadda Tree乘法器)

相关阅读

数字IC前端icon-default.png?t=N7T8https://blog.csdn.net/weixin_45791458/category_12173698.html?spm=1001.2014.3001.5482


         华莱士树仍然是一种比较规则的结构(这使得可以方便地生成树的结构),这导致了它所使用的全加器和半加器个数不是最少的,Dadda提出了一种改良华莱士树的方式,这后来被称为Dadda Tree。他使用了最少数量的全加器以及半加器来重构了树,且能保证树的级数(深度)不变,这就在节省硬件资源的情况下保证了相似的性能。

        达达树的压缩策略如下算法所示。

  1. d_{1}=2d_{j+1}=[1.5d_{j}],其中中括号表示向下取整。找到最大的j,使得至少一列部分积的深度大于d_{j}
  2. 使用全加器或半加器去压缩那些深度超过d_{j}的列,使得这些列的深度不大于d_{j},这里要考虑到来自低位的压缩进位以及尽可能少地使用器件。
  3. 重复步骤1和2直到部分积变成只有两行或者说j=1

        根据这个算法,可以得到dadda的树的结构,如图1所示。图中的斜杠/代表一个全加器,连接的分别是右上角的本位和以及左下角给高位的进位,带反斜杠\的/表示是半加器。

        具体的压缩过程为,首先按照规则找到最大的j为3,其中第4列(从右到左)有4列部分积,所以使用一个半加器压缩,第5列的部分积加上第4列的进位,一共有4列部分积,所以也需用一个半加器压缩。然后接着重复步骤1,找到最大的j为2,其中第3列有3列部分积,所以使用一个半加器压缩,第4列因为第3列的进位,所以有4列部分积,因此需要全加器压缩,第5、6列同理需要使用全加器压缩,得到最后2行部分积。最后使用向量合并器(可以是传播进位加法器,也可以是超前进位加法器)将部分积累加。

图1 dadda树乘法器的覆盖过程

        具体的Verilog代码实现见附录,Modelsim软件仿真截图如图2所示。使用Synopsis的综合工具Design Compiler综合的结果如图3所示,综合使用了0.13μm工艺库

图2 dadda树乘法器仿真结果

​​​​​​​​​​​​​​​​​​​​图3 dadda树乘法器综合结果

        在Design Compiler中使用report_timing命令,可以得到关键路径的延迟,如图4所示,可以看出延迟有1.54ns,略差于华莱士树,这是因为达达树最后的向量合并器的数据位宽较大。

 ​​​​​​​图4 dadda树乘法器关键路径报告

        在Design Compiler中使用report_area命令,报告所设计电路的面积占用情况,如图5所示,可以看到这个面积优于华莱士树乘法器,不考虑最后的向量合并器,达达树仅仅使用了三个全加器和三个半加器就完成了四位数据的部分积累加,相比之下,华莱士树使用了五个全加器和三个半加器,当数据位宽增加时,华莱士树乘法器对于加法器的需求增加也比达达树快,因此达达树是华莱士树的优化版,但达达树不具有华莱士树的规则的结构,设计起来会比较消耗时间和人力。

图5 dadda树乘法器面积报告

        dadda树乘法器的Verilog代码如下所示。

module Dadda_Multiplier (input      [3:0]    A      ,input      [3:0]    B      ,output  [7:0]    Sum
);wire [3:0] partial_product [3:0];  wire [1:0] W_level1_c,W_level1_carry;wire [3:0] W_level2_c,W_level2_carry;wire [6:0] W_level3[0:1];//产生部分积assign partial_product[0]=B[0]?A:0;assign partial_product[1]=B[1]?A:0;assign partial_product[2]=B[2]?A:0;assign partial_product[3]=B[3]?A:0;// level1Adder_half adder_half_u1 (.Mult1    (partial_product[2][1]),.Mult2    (partial_product[3][0]),.Res    (W_level1_c[0]),.Carry(W_level1_carry[0])); Adder_half adder_half_u2 (.Mult1    (partial_product[3][1]),.Mult2    (partial_product[2][2]),.Res    (W_level1_c[1]),.Carry(W_level1_carry[1]));// level2Adder_half adder_half_u3 (.Mult1    (partial_product[1][1]),.Mult2    (partial_product[2][0]),.Res    (W_level2_c[0]    ),.Carry(W_level2_carry[0]));Adder adder_u1 (.Mult1     (partial_product[0][3]),.Mult2     (partial_product[1][2]),.I_carry (W_level1_c[0]          ),.Res     (W_level2_c[1]          ),.Carry (W_level2_carry[1]      ));Adder adder_u2 (.Mult1     (partial_product[1][3]),.Mult2     (W_level1_c[1]          ),.I_carry (W_level1_carry[0]      ),.Res     (W_level2_c[2]          ),.Carry (W_level2_carry[2]      ));Adder adder_u3 (.Mult1     (partial_product[2][3]),.Mult2     (partial_product[3][2]),.I_carry (W_level1_carry[1]       ),.Res     (W_level2_c[3]          ),.Carry (W_level2_carry[3]      ));assign W_level3[0] = {partial_product[3][3], W_level2_c[3:1],     partial_product[0][2:0]};assign W_level3[1] = {W_level2_carry[3:0], W_level2_c[0], partial_product[1][0], 1'b0};assign Sum     = W_level3[0] + W_level3[1];endmodule

相关文章:

数字IC前端学习笔记:数字乘法器的优化设计(Dadda Tree乘法器)

相关阅读 数字IC前端https://blog.csdn.net/weixin_45791458/category_12173698.html?spm1001.2014.3001.5482 华莱士树仍然是一种比较规则的结构(这使得可以方便地生成树的结构),这导致了它所使用的全加器和半加器个数不是最少的&#xff…...

计算机专业毕业设计项目推荐14-文档编辑平台(SpringBoot+Vue+Mysql)

文档编辑平台(SpringBootVueMysql) **介绍****各部分模块实现** 介绍 本系列(后期可能博主会统一为专栏)博文献给即将毕业的计算机专业同学们,因为博主自身本科和硕士也是科班出生,所以也比较了解计算机专业的毕业设计流程以及模式,在编写的…...

【读书后台管理系统】—后端框架搭建(二)

【读书后台管理系统】—后端框架搭建(二) 一、 Node 简介 Node 是一个基于 V8 引擎的 Javascript 运行环境,它使得 Javascript 可以运行在服务端,直接与操作系统进行交互,与文件控制、网络交互、进程控制等 Chrome …...

【DLoopDetector(C++)】DBow2词袋模型loop close学习

0.前言 最近读了两篇论文,论文作者开源了一种基于词袋模型DBoW2库的DLoopDetector算法,自己运行demo测试一下 对应论文介绍:Bags of Binary Words for Fast Place Recognition in Image Sequences 开源项目Github地址:https://gi…...

什么是CAS机制?

CAS和Synchronized的区别是什么?适合什么样的场景?有什么样的优点和缺点? 示例程序:启动两个线程,每个线程中让静态变量count循环累加100次。 public class ThreadTest {private static int count 0;public static …...

Java多态详解

下面讲解一下Java中的多态机制,力求用最通俗易懂的语言,最精炼的话语,最生动的例子,深入浅出Java多态,帮助读者轻松掌握这个知识点。 什么是多态? 多态是指同一种行为具有多个不同表现形式的能力。 多态…...

Android中简单实现Spinner的数据绑定

Android中简单实现Spinner的数据绑定 然后声明对象实例并加入到arraylist里面,并设置spinner的适配器 Spinner Sp (Spinner).............// List<CItem > lst new ArrayList<CItem>(); CItem ct new CItem ("1","测试"); lst.Add(ct)…...

【版本控制工具二】Git 和 Gitee 建立联系

文章目录 前言一、Git 和 Gitee 建立联系1.1 任意目录下&#xff0c;打开 git bash 命令行&#xff0c;输入以下命令生成公钥1.2 配置SSH公钥1.3 进行全局配置 二、其它相关Git指令2.1 常用指令2.2 指令操作可能出现的问题 三、补充3.1 **为什么要先commit&#xff0c;然后pull…...

最新AI智能创作系统ChatGPT商业源码+详细图文搭建部署教程+AI绘画系统

一、AI系统介绍 SparkAi创作系统是基于国外很火的ChatGPT进行开发的Ai智能问答系统。本期针对源码系统整体测试下来非常完美&#xff0c;可以说SparkAi是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署AI创作ChatGPT&#xff1f;小编这里写一个详细图文教程吧&am…...

【算法与数据结构】--目录

第一部分&#xff1a;算法基础 第一章&#xff1a;算法入门第二章&#xff1a;数据结构概述第三章&#xff1a;算法设计与分析 3.1 贪心算法3.2 动态规划3.3 分治算法3.4 回溯算法 第二部分&#xff1a;常见数据结构 第四章&#xff1a;数组和链表 4.1 数组4.2 链表4.3 比较…...

爱普生LQ1900KIIH复位方法

爱普生EPSON 1900KIIH是一部通用针式打印机&#xff0c;136列&#xff08;10cpi下&#xff09;的打印宽度&#xff0c;缓冲区128KB&#xff0c;打印速度为270字/秒。 打印机类型 打印方式&#xff1a;24针击打式点阵打印、打印方向&#xff1a;双向逻辑查找、安全规格标准&am…...

字段位置顺序对值的影响

Unity中验证AB加载场景时报错&#xff1a; Cannot load scene: Invalid scene name (empty string) and invalid build index -1 报错原因是因为把字段放在了Start函数后面(图一)改成(图二)就好了。图一中协程使用的sceneBName字段值为null。 图一&#xff1a; 图二&#xff1a…...

pytorch_神经网络构建2(数学原理)

文章目录 深层神经网络多分类深层网络反向传播算法优化算法动量算法Adam 算法 深层神经网络 分类基础理论: 交叉熵是信息论中用来衡量两个分布相似性的一种量化方式 之前讲述二分类的loss函数时我们使用公式-(y*log(y_)(1-y)*log(1-y_)进行误差计算 y表示真实值,y_表示预测值 …...

Oracle SQL Developer 中查看表的数据和字段属性、录入数据

在Oracle SQL Developer中&#xff0c;选中一个表时&#xff0c;右侧会列出表的情况&#xff1b;第一个tab是字段的名称、数据类型等属性&#xff1b; 切换到第二个tab&#xff0c;显示表的数据&#xff1b; 这和sql server management studio不一样的&#xff1b; 看一下部门…...

java docker图片叠加水印中文乱码

java docker图片叠加水印中文乱码 技术交流博客 http://idea.coderyj.com/ 1.由于项目需要后端需要叠加图片水印,但是中文乱码,导致叠加了之后 中文是框框 2.经过多方查找基本都说在 linux下安装字体就解决了,但是尝试了均无效 3.后来忽然想到我的项目是用docker打包部署的,不…...

string类的使用方式的介绍

目录 前言 1.什么是STL 2. STL的版本 3. STL的六大组件 4.STL的缺陷 5.string 5.1 为什么学习string类&#xff1f; 5.1.1 C语言中的字符串 5.2 标准库中的string类 5.3 string类的常用接口的使用 5.3.1 构造函数 5.3.2 string类对象的容量操作 5.3.3 string类对象…...

FFmpeg 命令:从入门到精通 | 命令行环境搭建

FFmpeg 命令&#xff1a;从入门到精通 | 命令行环境搭建 FFmpeg 命令&#xff1a;从入门到精通 | 命令行环境搭建安装 FFmpeg验证 FFmpeg 是否安装成功 FFmpeg 命令&#xff1a;从入门到精通 | 命令行环境搭建 安装 FFmpeg 进入 FFmpeg 官网&#xff1a; 点击 Download&#…...

《从零开始学ARM》勘误

1. 50页 2 51页 3 236页 14.2.3 mkU-Boot 修改为&#xff1a; mkuboot 4 56页 修改为&#xff1a; 位[31&#xff1a;24]为条件标志位域&#xff0c;用f表示&#xff1b; 位[23&#xff1a;16]为状态位域&#xff0c;用s表示&#xff1b; 位[15&#xff1a;8]为扩展位域&…...

10款录屏软分析与选择使用,只看这篇文章就轻松搞定所有,高清4K无水印录屏,博主UP主轻松选择

录屏软件整理 如下为录屏软件&#xff0c;通过思维导图展示分析介绍&#xff1a; https://www.drawon.cn/template/details/6522bd5e0dad9029a0b528e1 如下为整理的录屏软件列表 名称产地价格支持的平台下载地址说明OBS国外免费开源windows/linux/machttps://obsproject.co…...

android: android:onClick=“@{() -> listener.onItemClick(viewModel)}“

一、前言&#xff1a;在我使用editTest控件的时候&#xff0c;它的下方有一条横线。我想把它去掉然后我在布局文件中这样写 android:background"null" 导致报错&#xff0c;报错信息是&#xff1a; android:onClick"{() -> listener.onItemClick(viewModel)…...

2022年中国90米人口密度栅格数据(LandScan)|高精度、单年快照、科研级空间人口产品

&#x1f50d; 数据简介 本数据基于全球权威人口空间分布模型 LandScan™&#xff08;由美国橡树岭国家实验室 ORNL 开发&#xff09;&#xff0c;并融合2020年第七次全国人口普查乡镇级数据、10米土地利用、VIIRS夜间灯光、OSM路网与建筑物足迹&#xff0c;生成 2022年中国90米…...

2020 年 12 月青少年软编等考 C 语言三级真题解析

目录 T1. 完美立方 思路分析 T2. 不定方程求解 思路分析 T3. 分解因数 思路分析 T4. 上台阶 思路分析 T5. 田忌赛马 思路分析 T1. 完美立方 题目链接:SOJ D1025 形如 a 3 = b 3 + c 3 + d 3 a^3 = b^3 + c^3 + d^3 a3...

Nix系统修复终极指南:快速解决包管理问题与数据恢复

Nix系统修复终极指南&#xff1a;快速解决包管理问题与数据恢复 【免费下载链接】nix Nix, the purely functional package manager 项目地址: https://gitcode.com/gh_mirrors/ni/nix Nix作为一款纯粹函数式的包管理器&#xff0c;以其独特的依赖管理和环境隔离机制受到…...

终极指南:使用OpenCore Legacy Patcher让旧Mac焕发新生,完整支持最新macOS

终极指南&#xff1a;使用OpenCore Legacy Patcher让旧Mac焕发新生&#xff0c;完整支持最新macOS 【免费下载链接】OpenCore-Legacy-Patcher 体验与之前一样的macOS 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 你是否有一台性能依然强…...

Qwen3-Embedding-0.6B新手指南:从零开始玩转文本嵌入

Qwen3-Embedding-0.6B新手指南&#xff1a;从零开始玩转文本嵌入 1. 什么是文本嵌入&#xff1f;为什么你需要它&#xff1f; 想象一下&#xff0c;你有一个装满各种文档、网页和笔记的文件夹。当你想找“如何用Python做数据分析”的资料时&#xff0c;你只能靠记忆或者手动翻…...

保姆级教程:用SAP LSMW的Standard Batch/Direct Input搞定BOM批量导入(附FILE逻辑文件配置避坑指南)

SAP LSMW实战&#xff1a;BOM批量导入全流程解析与避坑指南 引言&#xff1a;为什么选择Standard Batch/Direct Input&#xff1f; 刚接触SAP PP模块的顾问们&#xff0c;第一次面对BOM批量导入任务时往往手足无措。Excel表格里整齐排列的物料清单&#xff0c;如何在SAP系统中…...

[特殊字符] 为什么99%的数字孪生都是“假的”?——镜像视界三维重构与视频反演技术重塑空间智能底层逻辑

&#x1f680; 为什么99%的数字孪生都是“假的”&#xff1f;——镜像视界三维重构与视频反演技术重塑空间智能底层逻辑如果你接触过数字孪生项目&#xff0c;或者看过相关展示系统&#xff0c;大概率见过这样一种典型场景&#xff1a;一个极具视觉冲击力的三维城市或工业模型&…...

OpenClaw极简开发:用nanobot镜像快速验证自动化脚本

OpenClaw极简开发&#xff1a;用nanobot镜像快速验证自动化脚本 1. 为什么选择nanobot镜像进行OpenClaw开发 作为一名长期在本地折腾AI自动化脚本的开发者&#xff0c;我深知环境配置的痛。每次换机器重装OpenClaw&#xff0c;总要在Node.js版本、Python依赖和模型部署之间反…...

ANIMATEDIFF PRO新手避坑指南:常见问题与解决方案全解析

ANIMATEDIFF PRO新手避坑指南&#xff1a;常见问题与解决方案全解析 1. 前言&#xff1a;为什么选择ANIMATEDIFF PRO 如果你正在寻找一款能够生成电影级质量AI视频的工具&#xff0c;ANIMATEDIFF PRO可能是目前最强大的选择之一。基于AnimateDiff架构和Realistic Vision V5.1…...

MedGemma 1.5开源医疗模型:本地化部署满足等保2.0三级与GDPR双合规要求

MedGemma 1.5开源医疗模型&#xff1a;本地化部署满足等保2.0三级与GDPR双合规要求 1. 项目概述与核心价值 MedGemma 1.5是基于Google Gemma架构开发的医疗专用AI模型&#xff0c;专门针对医学问答、病理分析和术语解释场景优化。这个4B参数规模的模型经过PubMed、MedQA等专业…...