当前位置: 首页 > article >正文

芯片-设计流程入门

芯片近些年来一直是风口几乎所有有实力的上市公司都要蹭下这个热度自研芯片。这也诞生了很多工作岗位相对于硬件工程师软件开发工程师能做的事情有限但是也是非常重要的而且跟着风口喝口汤也是可以的。整体来说需求、架构、验证是需要软件参与的本文结合自己的部分经验从最基本的芯片设计流程进行介绍其中会涉及一些可能你经常听到的卡脖子技术。芯片设计的四个步骤如上图我们只关注需求和设计制造和封装不是我们软件工程师能左右的。1. 市场需求要做一个芯片首先得有需求也就是应用场景有市场去买单。当前科技时代电子技术在各方面都有应用可以说有电路板的地方就有芯片需求。例如手机、电脑、智能家具我们的衣食住行用等方方面面。有了需求就可以根据需求梳理出来我们硬件上需要那些模块功能和性能指标以及软硬件上要用的技术。这些需要软硬件的架构师进行设计最终形成Spec。Spec会确定所有的功能和要求之后才可以进行芯片设计。1.1 关于EDA模拟软件软件在做架构设计的时候有时候需要进行一些验证看软件是否支持可以使用qemu模拟运行的方式看应用能支持不。软硬件在做架构设计的时候可以使用很多IC厂商提供的IP集成工具来模拟SoC就是用纯软件的方式把SoC上的各个IP都添加模拟出来例如VDK(Virtualizer Development Kit)工具。这里说的VDK工具其实就是一种电子设计自动化EDAElectronics Design Automation工具也就是我们俗称的EDA工具。这是我们卡脖子的技术之一很复杂而在芯片设计中非常的重要贯穿设计、验证和制造特别是验证可以大力减少出错成本和缩短研发周期。可谓“没有金刚钻不揽瓷器活”。详细可以参考浅谈EDA验证工具芯片开发到底有多难VDK与qemu的区别就是qemu支持的芯片型号有限自己添加很麻烦要修改qemu的源码。而在VDK图形界面上点一点就可以添加一个IP而且很多IP是不出名的厂商私有的不会广泛支持就需要自己加。所以IP厂商基本会有自己的集成验证工具供客户使用。芯片开发的周期很漫长在最开始需求阶段一些应用上的软件也许就具备开发条件了例如在qemu上进行app应用的开发一些依赖于SoC上IP的应用可以使用VDK做一些数据流的通路开发并不支持具体的业务这样后续拿到真正芯片后就可以省略很多一部分研发任务并且可以提前验证软件技术方案的可行性。如果软件技术方案不可行需要修改SoC硬件也可以及早的修改。因为芯片研发越到后期修改的成本越大如果流片了还需要修改那就快game over了巨额资金打水漂。所以宁愿先投入研发人员去慢慢磨也不愿意在硬件上去试错人可没芯片生产值钱。1.2 关于架构师数字集成电路设计实现流程是个相当漫长的过程拿手机基带芯片为例对于3G, 4G, 5G, 工程师最初见到的是无数页的协议文档。架构师要根据协议来确定协议的哪些部分可以用软件实现哪些部分需要用硬件实现算法工程师要深入研读协议的每一部分并选定实现所用算法芯片设计工程师需要将算法工程师选定的算法描述成RTL;芯片验证工程师需要根据算法工程师选定的算法设计测试向量对RTL 做功能、效能验证数字实现工程师需要根据算法工程师和设计工程师设定的目标PPA 将RTL 揉搓成GDS;芯片生产由于太过复杂完全交由代工厂完成封装亦是对于测试大部分公司都是租借第三方测试基台由自己的测试工程师完成只有少部分土豪公司才会有自己的测试基台。架构师是芯片灵魂的缔造者是食物链的最顶端是牛逼闪闪的存在。2. 芯片设计概述芯片设计分为两部分前端逻辑设计和后端物理设计。这其中很多流程看似高大上但是有IP供应商提供的工具以后其实就是界面上点点的事情。芯片设计中涉及的工具繁多基本都是老外的这需要国内芯片公司的崛起有自己的很多IP后才可以投入到这些工具的研发中去。有一个说法就是老外掌握一项新技术首先就是加密做界面化不提供源码然后商业卖钱。而这个周期要延迟一两年到市场上而中国则直接推给自己的客户客户有能力抄的就抄跑了大家都不太注重商业保密可能技术比较low不用藏着掖着大家都是抄的。。。这就是中国速度。3. 芯片前端设计RTL设计验证静态时序分析覆盖率ASIC逻辑综合3.1 RTL设计首先要确定芯片的工艺如下图RTLregister transfer level) 设计利用硬件描述语言如VHDLVerilogSystem Verilog, 对电路以寄存器之间的传输为基础进行描述。RTL使用代码编写来实现功能模块就是一个个IP。这些IP分为数字IP和模拟IPSOC芯片最终由SOC integration工程师把各个IP集成到一起。上图中我们可以看到一个典型的SoC有那些IP例如CPUDSPUSB外设memory等。对于RTL还需要进行支持BIST自测试设计的时候也需要做可测性设计DFTDesign For Test除了对功能测试还需要对代码进行自动检查通过lint, Spyglass等工具针对电路进行设计规则检查包括代码编写风格DFT命名规则和电路综合相关规则等检查。3.2 验证验证是保证芯片功能正确性和完整性最重要的一环。验证的工作量也是占整个芯片开发周期的50%-70%相应的验证工程师与设计工程师的数量大概在2-3:1。从验证的层次可以分位模块级验证子系统级验证和系统级验证。从验证的途径可以分为模拟simulation仿真和形式验证formality check。这里又出现了芯片验证这里软件开发人员又来活了之前在qemu、VDK上模拟的程序现在可以在RTL上模拟了这里是越来越贴近硬件了。在多平台验证虽然很繁琐就像验证完一个玩具系统然后继续下一个好似没有用但是每一次都是在进步。这里需要注意的一点就是在各个验证平台下的代码复用问题大的模块差异可以通过编译时区分小的差异可以通过运行时读取标志寄存器来在代码里面走不同分支或加载不同的配置文件区分这里需要把握一个度。一点经验多用配置文件例如xml、dts、config文件不用宏直接debug版本适应所有验证平台编译时借助编译工具脚本自动区分。3.3 静态时序分析STA静态时序分析是套用特定的时序模型timing model,针对特定电路分析其是否违反designer给定的时序限制timing constraint。目前主流的STA工具是synopsys的Prime Time。静态时序分析的作用确定芯片最高工作频率通过时序分析可以控制工程的综合、映射、布局布线等环节减少延迟从而尽可能提高工作频率。检查时序约束是否满足可以通过时序分析来查看目标模块是否满足约束如不满足可以定位到不满足约束的部分并给出具体原因进一步修改程序直至满足要求。分析时钟质量时钟存在抖动、偏移、占空比失真等不可避免的缺陷。通过时序分析可以验证其对目标模块的影响。3.4 覆盖率覆盖率作为一种判断验证充分性的手段已成为验证工作的主导。从目标上可以把覆盖率分为两类代码覆盖率 作用检查代码是否冗余设计要点是否遍历完全。检查对象RTL代码 功能覆盖率 作用检查功能是否遍历 检查对象自定义的container 在设计完成时要进行代码覆盖率充分性的sign-off, 对于覆盖率未达到100%的情况要给出合理的解释保证不影响芯片的工能。3.5 ASIC综合逻辑综合的结果就是把设计实现的RTL代码翻译成门级网表netlist的过程。在做综合时要设定约束条件如电路面积、时序要求等目标参数。工具synopsys的Design compiler, 综合后把网表交给后端。至此我们前端的工作就结束啦4. 后端设计1 逻辑综合2 形式验证3 物理实现4 时钟树综合CTS5 寄生参数提取6 版图物理验证4.1 逻辑综合同3.5中前端的逻辑综合4.2 形式验证1验证芯片功能的一致性2不验证电路本身的正确性3每次电路改变后都需验证形式验证的意义在于保障芯片设计的一致性一般在逻辑综合布局布线完成后必须做。工具synopsys Formality4.3 物理实现物理实现可以分为三个部分布局规划 floor plan布局 place布线 route物理实现可以分为三个部分布局规划 floor plan布局 place布线 route布图规划floor plan布图规划是整个后端流程中作重要的一步但也是弹性最大的一步。因为没有标准的最佳方案但又有很多细节需要考量。布局布线的目标优化芯片的面积时序收敛稳定方便走线。工具IC compilerEncounter布图规划完成效果图布局布局即摆放标准单元I/O pad宏单元来实现个电路逻辑。布局目标利用率越高越好总线长越短越好时序越快越好。但利用率越高布线就越困难总线长越长时序就越慢。因此要做到以上三个参数的最佳平衡。布局完成效果图布线布线是指在满足工艺规则和布线层数限制、线宽、线间距限制和各线网可靠绝缘的电性能约束条件下根据电路的连接关系将各单元和I/O pad用互连线连接起来。4.4 时钟树综合——CTSClock Tree Synthesis时钟树综合简单点说就是时钟的布线。由于时钟信号在数字芯片的全局指挥作用它的分布应该是对称式的连到各个寄存器单元从而使时钟从同一个时钟源到达各个寄存器时时钟延迟差异最小。这也是为什么时钟信号需要单独布线的原因。4.5 寄生参数提取由于导线本身存在的电阻相邻导线之间的互感,耦合电容在芯片内部会产生信号噪声串扰和反射。这些效应会产生信号完整性问题导致信号电压波动和变化如果严重就会导致信号失真错误。提取寄生参数进行再次的分析验证分析信号完整性问题是非常重要的。工具Synopsys的Star-RCXT4.6版图物理验证这一环节是对完成布线的物理版图进行功能和时序上的验证大概包含以下方面LVSLayout Vs Schematic验证简单说就是版图与逻辑综合后的门级电路图的对比验证DRCDesign Rule Checking设计规则检查检查连线间距连线宽度等是否满足工艺要求ERCElectrical Rule Checking电气规则检查检查短路和开路等电气规则违例实际的后端流程还包括电路功耗分析以及随着制造工艺不断进步产生的DFM可制造性设计问题等。物理版图以GDSII的文件格式交给芯片代工厂称为Foundry在晶圆硅片上做出实际的电路。最后进行封装和测试就得到了我们实际看见的芯片。后记这里笔者不是专业的芯片设计人员如果是微电子专业做芯片设计的可以参考知乎温戈的博客https://www.zhihu.com/people/Wingo.Wang芯片验证工程师的一个介绍https://www.wenhui.space/docs/07-ic-verify/verify-notes/digital-verifer/这里只是从软件工程师的角度来说明下怎么参与到芯片研发中。“啥都懂一点啥都不精通干啥都能干干啥啥不是专业入门劝退堪称程序员杂家”。后续会继续更新纯干货分析欢迎分享给朋友欢迎评论交流公众号“那路谈OS与SoC嵌入式软件”欢迎关注个人文章汇总https://thatway1989.github.io

相关文章:

芯片-设计流程入门

芯片近些年来一直是风口,几乎所有有实力的上市公司都要蹭下这个热度:自研芯片。这也诞生了很多工作岗位,相对于硬件工程师,软件开发工程师能做的事情有限,但是也是非常重要的,而且跟着风口喝口汤也是可以的…...

英伟达系列芯片如何用于自动驾驶开发之(二):硬件电源设计

**作者 |**Jessie 出品 | 焉知 知圈 | 进“底盘社群”请加微yanzhi-6,备注底盘 往期回顾 英伟达系列芯片如何应用于智能汽车开发看这两篇文章就够了(一) 英伟达系列芯片如何应用于智能汽车开发看这两篇文章就够了(二) 英伟达…...

年度博客汇总

2026 值得看的 Blogs 视频 / 播客 1. 翁家翌:OpenAI / AI Infra 这类内容很值得看,因为它讨论的不是表层产品体验,而是 AI 基础设施、工程体系和能力边界。对工程师来说,这种分享能帮助你理解模型时代的软件栈到底在怎么变化&…...

DanKoe 视频笔记:社交媒体增长 101:如何撰写真实内容

在本节课中,我们将学习在人工智能时代,如何通过撰写真实、有吸引力的内容来建立个人品牌和实现社交媒体增长。我们将探讨如何组织你的兴趣主题,并掌握几种能有效建立权威的内容写作方法。 人们希望关注的是真实的人,而非一个带有人…...

【企业级Dify重排序部署手册】:在Qwen-14B+Milvus集群上实现毫秒级Rerank响应

第一章:企业级Dify重排序部署手册概述企业级Dify重排序(Rerank)能力是提升RAG系统检索精度与响应相关性的关键环节。本手册面向具备Kubernetes集群管理经验与Python工程化能力的SRE及AI平台工程师,聚焦于在生产环境中稳定、可观测…...

零基础玩转Xinference:手把手教你用一行代码切换Qwen、GLM等模型

零基础玩转Xinference:手把手教你用一行代码切换Qwen、GLM等模型 1. 认识Xinference:你的模型切换神器 1.1 什么是Xinference? Xinference(Xorbits Inference)是一个开源平台,它让切换不同AI模型变得像换…...

MCU中main函数退出后去哪了?嵌入式裸机程序终止行为解析

1. MCU程序执行结束后去哪儿了:嵌入式系统中main函数退出行为的深度解析1.1 问题的工程本质在嵌入式系统开发实践中,一个看似基础却常被忽视的问题反复出现:当C语言编写的main()函数执行完毕后,程序究竟会走向何方?这个…...

避坑指南:用sratoolkit下载SRA转FASTQ时,遇到‘双端变单端’等问题怎么破?

避坑指南:SRA转FASTQ时双端数据异常处理实战 最近在分析狨猴视网膜单细胞测序数据时,遇到一个典型问题:NCBI标注为PAIRED的双端测序SRA文件,用fastq-dump转换后却只生成单个FASTQ文件。这让我不得不深入排查sratoolkit的参数差异和…...

计算机毕业设计:Python智能图书推荐系统 Spark Django框架 协同过滤推荐算法 书籍 可视化 数据分析 大数据 大模型(建议收藏)✅

博主介绍:✌全网粉丝50W,前互联网大厂软件研发、集结硕博英豪成立软件开发工作室,专注于计算机相关专业项目实战6年之久,累计开发项目作品上万套。凭借丰富的经验与专业实力,已帮助成千上万的学生顺利毕业,…...

【紧急预警】你的C固件正在裸奔!——2024年NIST CVE-2023-XXXX系列漏洞复现中,仅2款工具能提前72小时触发缓冲区溢出告警

第一章:C语言固件检测工具选型的底层逻辑与行业现状固件作为嵌入式系统的核心载体,其安全性与可靠性直接决定设备生命周期内的行为可信度。C语言因其零抽象开销、内存可控性及广泛硬件支持,仍是固件开发的主流语言;但这也意味着传…...

Vulkan开发环境搭建:Win10与VS2019高效配置指南

1. 环境准备:安装Vulkan SDK与验证显卡支持 想要开始Vulkan开发,首先得把基础环境搭建好。我去年在给团队搭建开发环境时,发现很多新手容易在第一步就卡住。其实只要按照正确步骤操作,整个过程非常顺畅。 第一步是去LunarG官网下载…...

YOLO11检测中的类别重映射技巧,讲解如何在推理时对类别ID进行重映射或合并

🎬 Clf丶忆笙:个人主页 🔥 个人专栏:《YOLOv11全栈指南:从零基础到工业实战》 ⛺️ 努力不一定成功,但不努力一定不成功! 文章目录 一、类别重映射基础概念与应用场景 1.1 什么是类别重映射 1.2 为什么需要类别重映射 1.3 类别重映射的应用场景 二、YOLOv11类别重映…...

Agent智能体架构 第二章 单智能体架构

单智能体架构 (Single Agent) 这是最简单的形式,指代的是一个智能体独立完成所有任务。代表:AutoGPT、BabyAGI 的早期版本。优点:上下文一致性强,没有协作开销。缺点:能力受限于单一模型的上下文窗口,难以处…...

Lychee-rerank-mm在VSCode插件开发中的应用:智能代码搜索

Lychee-rerank-mm在VSCode插件开发中的应用:智能代码搜索 让代码搜索像对话一样自然 作为一名开发者,你一定遇到过这样的情况:明明记得项目中有个处理用户登录的模块,但就是想不起来具体文件名;或者想找一个特定的函数…...

别再傻傻分不清了!一文搞懂金融‘量化交易’和AI‘模型量化’到底啥区别

金融量化交易与AI模型量化的本质差异解析 1. 当"量化"遇上不同领域:概念迷雾的源头 第一次接触"量化"这个术语时,很多人都会被它的多义性所困扰。在金融圈里,人们谈论着"量化交易策略";而在AI工程师…...

实验室见面考核 复现

文件查看器 这题需要同时配合远程靶机和题目食用 打开题目先试试用常见的flag文件地址./var/www/html/flag尝试一下 不能使用英文句号,先连接靶机试试 在kali中使用 sudo service ssh status 查看ssh状态 使用 sudo apt install openssh-server 下载ssh或者…...

保姆级教程:用NARUTO-AI漫画引擎,一键生成专属火影忍者头像

保姆级教程:用NARUTO-AI漫画引擎,一键生成专属火影忍者头像 1. 快速了解NARUTO-AI漫画引擎 NARUTO-AI漫画引擎是一款专为火影忍者风格优化的AI绘画工具,基于Tongyi-MAI Z-Image Turbo模型打造。它最大的特点就是能让普通用户轻松生成专业级…...

Whisper 音频转录

你好呀!今天我们来聊聊如何用 OpenAI 的 Whisper 工具把音频文件变成文字。这东西可厉害了,不管是 podcast、讲座还是自己录的语音,都能轻松转成文本,超方便的! 准备工作 📋 在开始之前,你需要准备好: Python 3.7 或更高版本(现在大部分电脑都有了) 一点磁盘空间(…...

用一套键鼠控制多台电脑:Barrier跨平台共享方案

用一套键鼠控制多台电脑:Barrier跨平台共享方案 【免费下载链接】barrier Open-source KVM software 项目地址: https://gitcode.com/gh_mirrors/ba/barrier Barrier是一款开源的KVM软件,能够让你使用一套键盘鼠标同时控制多台运行不同操作系统的…...

校园网福音:用UU加速器+PC热点搞定Switch联机(附详细广播原理分析)

校园网环境下Switch联机加速的终极方案:PC热点与广播机制深度解析 每次在宿舍想和室友来一局《Splatoon 3》时,最怕看到的就是那个令人绝望的"NAT类型:D"。校园网环境下没有路由器,Switch联机成了老大难问题。但你可能没…...

UEC++Part6--碰撞预设、委托、auto补充

一、碰撞预设1、碰撞设置主要4种类型NoCollision(无碰撞)、query、Physics、Probe。语法如图,其余类似。ALBox->SetCollisionEnabled(ECollisionEnabled::QueryAndPhysics);ALBox->SetCollisionEnabled(ECollisionEnabled::QueryOnly);2、自身碰撞类型ALBox-&…...

EcomGPT-7B电商模型数据库课程设计参考:构建智能电商知识图谱系统

EcomGPT-7B电商模型数据库课程设计参考:构建智能电商知识图谱系统 最近几年,知识图谱在电商领域的应用越来越火,从智能搜索到个性化推荐,背后都有它的影子。但对于很多计算机专业的学生来说,数据库课程设计往往还停留…...

【数据结构实战】C 语言实现静态顺序栈:从原理到完整可运行代码

栈(stack)是限定仅在表尾进行插入或删除操作的线性表。因此对栈来说,表尾端有其特殊含义,称为栈顶(top),相应地,表头端称为栈底(bottom)。不含元素的空表称为空栈。假设 S(a1,a2,…,an),则称 a1为栈底元素,…...

LeetCode:148. 排序链表

简介 题目链接:https://leetcode.cn/problems/sort-list/description/ 解决方式:链表 分治法(递归 双指针) 这是作者学习众多大神的思路进行解题的步骤,很推荐大家解题的时候去看看题解里面大佬们的思路、想法&#…...

告别ROS多机通信的繁琐配置:用swarm_ros_bridge和ZeroMQ实现WiFi集群的即插即用

告别ROS多机通信的繁琐配置:用swarm_ros_bridge和ZeroMQ实现WiFi集群的即插即用 在机器人集群开发中,多机通信一直是令人头疼的问题。想象一下这样的场景:实验室里几台TurtleBot需要协同完成地图构建,比赛现场无人机编队需要实时共…...

Windows和Ubuntu双系统下GitHub访问慢?3分钟搞定Hosts配置(附最新IP查询方法)

双系统开发者必备:GitHub访问优化全攻略(Windows/Ubuntu通用方案) 每次在Windows和Ubuntu之间切换开发环境时,最让人抓狂的莫过于GitHub的龟速访问。作为一名长期使用双系统的全栈工程师,我深刻理解这种痛苦——明明代…...

Android事件分发:长按事件与双击事件的实现原理

本文同步发表于我的微信公众号,微信搜索 程语新视界 即可关注,每个工作日都有文章更新 一、长按事件的源码实现 长按事件的触发需要满足: 手指按下后持续一段时间(默认500ms) 期间没有移动超过阈值 期间没有抬起 …...

Qwen-Image-2512与LaTeX集成:学术论文图像生成

Qwen-Image-2512与LaTeX集成:学术论文图像生成 学术研究者每天需要为论文制作大量图表和示意图,传统绘图工具耗时耗力且专业门槛高 撰写学术论文时,图像质量往往直接影响研究成果的呈现效果。传统绘图工具如Photoshop或专业绘图软件需要大量学…...

嵌入式自定义通信协议设计与实现指南

1. 自定义协议设计原理与工程实践在嵌入式系统开发中,通信协议是连接不同功能模块的神经中枢。当标准协议(如Modbus、CANopen、HTTP)无法满足特定应用场景的轻量化、低开销或业务逻辑耦合需求时,自定义协议便成为工程师手中最灵活…...

计算机毕业设计springboot社区服务系统 基于SpringBoot的数字化社区综合服务管理平台 基于SpringBoot的社区便民信息服务系统

计算机毕业设计springboot社区服务系统gv80n9 (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。随着城市化进程加快和信息技术的发展,传统社区管理模式已难以满足居民多…...