当前位置: 首页 > article >正文

三大 AI 芯片架构

AI尤其是深度学习最核心的工作就是海量、重复的数学计算矩阵乘法、向量运算。训练 ChatGPT要算几十亿、上万亿次数学题。自动驾驶每秒要算上千次环境识别。普通 CPU电脑 / 手机的 “大脑”不擅长干这个—— 它像一个全能 CEO什么都能做但算得慢、效率低。所以需要专门的 AI 芯片来加速这些计算。GPU Graphics Processing Unit图形处理器最早是给游戏显卡做的负责3D 游戏画面视频渲染特效计算这些都需要同时算几百万个点像是几千个小工人同时干同一件简单活。后来发现AI 计算和游戏画面计算几乎一模一样于是 GPU 直接变成 AI 主力芯片。GPU 的特点几万个小核心每个核心都很简单专门擅长并行计算一起算。通用性极强游戏、AI、画图、视频都能做。生态最成熟软件、框架、教程最多有 CUDA、PyTorch、TensorFlow 等完善工具。算力超大目前最能 “暴力算” 的芯片几千个核心同时算速度比 CPU 快几十到几百倍。开发最简单写 Python 就能用。缺点是功耗巨大300W700W贵一张 H100 要几十万不是专门给 AI 设计有很多多余电路。现在ChatGPT、文心一言、Claude训练本地 AI 画图Stable Diffusion抖音、淘宝、B 站的推荐模型训练AI 换脸、AI 配音、AI 视频。都是靠GPUGPU 是 AI 时代的 “通用大力士”。FPGA Field-Programmable Gate Array现场可编程门阵列最特殊的地方硬件可以改硬件级的 “乐高积木”—— 电路可以反复改写。内部有几百万个逻辑门你可以连线改功能重新配置硬件专门为你的 AI 模型定制电路、低功耗、低延迟比 GPU 省电很多适合实时场景、半定制化比通用 GPU 高效比全定制 ASIC 灵活。缺点极难开发要懂硬件语言算力不如 GPU价格不便宜不能大规模量产。FPGA 可反复拼的乐高灵活、省电适合需要经常改算法的场景。现在的 AI 应用边缘 AI 推理安防摄像头实时人脸识别、工业质检、自动驾驶辅助。数据中心预处理阿里云 / 腾讯云用 FPGA 做 AI 数据清洗、格式转换比 GPU 省电 70%。5G 基站、通信设备需要频繁升级算法FPGA 可以在线改电路。百度 XPU、阿里含光 800 早期版本用 FPGA 做云端 AI 加速ASIC Application-Specific Integrated Circuit专用集成电路为某一件事专门造的机器只能干这件事但干到极致。只为 AI 设计只干 AI 这件事。从电路到结构100% 为深度学习定制。极致能效比同样算力功耗只有 GPU 的1/5~1/20。成本低量产时一旦设计好、大规模生产单价可以压得很低。性能最高、延迟最低没有冗余电路所有资源都为 AI 计算服务。缺点完全不可改设计生产后电路固定死算法一变就没用了研发成本极高、周期长流片一次要几千万、上亿周期半年以上灵活性为 0只能干设计时定好的事现在的 ASIC应用谷歌 TPU专门为 TensorFlow 设计用于 Google 搜索、翻译、YouTube 推荐、Gemini 大模型。华为昇腾、寒武纪思元、地平线征程手机 / 边缘端 AI、自动驾驶、服务器推理。亚马逊 Inferentia/Trainium、微软 Maia、Meta MTIA各大云厂商自研 ASIC用于自家大模型训练 / 推理。手机 NPU华为麒麟 NPU、苹果 Neural Engine、小米澎湃 NPU—— 专门负责手机 AI拍照、语音助手、实时翻译、人脸解锁。TPU Tensor Processing Unit张量处理单元谷歌自家的云端 AI 专用芯片。谷歌每天要跑海量 AI搜索、翻译、YouTube 推荐、大模型…需要更省电、更便宜、更适合 AI 推理的芯片。NPU Neural Processing Unit神经网络处理单元。专门给手机、智能设备跑 AI 用的 “微型 AI 专用芯片”。手机电池很小不能用功耗几百瓦的 GPU。手机里80% AI 部分都是 NPU 在跑。AI拍照实时翻译人脸解锁。只做AI结算低功耗体积小成本低。现在行业趋势训练靠 GPU推理靠 ASIC边缘用 FPGA/ASIC。AI芯片的4个关键特征1. 新型的计算范式AI 专用的算数方式普通 CPU 一步一步算AI 要大批量、并行、矩阵运算所以必须用新的计算方式。2. 训练和推断AI 的两大工作训练让 AI 学习看书推断让 AI 做题用学到的知识判断AI 芯片必须两样都能干。3. 大数据处理能力能吃大量数据AI 要靠海量图片、语音、视频学习所以芯片必须读得快、处理得多。4. 可重构的能力能改、能适配新算法AI 技术更新快芯片要灵活改结构跟上新模型。

相关文章:

三大 AI 芯片架构

AI(尤其是深度学习)最核心的工作,就是海量、重复的数学计算(矩阵乘法、向量运算)。训练 ChatGPT:要算几十亿、上万亿次数学题。自动驾驶:每秒要算上千次环境识别。普通 CPU(电脑 / 手…...

智能传感器:从概念解析到设计实践与未来展望

在上一篇文章中,我们探讨了数字孪生技术如何为工业制造带来革命性变革。作为数字孪生系统的“感官神经”,智能传感器是实现虚实映射、数据采集的关键基石。今天,武汉利又德的小编将继续深入,带您全面了解智能传感器的内涵、核心特…...

晶振作用 → 频率怎么来 → PLL 倍频 → 分频 → MCU 主频

一、晶振电路的核心作用:给 MCU 一个「精准的原始心跳」MCU 是数字同步电路,所有动作:执行指令、读写 Flash、ADC 采样、串口通信、定时器计时……全部必须按统一时钟节拍来干。1. 晶振本身干什么?晶振是石英晶体谐振器&#xff0…...

晶振电路的工作原理是什么?新手必懂!

一、先搞懂:晶振本身是什么? 晶振的核心是一片石英晶体,它靠一个物理效应工作: 压电效应(晶振的本质) 给石英晶体加电压 → 晶体发生微小机械形变让石英晶体受外力振动 → 会产生电压 石英有个超级关键…...

专业的负氧离子座舱公司

在追求高品质生活的今天,健康出行已成为人们关注的焦点。[吉品森氧]作为专业的负氧离子座舱公司,正引领着这一领域的革新潮流。负氧离子,被誉为“空气维生素”,具有净化空气、促进新陈代谢、增强免疫力等多重功效。[吉品森氧]深谙…...

模块化仪器接口技术纵览:PXIe、VXI、LXI、VPX

引言 现代测试测量系统正朝着模块化、可重构、高速化的方向快速发展。模块化仪器,作为一种将仪器功能封装在标准尺寸模块中,并通过标准总线接口集成到机箱或背板上的解决方案,因其灵活性、可扩展性和易于维护的特性,在研发、生产和自动化测试领域扮演着至关重要的角色。其…...

PANASONIC松下 AXE530127 SMD 板对板与背板连接器

特性 1.“坚固接触”结构提供对各种环境的高抗性。 2.简单的锁结构提供触觉反馈,确保良好的插拔操作手感。 3.提供用于检查的连接器。...

第7章:Docker network网络管理(网络模式和创建docker网络)

第7章:Docker network网络管理(网络模式和创建docker网络) 7.2、Docker网络模式 Docker 服务安装完成之后,默认在每个宿主机会生成一个名称为 docker0 的网卡其 IP 地址都是 172.17.0.1/16。 每次新建一个容器后,宿主机就会多了个虚拟网卡,与容器的网卡组合成一个网卡,例…...

扔掉提示词,开始养“龙虾”:2026 AI自动化执行新逻辑

01. 2026的十字路口:为什么单模型走不下去了? 如果你还在纠结于提示词怎么写才能让GPT-4o一次性生成完美代码,你可能已经落后于这个时代了。 2026年被行业普遍视为“AI元年”,但这个元年并非因为某个模型突破了万亿参数&#xf…...

open claw安装后启动运行web UI界面 - wsl版

以管理员身份打开 PowerShell 查看wsl中安装的发行版 wsl --list --verbose进入打wsl中指定的发行版 wsl -d Ubuntu查看 Gateway 状态 openclaw gateway status启动服务(通过 systemd/launchd) openclaw gateway start查看基础的网页端 openclaw gateway…...

好用的广东出书服务

大家好,我是你们的老朋友小明。今天咱们聊聊一个特别的话题——出书。可能很多人觉得出书是一件很遥远的事情,但实际上,随着互联网的发展,越来越多的人开始尝试自己写书、出书。但是,如何选择一家靠谱的出书服务公司呢…...

中红外BIC 全介质超表面 光谱调制 FDTD仿真 作品介绍: 复现论文:2018年 Science

中红外BIC 全介质超表面 光谱调制 FDTD仿真 作品介绍: 复现论文:2018年 Science:Imaging-based molecular barcoding with pixelated dielectric metasurfaces 论文介绍:中红外 全介质 硅纳米柱超表面模型,双椭圆纳米柱…...

2026年,人生仓库集团发展如何?看其独特优势与市场表现

大家好,今天咱们聊聊人生仓库集团在未来几年的发展前景。人生仓库集团,这个名字听起来就充满了故事和温度。它不仅仅是一个企业,更像是一个为奋斗者储存价值和赋能成长的“仓库”。独特优势1. 强大的品牌背书系统人生仓库集团的GEO品牌背书系…...

国内OpenClaw玩家圈共识:智创聚合API才是真香选择

你是否也曾对OpenClaw(龙虾)的强大能力心动不已,却在部署第一步——配置AI大模型时望而却步?直接使用官方API,高昂的Token费用让人肉疼;尝试部署本地开源模型,繁琐的技术门槛又令人头疼。但在国…...

CnOpenData 中国历史地震表-发生时间1年内

地震是全球发生频率最高、影响最严重的自然灾害之一,是当今人类生存和发展所面临的一个重大全球性问题。地震灾害有以下突出特征:巨大的破坏性。地震会造成山体、地面及其附着物(如植被、建筑)等破坏,往往还伴随着海啸…...

【Iced】core库Size 结构体源码解析(size.rs)

这是 iced_core 中定义的 2D尺寸 类型&#xff0c;用于表示宽度和高度。 &#x1f3d7;️ 结构体定义 /// 2维空间中的尺寸大小 #[derive(Debug, Clone, Copy, PartialEq, Eq, Hash, Default)] pub struct Size<T f32> {/// 宽度pub width: T,/// 高度pub height: T, }关…...

PMP自学笔记

...

【Matlab】MATLAB教程:多维数组索引(案例:A(1,2,3)、A(:,:,2),聚焦多维数据提取)

MATLAB教程:多维数组索引(案例:A(1,2,3)、A(:,:,2),聚焦多维数据提取) 在MATLAB科学计算、工程仿真、数据分析及数据可视化中,多维数组(三维及以上)是存储复杂关联数据的核心载体——无论是时间-空间-指标三维监测数据、多通道传感器数据,还是三维空间坐标数据,都需…...

视频去字幕工具横评:本地 AI、云端方案与传统方法的实战对比

> 做视频二创&#xff0c;最头疼的莫过于硬编码字幕。本文实测 5 种主流去字幕方案&#xff0c;从技术原理到实际效果&#xff0c;给你一份客观的选型指南。---## 一、为什么去字幕这么难&#xff1f;视频字幕分为两种&#xff1a;**软字幕**和**硬字幕**。- **软字幕**&…...

Infoseek:以智能舆情监测,为企业品牌筑牢安全防线

当前网络舆论场迭代速度快&#xff0c;一条负面评价、一次认知误解&#xff0c;均可能通过网络快速扩散&#xff0c;对企业品牌形象造成影响。传统舆情监测服务普遍存在成本偏高、操作门槛高的问题&#xff0c;导致多数中小企业陷入“事后补救”的被动局面。Infoseek舆情监测系…...

告别手动复制:C# + Spire.XLS 实现HTML转Excel的完整方案

告别手动复制&#xff1a;C# Spire.XLS 实现HTML转Excel的完整方案 在Web开发和数据处理中&#xff0c;C# HTML to Excel转换需求频现。网页表格数据手动复制到Excel常导致样式丢失、格式混乱&#xff0c;费时费力。随着Web爬取数据自动化趋势&#xff0c;高效实现HTML 到 XLS…...

做跨境电商和出国旅行必备:世界各国电压、频率、插座类型查询整理

平时做工具网站时&#xff0c;经常会遇到一些非常实用但又不太容易找到完整资料的小问题。 前段时间在整理电器相关资料时&#xff0c;我需要查询 **世界各国的电压、频率以及插座类型**。 原本以为这种信息网上很多&#xff0c;但实际查找之后发现&#xff1a; * 有的网站只…...

FastAPI + SQLAlchemy + SSH + Doris 生产连接问题技术复盘

FastAPI + SQLAlchemy + SSH + Doris 生产连接报错1045 本文内容在公众号免费阅读; 获取方式: 关注公众号 [李指导数据前沿],回复关键词 “FastApi隧道” 即可获取本文配套的完整源代码文件及高清晰度系统架构图,助你少踩坑,直接起飞! 背景: 将 FastAPI 项目拉到本地,在…...

基于Spring Boot的高校学生心理健康管理系统设计与实现

目录 需求分析与功能模块设计技术选型与架构设计数据库设计关键功能实现安全与隐私保护测试与部署扩展性考虑 项目技术支持可定制开发之功能创新亮点源码获取详细视频演示 &#xff1a;文章底部获取博主联系方式&#xff01;同行可合作 需求分析与功能模块设计 明确系统核心需…...

强化学习实践:Q-learning算法在游戏AI中的训练过程

强化学习实践&#xff1a;Q-learning算法在游戏AI中的训练过程 在人工智能领域&#xff0c;强化学习因其独特的“试错”机制成为游戏AI开发的重要工具。其中&#xff0c;Q-learning作为一种经典的无模型强化学习算法&#xff0c;因其简单高效的特点&#xff0c;被广泛应用于游…...

普通人也能上手的 GoViewPro 平台,输入描述 AI 一键生成大屏神器

家人们&#xff0c;今天我必须要给大家安利这个超绝的 GoViewPro 平台&#xff01;你是不是常常为制作大屏而烦恼&#xff0c;觉得过程繁琐又复杂&#xff1f;但是&#xff01;有了 GoViewPro&#xff0c;一切都变得超简单。 点击前往 GoViewPro 地址查看&#x1f448;&#xf…...

IDEA中如何使用注释模版(创建类时自动带上注释)

打开IDEA中设置可以参考我的模版&#xff1a;/*** Author: ${USER}* Date: ${DATE} ${TIME}* Description: TODO*/...

(9-3)多模态融合理论与方法:高层融合

9.3 高层融合高层融合位于多模态感知与系统控制的最上层&#xff0c;其核心目标不是对原始数据或中间状态进行联合估计&#xff0c;而是基于多模态信息形成统一的认知结果与决策输出。在这一层级中&#xff0c;多模态信息通常以语义、任务状态、风险评估或策略建议的形式参与融…...

现代Qt QWidget界面美化与用户体验提升深度技术报告

现代Qt QWidget界面美化与用户体验提升深度技术报告 在当今软件工程领域&#xff0c;桌面应用程序的视觉美学与交互质感已成为产品核心竞争力的重要组成部分。Qt框架凭借其卓越的跨平台能力与深厚的底层沉淀&#xff0c;始终是工业软件、工程工具及企业级应用的首选。然而&…...

vscode运行开发uniapp项目

1. 环境准备 安装 Node.js 确保已安装 Node.js&#xff08;建议使用 LTS 版本&#xff09;。下载地址&#xff1a;Node.js 官网。安装 VSCode 下载并安装最新版 VSCode&#xff1a;VSCode 官网。安装 HBuilderX&#xff08;可选但推荐&#xff09; UniApp 官方推荐使用 HBuild…...