第四代英特尔至强重磅发布,芯片进入下半场:软硬加速、绿色可持续
编辑 | 宋慧
出品 | CSDN 云计算
2023 年的第二周,英特尔重磅发布其企业级芯片领域重要的产品——第四代英特尔® 至强® 可扩展处理器。作为数据中心处理器当之无愧的王牌产品,迄今为止,英特尔已经向全球客户交付了超8500万颗至强可扩展处理器。另据详细数据显示,第三代英特尔® 至强® 可扩展处理器已于近两年出货近1500万颗。而最新的第四代英特尔® 至强® 可扩展处理器,也已经赢得超400个客户订单。
全新七大加速技术,为数字化转型的开发加速
作为算力的核心,在全行业数字化转型的趋势下,英特尔至强处理器也在持续推动创新。此前,英特尔曾在其全球重要大会 Intel Innovation 2022 上就透露了芯片内置加速器的技术内容,这次正式发布里,第四代英特尔® 至强® 可扩展处理器采用新的性能核,与前一代相比增加了内核数量。另外内置七大加速神器,涉及性能、数据、安全等各方面优化加速,这些技术非常重要,所以详细列一下:
- 英特尔® 高级矩阵扩展(英特尔® AMX):可大幅提高深度学习训练和推理性能,性能可提升至 10 倍,非常适合自然语言处理、推荐系统和图像识别等工作负载。
- 英特尔® 动态负载均衡器(英特尔® DLB):实现了在多个 CPU 内核 / 线程上高效地分配网络处理,根据系统负载的变化而动态地在多个 CPU 内核上分配网络数据以进行处理,并能够还原在多个 CPU 内核上同时处理网络数据包的顺序,显著提升网络工作负载的系统级处理性能,时延降低 96%。
- 英特尔® 数据流加速器(英特尔® DSA):专为卸载常见的、会导致数据中心规模部署开销的数据移动任务所设计,能够帮助加速 CPU、内存和缓存,以及所有附加的内存、存储和网络设备之间的数据移动,可将存储、网络和数据密集型工作负载的性能提升至 1.7 倍。
- 英特尔® 存内分析加速器(英特尔® IAA):可在提高查询吞吐量的同时减少内存占用,非常适合内存数据库、开源数据库以及 RocksDB 和 ClickHouse 等数据存储工作,性能可提升至 3 倍。
- 英特尔® 数据保护与压缩加速技术(英特尔® QAT):作为内置加速器,其可通过卸载加密、解密和压缩释放处理器内核,从而让系统能够支持更多客户端运行或实现降低能耗的目的。得益于英特尔® QAT 加速器,第四代英特尔® 至强® 可扩展处理器已成为为单一数据流压缩并加密数据性能最高的 CPU。
- 英特尔® 安全技术:通过英特尔 软件防护扩展(英特尔® SGX)和英特尔® 全内存机密技术(英特尔® TME)对工作负载进行保护;借助英特尔® 密码操作硬件加速(英特尔® Crypto Acceleration)加速加密运算;利用英特尔® 内存故障管理技术(英特尔® MRT)实现预测性安全保护;并通过英特尔® 平台固件弹性技术(英特尔® PFR)完成平台安全启动。
- 英特尔® 至强® CPU Max 系列:集成高带宽内存,能够在无需变更代码的情况下为科学计算工作负载加速。
开发者从加速器覆盖的技术领域,可以很直接的看到,第四代至强想要切实满足当下数字化例如 AI、数据分析、网络、安全、存储和科学计算(HPC)等各种场景的需求,并通过软硬件结合的方式,去统一调优实现,为创新的业务应用开发提供支持。
另外值得一提的是随着第四代英特尔至强可扩展处理器发布,英特尔还推出的一项新的按需服务 Intel on Demand,“按需服务”更像软件的玩法,用于扩展和/或升级大多数第四代至强处理器 SKUs 中的加速器和硬件增强功能。例如用户可以在购买后试用,可以更加灵活的随需去开启需要的加速功能。
引入 AI 技术,与生态伙伴共建绿色数据中心
数据中心作为数字新基建的底座,一直是电力能耗大户。而在东数西算和可持续发展战略下,绿色数据中心是现阶段行业发展的重要议题。不过与以往单一追求低能耗不同,节能发展两手抓需要最优能效比的算力,而这次第四代至强推出的七大内置加速器,让用户可以逐渐减少对额外加速硬件的使用,也是绿色发展的一个重要手段。
英特尔提供的数据显示,与前一代相比,第四代英特尔至强可扩展处理器通过内置加速器将目标工作负载的平均每瓦性能提升了 2.9 倍,在优化电源模式下每个 CPU 节能高达 70 瓦并对性能只产生极低的影响,同时将总体拥有成本降低 52%到 66%。新的优化电源模式可以为某些工作负载带来高达 20%的插槽节能,而对性能的影响仅有不到 5%。风冷和液冷的创新进一步降低了数据中心的总能耗,且第四代至强可扩展处理器在英特尔工厂制造时,运用了超过 90%的可再生电力,并同时配备了一流的水资源回收设施。另外英特尔处理器内含有优化功率模型(Optimized Power Model),通过 BIOS 选项设置节能选项,降低功耗。
除了英特尔自身的可持续发展路径,英特尔还在联合数据中心各方的生态合作伙伴,联合设计和优化数据中心整体能耗。其中重要的一个技术点就是 AI 深入应用到了数据中心设计的方方面面。
在联合降能效方面,英特尔联合冷板液冷部件提供商 OXM,多个最终用户联合做冷板液冷各个部件的标准化工作,将部件设计质量和验证的要求标准化,增大整个市场产业化进程,同时也把市场准入门槛降低,从而“把量推上去,把成本降下来。”
在会后的采访中,生态伙伴也分享了 AI 技术应用于数据中心能效优化的内容。期间,阿里云智能服务器研发资深架构师刘礼寅分享了通过数据拟合与 AI 算法,实现数据中心全局的进风功率、散热平衡。另外大规模部署 AI 算法实现风扇最优散热转速,还有联合英特尔定制 CPU,通过数据整合,寻找壳温最优解。腾讯云星星海实验室研发总监曾钦杵则分享了在腾讯云音视频AI平台、机器学习平台上,与英特尔在搜索业务及增强视频性能等方面展开的探索与合作。亚信科技网络智能化首席专家王希栋在采访中详细阐述了将 AI 时序预测用于业务波峰提前唤醒 CPU,以及基于英特尔芯片智能加速器的自有算法研发,节能相关的 AI 动态参数调优等等。
技术在不停向前发展,芯片的发展确实已经进入了下半场,英特尔的软硬件协同、低碳可持续发展、生态合作,这些改变和进化,也将继续在数字化进程中,扮演重要角色。
相关文章:

第四代英特尔至强重磅发布,芯片进入下半场:软硬加速、绿色可持续
编辑 | 宋慧 出品 | CSDN 云计算 2023 年的第二周,英特尔重磅发布其企业级芯片领域重要的产品——第四代英特尔 至强 可扩展处理器。作为数据中心处理器当之无愧的王牌产品,迄今为止,英特尔已经向全球客户交付了超8500万颗至强可扩展处理器…...
c++-运算符函数与运算符重载
目录概述例子注意问题概述 运算符重载是函数一个特殊情况,重载的运算符视为特殊的函数,称为运算符函数。 编译系统能依据使用运算符的不同环境,即参数(操作数)的数量或类型的差异,区分同一运算符的不同含义…...
【MySQL Shell】8.9.3 修复 InnoDB ClusterSet 中的成员服务器和集群
根据集群的问题或维护要求,可以使用以下操作来处理其成员服务器。除非另有说明,否则请使用使用 InnoDB Cluster 管理员帐户或服务器配置帐户获取的 Cluster 和 ClusterSet 对象,以便存储在 ClusterSet 对象中的默认用户帐户具有正确的权限。 …...

宝塔搭建实战php开源likeadmin通用管理pc端nuxt3源码(三)
大家好啊,我是测评君,欢迎来到web测评。 昨天给大家分享了admin前端的搭建部署方式,今天来给大家分享pc端在本地搭建,与打包发布到宝塔的方法,希望能够帮助到大家,感兴趣的朋友可以自行下载学习。 技术架构…...

【C++】---Stack和Queue的用法及其模拟实现
文章目录Stack最小栈栈的弹出压入序列逆波兰表达式求值用栈实现队列模拟实现queue用队列实现栈模拟实现Stack stack是一种容器适配器,专门用在具有后进先出操作的上下文环境中,其删除只能从容器的一端进行元素的插入与提取操作。它的使用和之前学习的ve…...
Python GUI编程
Python 提供了多个图形开发界面的库,几个常用 Python GUI 库如下: Tkinter: Tkinter 模块(Tk 接口)是 Python 的标准 Tk GUI 工具包的接口 .Tk 和 Tkinter 可以在大多数的 Unix 平台下使用,同样可以应用在 Windows 和 Macintosh 系统里。Tk8…...

2023年浙江水利水电施工安全员精选真题题库及答案
百分百题库提供水利水电施工安全员考试试题、水利水电施工安全员考试预测题、水利水电施工安全员考试真题、水利水电施工安全员证考试题库等,提供在线做题刷题,在线模拟考试,助你考试轻松过关。 119.下列关于大模板按照的说法正确的是&#x…...
Solon2 开发之插件,三、插件体外扩展机制(E-Spi)
插件体外扩展机制,简称:E-Spi。用于解决 fatjar 模式部署时的扩展需求。比如: 把一些“业务模块”做成插件包放到体外把数据源配置文件放到体外,方便后续修改 其中, .properties 或 .yml 文件都会做为扩展配置加载&a…...
数据结构与算法(Java版) | 数据结构与算法的关系
从这一节起,咱们就要开始进入到「第二章——数据结构与算法的介绍」的学习中了,总的来说,第二章要讲解的内容其实也不是特别的多,内容也多偏理论,相信大家学起来是会比较轻松愉快的。 接下来,就请大家跟随…...
华科万维C++章节练习3_7
题目: 编程实现两种温度体系华氏温度和摄氏温度的相互转换; 以F作为华氏温度体系的单位,以C作为摄氏温度体系的单位。 要求当输入以F作为单位的温度值时(温度值范围[-500F~500F], 否则提示“数据输入有误!”)将其转换为对应的摄氏…...

CHAPTER 5 Jenkins SonarQube
Jenkins & SonarQube5.1 安装SonarQube1. 下载镜像2. 导出到其他服务器3. 准备工作4. docker-compose文件5. 启动容器5.2 登录SonarQube1.登录2. 安装中文语言插件3. 安装其他插件5.3 部署扫描器sonar-scanner1. 部署sonar-scanner2. 新建项目3. 扫描代码4. 查看报告5.4 Je…...
[AAAI 2023] Oral : Zero-shot 零样本/ Few-shot 少样本收录论文集合
零样本 (7篇): CALIP: Zero-Shot Enhancement of CLIP with Parameter-free AttentionGuo Ziyu; Zhang Renrui; Qiu Longtian; ma Xianzheng; Miao Xupeng; He Xuming; Cui BinMaximum Entropy Population-Based Training for Zero-Shot Human-AI CoordinationZhao …...
驱动开发 2.13
设备树 设备树就是一种描述硬件信息的树形结构,设备树上有很多设备节点,每一个设备节点都描述了一个硬件设备信息,设备节点中也可以再包含子设备节点和设备属性,同一个节点的不同属性是以链表结构存储,设备树有.dts设…...

【数据库】sql函数和多表关联查询
目录 一,SQL函数 1,聚合函数 1, count函数 2, AVG函数 3, SUM函数 4, MAX函数 5, MIN函数 6,数据分组——GROUP BY 7,限定组的结果,HAVING 8&#x…...
6-周赛332总结
6-周赛332总结 过了Q1和Q2,Q2知道用二分但是边界处理的不是很好,迷迷糊糊过的(手动再移动了下返回值…) Q3知道将子字符串的值取出来,将最短位置放在哈希表中,然后异或在哈希表中找值。但是我这个猪头脑袋…...

嵌入式Qt 开发一个音乐播放器
上篇文章:RK3568源码编译与交叉编译环境搭建,进行了OK3568开发板软件开发环境搭建,通过编译RK3568的源码,可以得到Qt开发的交叉编译相关工具。 本篇,就来在搭建好的软件开发中,进行Qt软件的开发测试。由于…...
2023秋招万得集团AI算法岗面经分享
本专栏分享 计算机小伙伴秋招春招找工作的面试经验和面试的详情知识点 专栏首页:秋招算法类面经分享 主要分享计算机算法类在面试互联网公司时候一些真实的经验 2022年 11.22下午AI算法岗面试 (1)一面35min 1、自我介绍 2、科研:长文本MRC...

RoI Transformer论文翻译详解
Learning RoI Transformer for Oriented Object Detection in Aerial Images 0.摘要 航空图像中的目标检测是计算机视觉中一个活跃而又具有挑战性的任务,因为它具有鸟瞰视角、高度复杂的背景和变化的物体外观。特别是在航空图像中检测密集的目标时,基于…...

Prometheus 自动发现监控AWS EC2实例
本文章简述对接自动发现AWS云EC2实例 前提环境: PromethuesGrafanaAWS IAM权限 涉及参考文档: AWS EC2Grafana 通用监控模板 一、IAM 用户创建 1、创建Prometheus 策略 策略规则: {"Version": "2012-10-17",&quo…...

从recat源码角度看setState流程
setState setState() 将对组件 state 的更改排入队列批量推迟更新,并通知 React 需要使用更新后的 state 重新渲染此组件及其子组件。其实setState实际上不是异步,只是代码执行顺序不同,有了异步的感觉。 使用方法 setState(stateChange | u…...

IDEA运行Tomcat出现乱码问题解决汇总
最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…...
Vim 调用外部命令学习笔记
Vim 外部命令集成完全指南 文章目录 Vim 外部命令集成完全指南核心概念理解命令语法解析语法对比 常用外部命令详解文本排序与去重文本筛选与搜索高级 grep 搜索技巧文本替换与编辑字符处理高级文本处理编程语言处理其他实用命令 范围操作示例指定行范围处理复合命令示例 实用技…...
java_网络服务相关_gateway_nacos_feign区别联系
1. spring-cloud-starter-gateway 作用:作为微服务架构的网关,统一入口,处理所有外部请求。 核心能力: 路由转发(基于路径、服务名等)过滤器(鉴权、限流、日志、Header 处理)支持负…...

Docker 运行 Kafka 带 SASL 认证教程
Docker 运行 Kafka 带 SASL 认证教程 Docker 运行 Kafka 带 SASL 认证教程一、说明二、环境准备三、编写 Docker Compose 和 jaas文件docker-compose.yml代码说明:server_jaas.conf 四、启动服务五、验证服务六、连接kafka服务七、总结 Docker 运行 Kafka 带 SASL 认…...

vscode(仍待补充)
写于2025 6.9 主包将加入vscode这个更权威的圈子 vscode的基本使用 侧边栏 vscode还能连接ssh? debug时使用的launch文件 1.task.json {"tasks": [{"type": "cppbuild","label": "C/C: gcc.exe 生成活动文件"…...

STM32F4基本定时器使用和原理详解
STM32F4基本定时器使用和原理详解 前言如何确定定时器挂载在哪条时钟线上配置及使用方法参数配置PrescalerCounter ModeCounter Periodauto-reload preloadTrigger Event Selection 中断配置生成的代码及使用方法初始化代码基本定时器触发DCA或者ADC的代码讲解中断代码定时启动…...

全球首个30米分辨率湿地数据集(2000—2022)
数据简介 今天我们分享的数据是全球30米分辨率湿地数据集,包含8种湿地亚类,该数据以0.5X0.5的瓦片存储,我们整理了所有属于中国的瓦片名称与其对应省份,方便大家研究使用。 该数据集作为全球首个30米分辨率、覆盖2000–2022年时间…...
鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院查看报告小程序
一、开发环境准备 工具安装: 下载安装DevEco Studio 4.0(支持HarmonyOS 5)配置HarmonyOS SDK 5.0确保Node.js版本≥14 项目初始化: ohpm init harmony/hospital-report-app 二、核心功能模块实现 1. 报告列表…...

让AI看见世界:MCP协议与服务器的工作原理
让AI看见世界:MCP协议与服务器的工作原理 MCP(Model Context Protocol)是一种创新的通信协议,旨在让大型语言模型能够安全、高效地与外部资源进行交互。在AI技术快速发展的今天,MCP正成为连接AI与现实世界的重要桥梁。…...
多模态图像修复系统:基于深度学习的图片修复实现
多模态图像修复系统:基于深度学习的图片修复实现 1. 系统概述 本系统使用多模态大模型(Stable Diffusion Inpainting)实现图像修复功能,结合文本描述和图片输入,对指定区域进行内容修复。系统包含完整的数据处理、模型训练、推理部署流程。 import torch import numpy …...