当前位置: 首页 > article >正文

AIoT 智变浪潮演讲实录 | 刘浩然:让硬件会思考:边缘大模型网关助力硬件智能革新

4 月 2 日,由火山引擎与英特尔联合主办的 AIoT “智变浪潮”技术沙龙在深圳成功举行,活动聚焦 AI 硬件产业的技术落地与生态协同,吸引了芯片厂商、技术方案商、品牌方及投资机构代表等 700 多位嘉宾参会。

会上,火山引擎边缘智能高级产品专家刘浩然通过“让硬件会思考:边缘大模型网关助力硬件智能革新”主题演讲,分享了边缘计算与大模型结合的前沿实践。火山引擎推出边缘大模型网关,解决 IoT 设备调用大模型的延迟、模型适配与成本痛点,通过接口标准化、多模型支持及边缘缓存等技术优势,实现就近访问与故障转移。同时,联合芯片厂商预置大模型能力,在智能玩具等场景提供定制行业智能体,加速硬件智能化进程。

图片

以下是演讲实录:

大家好!我来自火山引擎边缘计算团队,今天我和大家沟通的主题是“让硬件会思考:边缘大模型网关助力硬件智能革新”。

1.智能终端设备市场趋势及行业痛点

首先来看整体市场发展趋势,2025 年智能终端设备的增长数量和增长率比较高,增长率达到了 18.5%,随后几年增长率将逐步下降,但受益于整体市场,设备的数量规模依然比较庞大,所以增量市场比较可观。在成本层面, 2025 年,大模型的调用使得智能终端云端使用成本也有了较大的增幅,增幅达到 18.5%,这和设备的数量增幅呈现出非常强的正相关性,但在未来几年,智能终端云端调用成本的增幅将逐步放缓,这预示着随着新技术的迭代和应用,整体成本将有下降的趋势。

图片

越早抓住大模型越有利于市场份额的获取,同时行业也面临着一些问题和痛点。

  • 首先是响应延迟问题对业务时效性的影响。虽然大模型和 IoT 设备结合后,IoT 设备会变得更加智能,但在某些场景下,设备响应可能迟钝,比如弱网环境或是不恰当地使用模型,导致延时剧增等。斯坦福大学的研究显示,78% 的用户等待超过 3 秒后会产生焦虑,甚至有 15% 的用户会直接放弃交互。因此,在 IoT 设备和大模型结合的价值验证阶段,因时效性带来的用户流失、用户参与度的缺失,对发展都非常不利。

  • 其次是多模型、多 Provider 带来的技术复杂度和稳定性保障的问题。大模型时代百花齐放,很多不同的大模型相继问世。大模型有自己的特点,供应商有自己的定价策略,那在什么场景下选择哪个大模型、哪家供应商,才可以使场景应用达到效率和成本的最优?这是一个摆在整个行业面前待解决的技术难题。

  • 最后是成本压力对企业运营的制约问题,现在的智能硬件数量急剧增加、生命周期较长,这两个因素叠加导致整体成本居高不下,什么方法才可以降低成本呢?这也是我们团队一直在思考的问题。

图片

2.边缘大模型网关,助力大模型加速落地

针对行业面临的问题和痛点,向大家介绍一下火山引擎边缘智能,它是一个面向边缘领域的能力中台和解决方案的孵化平台,基于边缘计算、人工智能、IoT、大模型等技术能力,为客户提供一整套端边云协同框架和平台应用的开发工具,帮助各行各业以低成本来构建边缘原生的智能体。火山引擎边缘智能主要分成三个产品,边缘智能平台、边缘大模型网关以及物联网平台。

图片

今天重点介绍边缘大模型网关产品。边缘大模型网关支持用户通过一个 API 接口访问多家大模型提供商的模型和智能体,在端侧基于遍布全球的边缘节点就近调用。利用边缘云基础架构的优势,通过语义缓存减少回源,平台显著提高模型访问速度,为终端用户提供更快速、更可靠的 AI 服务体验。同时通过边缘推理服务调用,为终端应用的端边云推理需求提供统一出口,以及推理服务云边调度,实现云端算力卸载。

图片

基于覆盖全国各省市和运营商的边缘节点,边缘大模型网关在更靠近用户的位置提供大模型就近、快速调用,有效降低调用时间、提升调用稳定性、优化调用成本。当前,边缘大模型网关具备 6 大产品优势:

  • 第一是接口标准化,网关访问密钥与 OpenAI 的 API 和 SDK 完全兼容,面对多样化的端侧调用场景,方便集成,降低适配成本。

  • 第二是支持多种大模型,边缘大模型网关支持调用国内主要的模型提供商与多种大模型、智能体,同时,面向多样化的终端调用场景,支持多模态与大语言模型,满足调用多模型和多智能体的智能需求。

  • 第三是边缘缓存,边缘大模型网关利用缓存机制对请求就近存储,并在相同请求发出时就近调用,减少模型调用请求的回源次数,降低成本,为终端用户提供更快速、更可靠的 AI 服务体验。

  • 第四是就近访问,基于端侧请求发起位置,边缘大模型网关将请求就近路由到网络延时最低的节点,加速服务响应,提升服务质量。

  • 第五是自动重试,当请求调用超时或失败时,边缘大模型网关支持自动重试请求,降低手动运维成本。

  • 第六是故障转移,单模型故障时,边缘大模型网关支持自动切换备用模型,确保服务的连续性和可靠性。

同时,通过预置多领域 AI 智能体,涵盖语音对话、文字识别、目标检测、工业质检等 AI 能力,支持一键调用,助力快速构建场景化解决方案,边缘大模型网关希望把大模型相关的一系列功能以简单的方式提供给用户,形成一站式解决方案。

图片

除了在应用链路层提供保障调用稳定性、降低时延、提高效率等能力,边缘大模型网关也提供 AI 能力与服务,比如无缝兼容豆包大模型,同时预置了方舟大模型平台以及团队自研的模型和智能体,用户可以按需访问,而且可以上传自己训练的大模型,还可以基于预置智能体做编排、修改,上传自己开发的智能体,在边缘侧直接获取大模型能力。通过云边协同,实现快速响应。

图片

随着 Al+硬件的市场化程度持续提升,硬件制造厂商对于 AI 服务的集成与管控诉求也在持续扩展。比如对智能终端的长期维护、单台设备的 AI 服务用量管理等围绕智能终端生产全流程带来的问题,边缘大模型网关结合智能设备管理底座给出新解法。

面向市场需求,我们重磅升级了端智能解决方案,打通边缘大模型网关和智能设备管理平台,全面推出端智能实例。用户通过端智能实例提供的 OneSDK ,就可以完成设备接入、AI 服务调用、设备用量统计以及制定智能服务调用策略等,实现对智能硬件的全流程管理。

图片

3.边缘 AI 解决方案

边缘是最靠近用户的位置,很多的场景与边缘有天然结合的可能,针对具身智能、端智能芯片、智能玩具、仓储物流、创新教育、智慧园区等场景,边缘 AI 打造了针对性的场景解决方案:

  • 具身智能:端云协同计算底座与边缘 AI 结合,助力机器人场景应用开发,加速具身智能产业发展。

  • 端智能芯片:结合边缘架构优势与芯片生态,实现大模型就近调用,为 AI 应用生态建设提供底座。

  • 智能玩具:基于语音对话智能体解决方案,赋能玩具语音能力,助力大模型抵达用户"最后一公里"。

  • 仓储物流:对物流感知设备做精细化接入管理,实现打包台视频质检、SKU 的 AI 自动测量。

  • 创新教育:围绕云-边-端架构及场景应用构建方式,拓展校企合作新模式。

  • 智慧园区:依托设备接入、边缘推理等能力实现地产园区的数字化运营。

图片

下面以芯片与智能玩具为例,详细拆解边缘大模型网关如何助力硬件快速接入大模型。

3.1 边缘大模型网关-AI 芯片解决方案

针对芯片行业的调研表明,随着终端设备的 AI 应用生态愈加丰富,从端侧设备发起的 AI 服务调用越来越多,终端客户对芯片会提出更高的要求,不仅要求低功耗、高性能、更强的硬件性能,还希望芯片厂商能够在开发板侧提供面向终端场景的 AI 调用资源。

面向端侧设备调用的场景,边缘大模型网关深度适配芯片的兼容性,利用边缘的天然优势,基于端侧请求发起位置就近调用大模型服务,并通过大模型网关的产品能力提升响应速度,保障调用稳定性。通过边缘大模型网关-AI 芯片解决方案,可以实现芯片出厂时自带大模型能力,同时针对单个芯片实现用量限制、用量统计等,方便终端客户对芯片的能力、用量和场景实现深度的管控,拓展整体应用场景。

图片

边缘大模型网关-AI 芯片解决方案帮助终端设备实现了大模型的就近接入与查询加速,以更低的价格、更快的速度按需调用;同时,方案为每一片芯片提供唯一的身份验证,让端侧使用大模型更加安全可靠;此外,方案为芯片厂商的终端设备 AI 应用生态建设提供了产品与技术底座。具体来看,方案具备 5 个优势:

  • 调用认证:支持通过对称解密判断请求合法性,验证请求发起的终端设备与芯片厂商的关联关系。

  • 语义缓存支持开启语义缓存配置并设置缓存时间周期,降低调用成本,减少回源时间。

  • 调用顺序:支持针对网关访问密钥可调用的模型设置调用顺序,调用失败时依据调用顺序自动重试。

  • 多种模型:提供了包括大语言模型与多模态大模型的多种模型选择,可结合分发策略自由选择模型。

  • 数据监控:提供了设备维度、用户维度等多种维度的数据用量看板,实现调用趋势的可视化展示。

图片

3.2 边缘大模型网关-智能玩具解决方案

相比 AI 芯片解决方案,智能玩具解决方案的场景更加聚焦。随着少年儿童的成长与社会娱乐活动的演进,传统的陪伴玩具在新时期已经无法满足少年儿童的情感陪伴需求。通过科技化手段与 AI 能力为青少儿提供陪伴成为了玩具厂商的新发力点。

面向端侧设备调用的场景,边缘大模型网关可以定制行业智能体,例如针对智能玩具场景打造的玩具智能体具备记忆、技能、知识、编排工作流和图像流等能力,智能体利用大模型网关的就近调用天然优势,基于端侧请求发起位置为智能玩具注入 AI 响应能力,提升响应速度。

图片

同时,边缘大模型网关为终端智能玩具提供以大模型为底座的智能体就近调用提供一站式解决方案,助力大模型抵达用户“最后一公里”。具体来看,方案具备 3 个优势:

  • 标准接口:通过提供与 OpenAI 的 API 和 SDK 完全兼容的调用接口,面向端侧场景实现快速调用。

  • 场景化智能体面向青少儿陪伴玩具场景孵化而成的场景化智能体,一站式构建陪伴玩具 AI 能力。

  • 流式调用:通过 WebSocket 协议实现语音对话流式调用,面向语音场景实时诉求提高可用性。

图片

目前,火山引擎边缘智能已在多个行业场景落地,在这里也感谢用户和伙伴一贯的支持和帮助。面向未来,边缘智能团队将持续致力于开发更多优质功能,也希望携手各方伙伴共同把握时代发展机遇。

以上就是我的分享,谢谢大家!

相关文章:

AIoT 智变浪潮演讲实录 | 刘浩然:让硬件会思考:边缘大模型网关助力硬件智能革新

4 月 2 日,由火山引擎与英特尔联合主办的 AIoT “智变浪潮”技术沙龙在深圳成功举行,活动聚焦 AI 硬件产业的技术落地与生态协同,吸引了芯片厂商、技术方案商、品牌方及投资机构代表等 700 多位嘉宾参会。 会上,火山引擎边缘智能高…...

【Windows】系统安全移除移动存储设备指南:告别「设备被占用」弹窗

Windows系统安全移除移动存储设备指南:告别「设备被占用」弹窗 解决移动硬盘和U盘正在被占用无法弹出 一、问题背景 使用Windows系统时,经常遇到移动硬盘/U盘弹出失败提示「设备正在使用中」,即使已关闭所有可见程序。本文将系统梳理已验证…...

C++运算符重载全面总结

C运算符重载全面总结 运算符重载是C中一项强大的特性,它允许程序员为自定义类型定义运算符的行为。以下是关于C运算符重载的详细总结: 一、基本概念 1. 什么是运算符重载 运算符重载是指为自定义类型(类或结构体)重新定义或重…...

ArmSoM Sige5 CM5:RK3576 上 Ultralytics YOLOv11 边缘计算新标杆

在计算机视觉技术加速落地的今天,ArmSoM 正式宣布其基于 ​​Rockchip RK3576​​ 的旗舰产品 ​​Sige5 开发板​​ 和 ​​CM5 核心板​​ 全面支持 Ultralytics YOLOv11 模型的 RKNN 部署。这一突破标志着边缘计算领域迎来新一代高性能、低功耗的 AI 解决方案&am…...

【计算机网络】什么是路由?核心概念与实战详解

📌 引言 路由(Routing)是互联网的“导航系统”,负责将数据包从源设备精准送达目标设备。无论是浏览网页、发送消息还是视频通话,背后都依赖路由技术。本文将用通俗类比技术深度的方式,解析路由的核心机制。…...

【ubuntu】linux开机自启动

目录 开机自启动: /etc/rc.loacl system V 使用/etc/rc*.d/系统运行优先级 遇到的问题: 1. Linux 系统启动阶段概述 方法1:/etc/rc5.d/ 脚本延时日志 方法二:使用 udev 规则来触发脚本执行 开机自启动: /etc/…...

dnf install openssl失败的原因和解决办法

网上有很多编译OpenSSL源码(3.x版本)为RPM包的文章,这些文章在安装RPM包时都是执行rpm -ivh openssl-xxx.rpm --nodeps --force 这个命令能在缺少依赖包的情况下能强行执行安装 其实根据Centos的文档,安装RPM包一般是执行yum install或dnf install。后者…...

Java 在人工智能领域的突围:从企业级架构到边缘计算的技术革新

一、Java AI 的底层逻辑:从语言特性到生态重构 在 Python 占据 AI 开发主导地位的当下,Java 正通过技术重构实现突围。作为拥有 30 年企业级开发经验的编程语言,Java 的核心优势在于强类型安全、内存管理能力和分布式系统支持,这…...

操作系统导论——第19章 分页:快速地址转换(TLB)

使用分页作为核心机制来实现虚拟内存,可能会带来较高的性能开销。使用分页,就要将内存地址空间切分成大量固定大小的单元(页),并且需要记录这些单元的地址映射信息。因为这些映射信息一般存储在物理内存中,…...

计算机网络:流量控制与可靠传输机制

目录 基本概念 流量控制:别噎着啦! 可靠传输:快递必达服务 传输差错:现实中的意外 滑动窗口 基本概念 换句话说:批量发货排队验收 停止-等待协议 SW(发1份等1份) 超时重传:…...

SaaS、Paas、IaaS、MaaS、BaaS五大云计算服务模式

科普版:通俗理解五大云计算服务模式 1. SaaS(软件即服务) 一句话解释:像“租用公寓”,直接使用现成的软件,无需操心维护。 案例:使用钉钉办公、在网页版WPS编辑文档。服务提供商负责软件更新和…...

计算机网络 - 三次握手相关问题

通过一些问题来讨论 TCP 协议中的三次握手机制 说一下三次握手的大致过程?为什么需要三次握手?2 次不可以吗?第三次握手,可以携带数据吗?第二次呢?三次握手连接阶段,最后一次ACK包丢失&#xf…...

通过使用 include 语句加载并执行一个CMake脚本来引入第三方库

通过使用 include 语句加载并执行一个CMake脚本来引入第三方库 当项目中使用到第三方库时,可以通过使用 include 语句来加载并执行一个CMake脚本,在引入的CMake脚本中进行第三方库的下载、构建和库查找路径的设置等操作,以这种方式简化项目中…...

架构生命周期(高软57)

系列文章目录 架构生命周期 文章目录 系列文章目录前言一、软件架构是什么?二、软件架构的内容三、软件设计阶段四、构件总结 前言 本节讲明架构设计的架构生命周期概念。 一、软件架构是什么? 二、软件架构的内容 三、软件设计阶段 四、构件 总结 就…...

JMeter使用

1.简介 1.1 打开方式 ①点击bat,打开 ②添加JMeter系统环境变量,输⼊命令jmeter即可启动JMeter⼯具 1.2 配置 简体中文 放大字体 1.3 使用 ①添加线程组 ②创建http请求 2. 组件 2.1 线程组 控制JMeter将⽤于执⾏测试的线程数,也可以把⼀个线程理解为⼀个测…...

Ant Design Vue 表格复杂数据合并单元格

Ant Design Vue 表格复杂数据合并单元格 官方合并效果 官方示例 表头只支持列合并&#xff0c;使用 column 里的 colSpan 进行设置。 表格支持行/列合并&#xff0c;使用 render 里的单元格属性 colSpan 或者 rowSpan 设值为 0 时&#xff0c;设置的表格不会渲染。 <temp…...

Fiddler为什么可以看到一次HTTP请求数据?

1、作为代理服务器 Fiddler作为代理服务器&#xff0c;拦截了设备与互联网服务器之间的所有HTTP和HTTPS流量。当客户端&#xff08;如浏览器&#xff09;发送请求时&#xff0c;请求先到达Fiddler&#xff0c;然后由Fiddler转发到目标服务器&#xff1b;服务器的响应也会返回给…...

第十九讲 | XGBoost 与集成学习:精准高效的地学建模新范式

&#x1f7e8; 一、为什么要学习集成学习&#xff1f; 集成学习&#xff08;Ensemble Learning&#xff09; 是一种将多个弱学习器&#xff08;如决策树&#xff09;组合成一个强学习器的策略。它在地理学、生态学、遥感分类等领域表现尤为突出。 &#x1f4cc; 应用优势&#…...

基于 GoFrame 框架的电子邮件发送实践:优势、特色与经验分享

1. 引言 如果你是一位有1-2年Go开发经验的后端开发者&#xff0c;可能已经熟悉了Go语言在性能和并发上的天然优势&#xff0c;也曾在项目中遇到过邮件发送的需求——无论是用户注册时的激活邮件、系统异常时的通知&#xff0c;还是营销活动中的批量促销邮件&#xff0c;邮件功…...

ECharts 如何实现柱状图悬停时,整个背景区域均可触发点击事件

1. 前言 ECharts 柱状图的点击事件默认仅响应柱子本身的点击&#xff0c;本文旨在实现整个背景区域均可触发点击事件 2. 实现思路 核心&#xff1a;全局监听 坐标判断 数据转换 通过 getZr() 监听整个画布点击&#xff0c;结合像素坐标判断是否在图表区域内‌通过 containPi…...

金融简单介绍及金融诈骗防范

在当今社会&#xff0c;金融学如同一股无形却强大的力量&#xff0c;深刻影响着我们生活的方方面面。无论是个人的日常收支、投资理财&#xff0c;还是国家的宏观经济调控&#xff0c;都与金融学紧密相连。​ 一、金融学的概念​ 金融学&#xff0c;简单来说&#xff0c;是研…...

cursor+高德MCP:制作一份旅游攻略

高德开放平台 | 高德地图API (amap.com) 1.注册成为开发者 2.进入控制台选择应用管理----->我的应用 3.新建应用 4.点击添加Key 5.在高德开发平台找到MCP的文档 6.按照快速接入的步骤&#xff0c;进行操作 一定要按照最新版的cursor, 如果之前已经安装旧的版本卸载掉重新安…...

软件版本命名规范Semantic Versioning

​语义化版本控制&#xff08;Semantic Versioning&#xff0c;简称 SemVer&#xff09;是一种广泛采用的版本号管理规范&#xff0c;旨在通过版本号传达软件更新的性质和影响&#xff0c;帮助开发者和用户理解每次发布的变更内容 &#x1f522; 版本号结构 语义化版本号通常采…...

Uniapp: 大纲

目录 一、基础巩固1.1、Uniapp:下拉选择框ba-tree-picker1.2、Uniapp&#xff1a;确认框1.3、Uniapp&#xff1a;消息提示1.4、Uniapp&#xff1a;获取当前定位坐标 二、项目配置2.1、Uniapp&#xff1a;修改端口号2.2、Uniapp&#xff1a;本地存储 一、基础巩固 1.1、Uniapp:…...

Kubernetes控制平面组件:API Server Webhook 授权机制 详解

云原生学习路线导航页&#xff08;持续更新中&#xff09; kubernetes学习系列快捷链接 Kubernetes架构原则和对象设计&#xff08;一&#xff09;Kubernetes架构原则和对象设计&#xff08;二&#xff09;Kubernetes架构原则和对象设计&#xff08;三&#xff09;Kubernetes控…...

【KWDB 创作者计划】_产品技术解读_1

【KWDB 创作者计划】_产品技术解读_1 一、存储引擎:高性能混合存储架构1. 存储模型设计2. 存储压缩与编码3. 持久化策略二、KWDB 组件源码解析1. 核心模块分层架构2. 关键组件源码剖析三、KWDB 特性代码通读1. 实时分析能力(Real-Time OLAP)2. 混合负载隔离(HTAP)3. 智能索…...

Python Cookbook-6.2 定义常量

任务 你需要定义一些模块级别的变量(比如命名的常量)&#xff0c;而且客户代码无法将其重新绑定。 解决方案 你可以把任何对象当做模块一样安装。将下列代码存为一个模块const.py&#xff0c;并放入你的Python的sys.path 指定的目录中: class _const(object):class ConstEr…...

【Python爬虫】简单案例介绍2

本文继续接着我的上一篇博客【Python爬虫】简单案例介绍1-CSDN博客 目录 跨页 3.2 环境准备 跨页 当对单个页面的结构有了清晰的认识并成功提取数据后&#xff0c;接下来就需要考虑页面之间的跨页问题。此时我们便迎来了下一个关键任务&#xff1a;如何实现跨页爬取&#xf…...

【神经网络】python实现神经网络(四)——误差反向传播的基础理论

一.反向传播 本章将介绍能够高效计算权重参数的梯度的方法——误差反向传播法,这里简单介绍一下什么是反向传播,加入有个函数y = f(x),那么它的反向传播为图下这个样子: 反向传播的计算顺序是,将输入信号E乘以节点的局部导数,然后将结果传递给下一个节点。这里所…...

【SQL】COUNT... FILTER 的适用场景

【SQL】COUNT... FILTER 的适用场景 一、引言二、FILTER 基础学习2.1 语法解析2.2 适用范围2.2.1 主流数据库支持情况 2.3 技术优势2.3.1 性能优化2.3.2 等阶写法对比 2.4 适用场景2.4.1 多维统计报表2.4.2 动态数据过滤2.4.3 复杂条件处理 三、总结 一、引言 今天参加业务评审…...