产品经理的大语言模型课 04 -模型应用的云、边、端模式对比
目录
- 算力部署方式的影响因素
- 数据量
- 计算难度
- 前期投入
- 数据隐私
- 应用规模与泛化能力
- 云、边、端部署的特点和对比
- 典型场景举例
- 社区人脸门禁
- 后厨老鼠识别
- 未来展望
算力部署方式的影响因素
最近和人工智能从业者进行了非常广泛的沟通,尝试对模型应用的云、边、端模式进行对比。
2015 年前后语音和图片相关的人工智能应用逐渐兴起,目前在不少通用场景下,都已经有了比较成熟的 AI 应用服务,例如人脸比对、车牌识别等。
而人工智能的落地离不开“计算能力”,或者说算力。考虑到业务场景下各种因素的影响,算力部署的位置选择就有所不同。
数据量
在很多应用场景中,尤其是与物联网终端设备相关的场景下,设备采集的数据非常庞大,如果将所有原始数据上传云端再进行处理,带宽费用可能远超计算成本。
以 200 万像素摄像机为例,即便采用最新的 H.265 编码,一台摄像机一天的录像空间也要 20G 以上。如果所有视频都进行实时上传,占用的带宽就是 2Mb/s,公有云一年的带宽费用就超过 1000 元。
这时,我们通常会考虑在边缘侧,也就是在设备上,或者局域网内,完成数据的初步筛选和处理,减少上传云端的数据量。
计算难度
当面临复杂的计算任务,如人工智能训练、科学模拟或密码学运算时,需要强大的算力支持。这导致对高性能硬件的需求增加,如GPU、TPU或高性能CPU集群。
举个例子,如果你希望部署 DeepSeek R1 满血版,根据某些供应商提供的部署方案,需要两张 H20 的显卡,整体部署费用达到 300 万以上。
绝大多数的项目都没有这么充足的预算。
但是有一些简单的任务,例如图像识别中的目标标定、文字识别、基本人脸比对等,算法成熟,算力要求也不高,这些任务可能只需要 2T,甚至是 0.5T 的算力。
市面上能够提供这种能力的芯片供应商则非常多,我们可以选用一些性价比更高的设备。而这些设备放在专业的机房里,占用带宽资源的同时,又无法提供足够的计算价值,通常难以为公有云提供商带来丰厚的利润,所以他们也无意做这样的事情。
所以我们可以把这些低算力的设备,部署在边缘侧。
前期投入
正如许多餐饮店由于不知道后续经营效果如何,所以在开店早期,对大部分贵重的设备采用租赁的方式。
当提到通过人工智能降本增效时,绝大多数企业主对服务的效果是不明确的,他们自然希望能够小成本验证效果。所以租赁模式就是他们的首选。
而边缘设备,尤其是存在绑定关系的边缘设备,其租赁、回收的难度均较大,这类的供应商往往不存在;而云端租赁正是公有云的成熟商业模式,相对容易实现。
数据隐私
在处理医疗、监管、金融等敏感数据时,算力部署必须符合严格的安全标准和法规要求。很多项目要求数据不能上传公网。
同样因为数据隐私的问题,模型训练的数据往往不是公开的,这也意味着市面上难有公开训练的模型,如果客户自己有充足的数据,自己进行模型的训练和部署。
那么在这些时候,边缘化部署就是唯一的选择。
应用规模与泛化能力
2015 年开始,图像类的人工智能算法就已经开始发展和商业化尝试,但十年过去了,我们看到的通用的图像类人工智能算法并没有很多。
其中一个重要原因正是标注数据的缺失,导致算法训练的效果一般,检出率及检准率不足,导致难以商用。换言之,除非场景足够通用、数据量足够大,都难以训练出一个有效的算法模型。
由于使用人群较小,需求并发少,云端租赁的商业逻辑不成立,云服务商不愿意提供此类服务。实际上找 ISV 协助开发难度也较大。
同时训练数据量小,模型泛化能力不足,一种可行的思路是针对特定的场景,进行模型微调训练,并进行针对性部署,每个场景下的模型都是进行过训练的。
因此针对使用人群较小、数据量不足的场景,边缘化部署就变成了更合理的选择。
云、边、端部署的特点和对比
人工智能算法落地的算力部署,往往有云、边、端三种方式:
- 云端:将计算资源(如CPU、GPU、存储、网络等)集中部署在远程的数据中心,通过互联网向用户提供计算服务
- 边缘:计算资源部署在靠近数据源或用户终端的边缘节点上,这些边缘节点可以是小型数据中心、基站、路由器、网关等设备,和终端设备在同一个局域网内
- 终端:计算资源部署在用户终端设备上,如智能手机、平板电脑、智能摄像头、物联网设备等
| 特性 | 云端 | 边缘 | 终端 |
|---|---|---|---|
| 算力 | 强大,无限制 | 中等,4T-200T,通常只支持 INT8 | 较弱,通常小于 4T,通常只支持 INT8,设置 INT4 |
| 资源部署 | 灵活,支持租赁 | 灵活 | 固定 |
| 模型定制 | 缺乏 | 支持 | 支持 |
| 算力浪费 | 较少 | 较少 | 潜在较多 |
| 并发处理 | 难处理 | 好处理 | 无并发问题 |
| 网络费用 | 高 | 低 | 无网络费用 |
| 数据隐私 | 有风险 | 安全 | 安全 |
典型场景举例
社区人脸门禁
社区人脸门禁场景是一个典型的智能安防应用,它利用人脸识别技术,实现对社区出入口的智能化管理。可以实现以下功能:
- 业主刷脸直接进出小区、单元门
- 访客在线填写信息,录入人脸,
- 记录家政、快递、外卖等人员的出入情况,并进行有效管理
同时我们需要兼顾:
- 小区业主人脸数据属于个人隐私数据,在采集、存储、使用上,需要注意
- 社区里通常有个机房,机房里已经部署了服务器,作为小区监控、社区服务的载体
- 如果宽带供应商除了问题,不应该影响小区业主的使用
为了实现这些功能:
- 首先需要采集人脸数据,并形成人脸库
- 在小区大门、单元门等地,安装人脸采集设备(门禁等),可以识别人脸
- 人脸采集后,我们需要通过算法进行人脸比对
因此比较合理的方案架构,可能就是:
- 云端:负责图片的初步采集,支持业主、访客等人员上传人脸,并下发到社区边缘计算设备,但不做图片存储
- 边缘:
- 对人脸图片进行编码,形成特征值,并进行存储,形成人脸库
- 对于终端能力较弱的,可以由边缘进行人脸比对
- 对人脸识别记录进行存储和汇总、分析
- 终端:
- 进行基本的人脸识别、人脸采集
- 较强的终端可以直接进行人脸比对,并上报识别结果给社区服务器(边缘)
后厨老鼠识别
后厨是食品加工的关键场所,一旦出现鼠患,将极大地增加食品污染的风险。目前食品安全作为政府监管的重要方向,监管需求逐渐提升。
另一方面识别老鼠的行动轨迹,能够帮助企业规范后厨管理,提升连锁店运营能力,保护企业形象。
实现上,就是希望在后厨安装摄像机,或利用原有的摄像机,完成监控画面采集,并对画面中有老鼠的画面和视频进行识别分析。实现后厨老鼠识别的难点在于:
- 由于涉及企业形象,公开的后厨老鼠数据往往是缺失的,因此目前老鼠识别算法并不成熟
- 老鼠目标较小,且形态较多,皮鞋、帽子、桌腿等都可能被识别为老鼠,检出和检准率难以同时保障
- 很多连锁店无法为终端设备提供免费的网络环境,需要借助物联网卡,因此流量费较高
同时我们要综合考虑终端设备和边缘计算设备的成本及能力情况:
- 目前市面上具有老鼠识别功能的摄像机较少,且价格相对较高,而支持定制的能力较弱
- 具有边缘计算能力的 AI 盒子供应商较多,产品价格相对较优,且内置 Linux 的系统,可以进行服务定制
- 以 4T 算力的边缘盒子为例,可以对 4 路摄像机进行单个算法的视频分析
所以目前比较合理的方案架构是:
- 终端(通常是 2-4 路摄像机):
- 进行初步的筛查,例如移动侦测等
- 边缘
- 作为视频存储介质
- 对鼠患高发时段(夜间)的视频进行初步筛查,重在检出而非检准
- 将老鼠识别结果上报到云端
- 其他必要的本地管理能力
- 云端
- 作为连锁经营统一管理平台
- 对老鼠检出结果进行进一步筛查,重在检准
- 生成老鼠活动轨迹、老鼠识别报告等
这里做一些额外的延伸。后厨还有一些其他的人工智能应用,例如垃圾桶是否敞开、是否戴口罩、是否戴帽子、是否有抽烟等,都可以通过边缘计算盒子来完成。
刚刚有提到 4T 算力的边缘盒子可以对 4 路摄像机进行单个算法的视频分析。那个如果涉及到多个算法,又不想更换算力更强(更昂贵)的设备该怎么办?常见的做法有几种:
- 从视频识别改为抽帧图片识别:视频每秒可能多达 20 帧,如果改为每秒抽一帧进行分析,能够大大降低算力要求
- 训练多合一的算法:一个算法支持多种目标检测,比多个只支持单个目标检测的算法要更经济
- 减少识别时间片段:各个服务的重点检测时段不同,例如鼠患是 0-6 点,工作规范是 10-14 点、16-23 点,我们可以只针对风险高发时段进行检测
未来展望
我们看得到的趋势是,随着技术发展以及计算资源价格的下降,终端和边缘设备的计算能力会越来越强。
这也意味着很多原先云端才能做的服务,边缘也可以做了;很多原先边缘才能做的事情,终端也可以自行处理了。
这种计算模式的转变,不仅优化了资源配置,也为人工智能的应用带来了新的可能性。未来,我们或许能看到更多个性化、定制化的人工智能服务,它们将更加贴近我们的需求,让生活变得更加智能和便捷。
相关文章:
产品经理的大语言模型课 04 -模型应用的云、边、端模式对比
目录 算力部署方式的影响因素数据量计算难度前期投入数据隐私应用规模与泛化能力 云、边、端部署的特点和对比典型场景举例社区人脸门禁后厨老鼠识别 未来展望 算力部署方式的影响因素 最近和人工智能从业者进行了非常广泛的沟通,尝试对模型应用的云、边、端模式进…...
机器学习(八):K-Means聚类原理与实战
声明:未经允许禁止转载与抄袭。 前言 k k k均值( k k k-means)聚类算法是一种经典的无监督聚类算法,本文将深入解析其理论原理,并在真是数据集上进行算法实践,话不多说,请看下文。 算法原理 …...
基于yolo11的BGA图像目标检测
1.产生图像数据的分辨率 2.产生图像的大小 3.产生图像是黑白或是RGB彩色 灰度图像,达到识别要求,减少计算量 4.标注数据的精准程度 1.模型标注后,少量标注全部人工校验,大量数据抽检,部分人工检验 2.明确边界框贴合…...
分享一些新版GPT-4o使用方式!能多模态生图!
目前GPT-4o的整体测评,真的很惊艳。 不知道又有多少人因为OpenAI的这次更新而失业,当然只要AI用得好,会有更多人因之而受益!很多人表示不知道怎么用,对于门外汉来说,4o似乎有点高端。 今天就给大家介绍几…...
【stm32--HAL库DMA+USART+空闲中断不定长收发数据】
串口通信-Hal库实现不定长度收发,DMAUSART DMA串口STM32CUBEMX配置(工程创建)基础配置时钟配置工程配置 代码编写现象 DMA 在正式配置之前,我们先来一起简单了解一下DMA。DMA(Direct Memory Access,直接内…...
【算法中的数学】欧拉筛埃氏筛
筛质数 题目传送门 题目链接 一、题目描述 给定一个正整数 n,请你求出 1∼n 中质数的个数。 输入格式 共一行,包含整数 n。 输出格式 共一行,包含一个整数,表示 1∼n 中质数的个数。 数据范围 1 ≤ n ≤ 10⁶ 输入样例&am…...
【SPP】蓝牙串口配置中LM互操作性要求深度解析
在蓝牙协议栈中,链路管理器(Link Manager, LM)承担着链路建立、安全管理、功耗控制等核心功能。对于串行端口配置文件(SPP)而言,LM 的互操作性直接影响连接稳定性、数据安全性和设备功耗。本文基于蓝牙核心…...
Java迭代器【设计模式之迭代器模式】
目录 一.前言 二.正文 1.我写的类为什么不能使用增强for(迭代器遍历) 2.代码健全性——迭代器常见的两个Exception 1.NoSuchElementException 2.ConcurrentModificationException 三.后言 一.前言 本篇面向对象主要为和我一样的小白,主要是对迭代器模式的浅…...
Eclipse IDE
创建新的Java项目和类 在 Eclipse IDE 中创建一个新的 Java 项目和 Java 类的步骤如下: 1. 创建新的 Java 项目 打开 Eclipse IDE。在菜单栏中,点击 File > New > Java Project。在弹出的对话框中,输入项目名称(例如&…...
【面试篇】多线程
基础概念 线程的生命周期有哪些状态?它们是如何转换的? 答案:线程的生命周期有以下六种状态: 新建(New):线程被创建但尚未启动,此时线程对象已被分配内存空间,相关属性已…...
MySQL表缺乏主键或唯一索引对主从复制的深度影响及解决方案
引言 在MySQL数据库设计中,主键(Primary Key)和唯一索引(Unique Index)不仅是数据完整性的基石,更是主从复制(Replication)可靠性的关键。然而,许多开发者或DBA因历史遗…...
计算机视觉算法实战——基于YOLOv8的自动驾驶障碍物实时感知系统
✨个人主页欢迎您的访问 ✨期待您的三连 ✨ ✨个人主页欢迎您的访问 ✨期待您的三连 ✨ ✨个人主页欢迎您的访问 ✨期待您的三连✨ 引言:自动驾驶感知系统的关键挑战 自动驾驶技术正以前所未有的速度重塑交通出行方式ÿ…...
【boost搜索引擎】下
boost搜索引擎 1. 编写搜索引擎模块 Searcher2. 编写 http_server 模块3. 编写前端模块4. 添加日志5. 补充 去掉暂停词6. 项目扩展方向 1. 编写搜索引擎模块 Searcher 这一模块主要提供建立索引,以及收到用户的发起的http请求通过Get方法提交的搜索关键字ÿ…...
数据结构优化DP总结
单调栈:Codeforces Round 622 (Div. 2) C2. Skyscrapers (hard version) 简单来讲就是最后需要呈现出一个单峰数组,使得总高度最高。 最开始想到暴力枚举每一个元素都充当最高的“单峰”,但是这里的 n 过大,这样枚举肯定会TLE。 …...
[Linux系统编程]进程间通信—system V
进程间通信—system V 1. System V 共享内存(Shared Memory)1.1 共享内存的建立过程1.2 共享内存函数2. System V 消息队列(Message Queues)3. System V 信号量(Semaphores)4. 总结前言: 之前所提的管道通信是基于文件的,OS没有做过多的设计工作。 system V 进程间通信…...
Eigen库几何模块深度解析与实践指南
Eigen库几何模块深度解析与实践指南 a. Eigen几何模块概述 i. 几何模块的核心功能 在三维空间中,几何变换是描述物体位置和姿态变化的基础,其数学基础涵盖了线性代数中的矩阵运算等知识。Eigen库的几何模块为这些变换提供了高效且便捷的实现方式。 旋转、平移和缩放是三维…...
第十四届蓝桥杯大赛软件赛省赛C/C++ 大学 B 组(部分题解)
文章目录 前言日期统计题意: 冶炼金属题意: 岛屿个数题意: 子串简写题意: 整数删除题意: 总结 前言 一年一度的🏀杯马上就要开始了,为了取得更好的成绩,好名字写了下前年2023年蓝桥…...
C语言常见3种排序
主要是三种排序方法:冒泡排序、选择排序、插入排序。 文章目录 一、冒泡排序 1.代码: 2.工作原理: 3.具体过程: 二、选择排序 1.代码 2. 工作原理 3.具体过程: 三、插入排序 1.代码 2.工作原理 3.具体过程 总结 一、…...
分析sys高问题的方法总结
一、背景 sys高的问题往往属于底层同学更需要关注的问题,sys高的问题往往表现为几种情况,一种是瞬间的彪高,一种是持续的彪高。这篇博客里,我们总结一下常用的分析方法和分析工具的使用来排查这类sys高的问题。 二、通过mpstat配…...
智谱发布AI Agent“AutoGLM沉思”,开启AI“边想边干”新时代
近日,智谱正式推出全新AI Agent产品——AutoGLM沉思,标志着人工智能从“思考”迈向“执行”的关键突破。该智能体不仅具备深度研究能力,还能自主完成实际操作,真正实现“边想边干”的智能化应用。 在演示环节,智谱展示…...
使用Leaflet对的SpringBoot天地图路径规划可视化实践-以黄花机场到橘子洲景区为例
目录 前言 一、路径规划需求 1、需求背景 2、技术选型 3、功能简述 二、Leaflet前端可视化 1、内容布局 2、路线展示 3、转折路线展示 三、总结 前言 在当今数字化与智能化快速发展的时代,路径规划技术已经成为现代交通管理、旅游服务以及城市规划等领域的…...
【小兔鲜】day02 Pinia、项目起步、Layout
【小兔鲜】day02 Pinia、项目起步、Layout 1. Pinia2. 添加Pinia到Vue项目3. 案例:Pinia-counter基础使用3.1 Store 是什么?3.2 应该在什么时候使用 Store? 4. Pinia-getters和异步action4.1 getters4.2 action如何实现异步 1. Pinia Pinia 是 Vue 的专…...
PyTorch 激活函数
激活函数是神经网络中至关重要的组成部分,它们为网络引入了非线性特性,使得神经网络能够学习复杂模式。PyTorch 提供了多种常用的激活函数实现。 常用激活函数 1. ReLU (Rectified Linear Unit) 数学表达式: PyTorch实现: torch.nn.ReLU(inplaceFals…...
魔塔社区使用llamafactory微调AI阅卷试题系统
启动 LLaMA-Factory 1. 安装 LLaMA-Factory 执行安装指令 git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory pip install -e ".[torch,metrics]"解决依赖冲突 如果遇到依赖冲突,可使用以下命令安装,不…...
Java面试黄金宝典29
1. 什么是普通索引和唯一性索引 定义: 普通索引:是最基本的索引类型,它为数据表中的某一列或多列建立索引,以加快数据的查询速度。它不限制索引列的值重复,允许存在多个相同的值。唯一性索引:在普通索引的基…...
git `switch` 命令详解与实用示例
文章目录 git switch 命令详解与实用示例git switch vs git checkoutgit switch 用法1. 切换到已有分支2. 创建并切换到新分支3. 切换到上一个分支4. 切换到远程分支(自动创建本地分支并追踪远程)5. 放弃未提交的修改并切换分支 总结 git switch 命令详解…...
Oracle中文一二三四排序【失败】
原文地址: Oracle数据库如何对中文的一二三四五六七八九十数进行正序排列排序_中文数字排序-CSDN博客 自定义排序函数 -- 自定义中文映射阿拉伯数字函数 CREATE OR REPLACE FUNCTION P_ORDER_CHINESE_TO_ARABIC(V_NUM VARCHAR2) RETURN NUMBER IS BEGIN-- 根据…...
AWS S3 和 Lambda 使用
目录: AWS概述 EMR Serverless AWS VPC及其网络 关于AWS网络架构的思考 AWS S3 和 Lambda 使用 本文将通过一个实例来说明如何使用 AWS S3 和 Lambda。 使用场景:通过代码将文件上传到S3,该文件需要是公开访问的,并对上传的文件进…...
Mysql 在什么样的情况下会产生死锁?
在 MySQL 中,死锁是指两个或多个事务相互等待对方释放锁,导致所有相关事务无法继续执行的情况。死锁会影响数据库的并发性能,因此需要及时检测并处理。假设有两个事务 T1 和 T2: 事务 T1 首先锁定 表 A 的行 1。然后尝试锁定 表 B…...
符号秩检验
内容来源 非参数统计(第2版) 清华大学出版社 王星 褚挺进 编著 符号秩检验 在符号检验的基础上,增加了数据绝对值大小的信息 检验统计量 用一个简单的例子来说明 样本数据 X i , i 1 , ⋯ , 6 X_i,i1,\cdots,6 Xi,i1,⋯,6 如下 X …...
