将AI大模型装进你的手机,你愿意么?



大数据产业创新服务媒体
——聚焦数据 · 改变商业
AI大模型的发展,有两个方向,一个是模型越做越大,以规模来提升性能。还有一个重要的方向,就是通过将模型做小,来嵌入手机、电脑等计算终端,这同样是值得关注的发展方向。
终端化的浪潮,意味着大模型将直接嵌入到个人设备中,这无疑将为用户带来更加个性化和智能化的体验。手机和PC制造商纷纷布局,试图通过集成大模型来提升产品的竞争力。
都有哪些PC厂商在积极引入大模型?
先来看PC厂商。
1. 联想
联想推出了首款AI PC产品,该设备运用了联想自研的大模型压缩技术,允许设备在本地运行个人大模型,无需云端操作,以此确保个人隐私和数据安全。此外,联想还推出了两款AI服务器——问天WA7780 G3 AI大模型训练服务器和问天WA5480 G3 AI训推一体服务器。
2. 惠普
惠普与星环科技合作,推出了面向大模型领域的一体机服务平台AI一体机。该一体机结合了星环大模型开发和应用平台Sophon LLMOps的产品能力,旨在为企业提供大模型的开发和应用支持。
3. 戴尔
戴尔与Meta合作,尝试在其本地基础设施上部署Llama 2大语言模型(LLM),以减少对云设施的依赖。戴尔的生成式AI验证设计计划,结合了戴尔服务器套件与英伟达GPU、存储及软件,主要针对涉及自然语言生成的应用场景。戴尔还提供部署和配置指导,帮助客户快速启动和运行AI模型。
4. 微软
微软虽然不是终端PC厂商,但其确实PC操作系统的霸主,是PC端大模型的关键玩家。微软正在积极推动大模型技术在PC端的集成和应用,以提升用户体验和设备智能化水平。通过发布Windows Copilot,微软将AI助手功能嵌入到Windows操作系统中,允许用户直接与AI大模型交互,执行各种任务。
5月21日,微软发布了Copilot+ PC方案,将旗下AI助手Copilot全面融入Windows 11系统。微软的两款Copilot+ PC系列产品,Surface Laptop 7和Surface Pro 11。Copilot+ PC还推出了Recall(回忆)功能,利用AI访问用户在PC上见过的任何内容,将其作为记忆的一部分。

有哪些手机厂商在积极引入大模型?
再来看看手机厂商。
1. 华为
华为在大模型技术的应用上表现积极,已经将盘古大模型集成到其手机系统中,特别是HarmonyOS 4系统全面接入盘古大模型,成为全球首个嵌入了AI大模型能力的移动终端操作系统。华为Mate60系列手机,搭载了基于多模态大模型技术实现的“智慧搜图”功能。此外,华为的语音助手小艺也融合了盘古自然语言大模型、盘古视觉大模型和盘古多模态大模型,最高版本参数高达1000亿,进一步强化了华为手机的AI能力。
2. 小米
小米在大模型技术上采取了渐进策略,已经自研了13亿参数端侧模型,并在手机端跑通了Demo,部分场景效果可以媲美云端60亿模型的运算效果。小米在AI大模型团队组建和研发投入上表现积极,小米的澎湃OS操作系统也在AI大模型方面进行了深度植入,小爱输入助手具备了AI大模型的文本创作能力和AI扩图能力,这些功能在小米14系列手机上有所体现。
3. OPPO
OPPO在大模型技术上的进展显著,发布了全新的AI战略,不仅在手机上推出AI超级智能体,还上线了AI Pro智能体开发平台。OPPO在其研究院下成立了AI中心,聚集AI研发人员,并投入大量资源到AI技术。OPPO还建立了全新数据中心,具备800P的算力,支持手机端运行千亿级参数的大模型。此外,OPPO发布了自主训练的安第斯大模型(AndesGPT),以“端云协同”为基础架构设计,旨在提升手机的智能体验。
4. vivo
vivo在大模型技术上同样积极布局,官宣将发布自研AI大模型矩阵,包括十亿、百亿、千亿三个不同参数量级的5款自研大模型,全面覆盖核心应用场景,并将首次应用于新操作系统OriginOS 4中。vivo的大模型技术旨在提升手机的图像识别、语音交互和智能辅助功能,增强用户体验。
5. 荣耀
荣耀在大模型技术上也有所作为,发布了全新一代旗舰智能手机荣耀Magic6系列,该系列手机将首发搭载荣耀自研的70亿参数端侧平台级AI大模型“魔法大模型”。
6. 三星
三星在大模型技术上的应用也值得关注,其S24系列手机已经上线了"即圈即搜"、“笔记助手”等AI应用。三星在自研大模型Gauss可用之前,选择了与中国厂商合作,借助百度智能云千帆平台、美图等的力量,以增强其AI能力。
7. 苹果
苹果公司在引入大模型技术方面展现出了积极的态度和显著的进展,据外媒报道,苹果正与谷歌商讨可能的合作协议,计划将谷歌的Gemini人工智能引擎集成到iPhone中。此外,苹果也在自研大模型技术,Ajax模型能在设备端快速生成响应,尽管更复杂的任务可能需要云端支持。苹果的多模态大模型Ferret展示了其在图像和语言理解方面的进步,该模型在多模态任务上表现优异,苹果还发布了OpenELM系列模型。随着iOS18系统的即将发布,苹果预计将引入大模型技术,这将是AI技术发展的新里程碑。
是什么驱动着大模型的终端化趋势?
那么,是什么原因在驱动大模型的终端化进程呢?数据猿看来,主要是技术和用户需求者两个要素在驱动。
在消费者需求方面,随着互联网技术的普及和数字化生活的发展,用户对智能化终端设备的需求日益增长。人们期望通过智能手机、平板电脑和个人电脑等设备,获得更加智能、个性化的服务体验。
例如,用户希望智能手机能够更准确地理解语音指令,希望个人电脑能够提供更加强大的图像和视频处理能力。同时,随着远程工作和在线教育的兴起,用户对终端设备的多任务处理能力和智能协作功能也有了更高的期待。大模型的终端化,正是对这一需求的积极响应。
技术进步是推动大模型终端化的关键力量,随着芯片制程技术的不断突破,如5纳米甚至更小制程的芯片开始量产,设备的计算能力得到了大幅提升。同时,AI算法的优化和模型压缩技术的发展,使得原本只能在云端运行的大模型得以瘦身,以适应终端设备的计算和存储资源。
要将大模型“装”手机、电脑,核心环节有哪些?
随着人工智能技术的飞速发展,大模型终端化已成为推动智能设备创新的关键力量。在这一进程中,技术与创新起到了至关重要的作用。要将大模型嵌入手机等终端,关键是要解决下面的问题:
1、模型压缩与优化
模型压缩与优化是大模型终端化进程中的核心环节,它们使得资源受限的终端设备,能够高效运行原本设计用于强大服务器的复杂模型。
例如:权重剪枝是模型压缩中最直接的方法,它通过移除模型中不重要的权重来减少模型的参数数量。这种方法可以显著减少模型的存储和计算需求,同时保持其核心功能;结构化剪枝通过移除整个神经网络层或通道来降低模型的复杂度,与权重剪枝相比,结构化剪枝对模型结构的改变更大,但可以带来更显著的压缩效果;自动化模型压缩算法,如神经网络架构搜索(NAS),可以自动发现既满足性能要求又具有较小尺寸的模型架构。这种自动化方法减少了人工干预,提高了模型开发和优化的效率。
此外,知识蒸馏是另一种有效的模型压缩技术,它涉及训练一个小型的“学生”模型来模仿一个大型的“教师”模型的行为。这种方法可以在减少模型大小的同时,保持较高的性能。硬件感知的模型设计考虑特定硬件架构的特性,设计出在该硬件上运行得更加高效的模型。随着专用AI硬件的普及,硬件感知的设计变得越来越重要。
2、终端算力的持续提升与边缘计算的发展
近年来,随着半导体技术的进步,尤其是芯片制造工艺的提升,电脑和手机等终端设备的处理器性能得到了显著增强。例如,移动设备中的系统芯片(SoC)已经从几个核心发展到多核处理器,并且集成了GPU、NPU或AI加速器。

这些专用硬件单元为执行深度学习模型提供了强大的支持,使得复杂的AI算法可以在本地设备上流畅运行。个人电脑和服务器的CPU和GPU性能也在不断提升,它们现在拥有更多的核心和线程,以及更高的时钟频率和改进的缓存架构,从而为运行大型机器学习模型提供了充足的算力。
此外,边缘计算作为一种分布式计算范式,它将数据处理和存储更靠近数据源的位置,这样可以减少数据传输的延迟,提高响应速度,特别适合对实时性要求高的应用场景。
在大模型终端化中,边缘计算允许终端设备在本地处理数据,而不是将所有数据发送到云端处理,这不仅提升了效率,也有助于保护用户隐私。
终端算力的提升和边缘计算的发展相结合,为大模型的部署和运行提供了更加坚实的基础。随着5G等高速通信技术的应用,边缘设备之间的互联互通也变得更加容易,这为构建分布式智能系统提供了可能,使得大模型可以在多个边缘节点上协同工作,实现更高级的智能功能。
3、隐私与安全
在终端设备上运行大模型,虽然带来了智能化的体验,但也引发了隐私和安全方面的担忧。终端设备通常包含大量个人敏感信息,如何在运行大模型的同时保护这些信息的安全,成为了一个重要问题。
为了解决这一问题,技术开发者采用了多种措施来加强隐私保护。例如,差分隐私技术通过添加噪声来模糊个人数据,保护用户隐私的同时允许进行数据统计分析。同态加密技术则允许在加密数据上直接进行计算,这样即使数据在云端处理,也可以保证其内容不被暴露。
大模型终端化才刚刚开始,还有一系列问题要解决
在大模型终端化的道路上,技术、经济、用户接受度以及社会伦理等方面的问题交织在一起,构成了一个复杂的挑战网络。
技术层面,模型的大小、计算资源的限制以及对实时性能的高要求是摆在开发者面前的三大难题。大模型的参数量庞大,存储和计算需求高,这对终端设备的硬件提出了挑战。
虽然模型压缩技术的发展为解决这一问题提供了可能,但如何在不损失关键性能的前提下实现有效压缩,仍是一个技术难题。此外,即使是压缩后的模型,其运行仍然需要较高的计算资源,这可能导致终端设备发热、电池消耗快,甚至在性能较差的设备上无法运行。
同时,许多应用场景对实时性能有着严格的要求,大模型在终端设备上的运行速度可能无法满足这些需求。
经济成本也是大模型终端化过程中不可忽视的因素,研发成本高昂,需要大量的人才、设备和时间投入。部署成本也不菲,特别是当需要额外的硬件支持,如高性能芯片时,这会增加设备的成本。此外,大模型的维护和更新也需要成本,尤其是在模型需要频繁更新以适应新的数据和场景时。这些成本最终可能会转嫁到消费者身上,影响产品的市场竞争力。
用户接受度是另一个关键因素,用户可能对在终端设备上运行大模型的性能和隐私保护有所顾虑。虽然本地运行可以保护隐私,但用户可能担心设备的性能是否能够满足需求。
面对这些挑战和问题,需要政府、企业和研究机构共同努力。技术上,需要继续研发更高效的模型压缩和运行技术;经济上,需要探索更合理的成本分摊机制;政策上,需要制定合理的监管政策和标准,引导大模型终端化技术的健康发展。
文:一蓑烟雨 / 数据猿
责编:凝视深空 / 数据猿





相关文章:
将AI大模型装进你的手机,你愿意么?
大数据产业创新服务媒体 ——聚焦数据 改变商业 AI大模型的发展,有两个方向,一个是模型越做越大,以规模来提升性能。还有一个重要的方向,就是通过将模型做小,来嵌入手机、电脑等计算终端,这同样是值得关注…...
前端面试题12-22
12 Proxy是什么,有什么作用? Proxy 是 ES6 (ECMAScript 2015) 引入的一种元编程特性。它允许你创建一个对象,该对象可以拦截和定义基本操作(例如属性查找、赋值、枚举、函数调用等)。Proxy 提供了一种机制,…...
【论文解读】Performance of AV1 Real-Time Mode
论文下载地址:Performance of AV1 Real-Time Mode 时间:2020.10 级别:IEEE 作者:Ludovic Roux 摘要 背景:COVID-19疫情增加了对数字互动的需求,使得实时或低延迟编解码器变得更加重要。现状:大多数编解码器,包括AV1,主要关注于编码效率,这是视频点播(VOD)的主要改…...
java处理中文脱敏
方法一,简单的,不计算文字长度去设置脱敏 public static String dataDesensitization1(String content){String regex "(.{2}).*(.{2})";return ReUtil.replaceAll(content, regex, matcher -> {try {if (CharSequenceUtil.isBlank(match…...
【Linux网络】端口及UDP协议
文章目录 1.再看四层2.端口号2.1引入linux端口号和进程pid的区别端口号是如何生成的传输层有了pid还设置端口号端口号划分 2.2问题2.3netstat 3.UDP协议3.0每学一个协议 都要讨论一下问题3.1UDP协议3.2谈udp/tcp实际上是在讨论什么? 1.再看四层 2.端口号 端口号(Po…...
Unity 生成模版代码
1、创建模版代码文本 using System.Collections; using System.Collections.Generic; using UnityEngine;public class ClassNameScritpItem : MonoBehaviour {public GameObject go;// Start is called before the first frame updatevoid Start(){go new GameObject();}// …...
【ai】chatgpt的plugin已经废弃
发现找不到按钮,原来是要申请: https://openai.com/index/chatgpt-plugins/ 发现申请已经跳转了,好像是废弃了? 不接受新插件了,但是openai的api 是可以继续用的。 https://openai.com/waitlist/plugins/We are no longer accepting new Plugins, builders can now create…...
2024年03月 Python(四级)真题解析#中国电子学会#全国青少年软件编程等级考试
Python等级考试(1~6级)全部真题・点这里 一、单选题(共25题,共50分) 第1题 运行如下代码,若输入整数3,则最终输出的结果为?( ) def f(x):if x==1:s=1else:s...
多旋翼无人机机场考哪些内容?
多旋翼无人机机场考试的内容主要包括理论和实飞两部分。 理论考试主要涵盖无人机相关的知识,包括无人机的原理、结构、操作规范等。 实飞考试则主要考察飞行技能,包括飞行操作、航线规划、飞行稳定性等。 具体来说,实飞部分可能包括使用GPS…...
【前端每日基础】day23——箭头函数
箭头函数是ES6(ECMAScript 2015)引入的一种新的函数表达式语法。相比传统函数,箭头函数有简洁的语法,并且不绑定自己的this、arguments、super或new.target。以下是详细介绍箭头函数的各个方面: 基本语法 单参数箭头函…...
27.Java中单例模式的实现方式
一、单例模式 单例模式(Singleton Pattern)是一种创建型设计模式,它确保一个类只有一个实例,并提供一个全局访问点来访问这个唯一实例。 单例模式中: 这个类只能有一个实例这个类必须自己创建自己的唯一实例这个类必须…...
C#面:当一个线程进入一个对象的方法后,其它线程是否可以进入该对象的方法?
一个线程在访问一个对象的一个synchronized方法时: 另一个线程可以同时访问这个对象的非同步方法。另一个线程不可以同时访问这个对象的普通同步方法。另一个线程可以同时访问这个对象的静态同步方法 ,即static synchronized修饰的方法 。另一个线程不可…...
express框架下后端获取req.body报错undefined
express框架下后端获取req.body报错undefined_express服务器post中data为undefine-CSDN博客 /*** 特殊说明:Express是一个单线程服务器器程序【必须存在指定的顺序调用,否则无法达到预期的效果】*//*** 第一步:创建一个Express实例对象,并且在匹配路由之…...
Element plus 低版本弹窗组件添加拖拽功能
在使用element plus 弹窗组件el-dialog 的时候,由于自己组件库版本过低,所以就会缺失某些功能,比如弹窗组件的可拖拽功能。因为某些原因element plus 组件库又不能升级,所以此时就需要自己为弹窗组件添加拖拽功能。共分为一下四个…...
计算机组成原理易混淆知识点总结(持续更新)
目录 1.机器字长,存储字长与指令字长 2.指令周期,机器周期,时钟周期 3.CPI,IPS,MIPS 4.翻译程序和汇编程序 5.计算机体系结构和计算机组成的区别和联系 6.基准程序执行得越快说明机器的性能越好吗? 1.机器字长,存储字长与指令字长 不同的机器三者…...
【STM32踩坑】HAL固件库版本过高导致烧录后无法运行问题
问题引入 目前STM32CUBEMX已经更新到了6.11版本,对应的固件库也一直在更新; 以STM32F1库为例,目前最新的库对应版本为1.8.5 但是我们会发现,如果直接使用1.8.5版本的固件库生成HAL源码后,烧录是可以烧录,但…...
芯片丝印反查
芯片丝印反查网 - IC芯片丝印,IC芯片代码,IC芯片印字,IC芯片顶标,SMD code,marking code,top mark芯查查-电子信息产业数据引擎 ic/芯片丝印反查网-芯查查...
C语言之指针详解(5)(含有易错笔试题)
文章目录 一、sizeof和strlen的对比1.1 sizeof1.2 strlen1.3 sizeof 和 strlen 的对比 二、数组和指针笔试题2.1 一维数组2.2 字符数组2.3 二维数组 三、指针运算笔试题3.1 题目13.2 题目23.3 题目33.4 题目43.5 题目53.6 题目63.7 题目7 一、sizeof和strlen的对比 有一个很神…...
discuzX2.5的使用心得 札记一
从开始接受php论坛的开发任务,对php感兴趣的我开始迷恋上discuz这个产品了, 像戴志康这样的创新人才,是我们这代人的骄傲和学习的榜样 应该是了解一下,啥事discuzX2.5,百度看一下 discuz x2.5_百度百科 看完百度词条…...
【Python】 探索Django框架的高并发处理能力
基本原理 Django是一个高级的Python Web框架,它鼓励快速开发和干净、实用的设计。Django遵循MVC(模型-视图-控制器)设计模式,提供了一个全栈式的解决方案,使得开发者能够快速构建功能丰富的Web应用。Django的高并发处…...
第19节 Node.js Express 框架
Express 是一个为Node.js设计的web开发框架,它基于nodejs平台。 Express 简介 Express是一个简洁而灵活的node.js Web应用框架, 提供了一系列强大特性帮助你创建各种Web应用,和丰富的HTTP工具。 使用Express可以快速地搭建一个完整功能的网站。 Expre…...
解决Ubuntu22.04 VMware失败的问题 ubuntu入门之二十八
现象1 打开VMware失败 Ubuntu升级之后打开VMware上报需要安装vmmon和vmnet,点击确认后如下提示 最终上报fail 解决方法 内核升级导致,需要在新内核下重新下载编译安装 查看版本 $ vmware -v VMware Workstation 17.5.1 build-23298084$ lsb_release…...
UDP(Echoserver)
网络命令 Ping 命令 检测网络是否连通 使用方法: ping -c 次数 网址ping -c 3 www.baidu.comnetstat 命令 netstat 是一个用来查看网络状态的重要工具. 语法:netstat [选项] 功能:查看网络状态 常用选项: n 拒绝显示别名&#…...
Python实现prophet 理论及参数优化
文章目录 Prophet理论及模型参数介绍Python代码完整实现prophet 添加外部数据进行模型优化 之前初步学习prophet的时候,写过一篇简单实现,后期随着对该模型的深入研究,本次记录涉及到prophet 的公式以及参数调优,从公式可以更直观…...
如何为服务器生成TLS证书
TLS(Transport Layer Security)证书是确保网络通信安全的重要手段,它通过加密技术保护传输的数据不被窃听和篡改。在服务器上配置TLS证书,可以使用户通过HTTPS协议安全地访问您的网站。本文将详细介绍如何在服务器上生成一个TLS证…...
04-初识css
一、css样式引入 1.1.内部样式 <div style"width: 100px;"></div>1.2.外部样式 1.2.1.外部样式1 <style>.aa {width: 100px;} </style> <div class"aa"></div>1.2.2.外部样式2 <!-- rel内表面引入的是style样…...
汇编常见指令
汇编常见指令 一、数据传送指令 指令功能示例说明MOV数据传送MOV EAX, 10将立即数 10 送入 EAXMOV [EBX], EAX将 EAX 值存入 EBX 指向的内存LEA加载有效地址LEA EAX, [EBX4]将 EBX4 的地址存入 EAX(不访问内存)XCHG交换数据XCHG EAX, EBX交换 EAX 和 EB…...
A2A JS SDK 完整教程:快速入门指南
目录 什么是 A2A JS SDK?A2A JS 安装与设置A2A JS 核心概念创建你的第一个 A2A JS 代理A2A JS 服务端开发A2A JS 客户端使用A2A JS 高级特性A2A JS 最佳实践A2A JS 故障排除 什么是 A2A JS SDK? A2A JS SDK 是一个专为 JavaScript/TypeScript 开发者设计的强大库ÿ…...
排序算法总结(C++)
目录 一、稳定性二、排序算法选择、冒泡、插入排序归并排序随机快速排序堆排序基数排序计数排序 三、总结 一、稳定性 排序算法的稳定性是指:同样大小的样本 **(同样大小的数据)**在排序之后不会改变原始的相对次序。 稳定性对基础类型对象…...
stm32wle5 lpuart DMA数据不接收
配置波特率9600时,需要使用外部低速晶振...
