将AI大模型装进你的手机,你愿意么?



大数据产业创新服务媒体
——聚焦数据 · 改变商业
AI大模型的发展,有两个方向,一个是模型越做越大,以规模来提升性能。还有一个重要的方向,就是通过将模型做小,来嵌入手机、电脑等计算终端,这同样是值得关注的发展方向。
终端化的浪潮,意味着大模型将直接嵌入到个人设备中,这无疑将为用户带来更加个性化和智能化的体验。手机和PC制造商纷纷布局,试图通过集成大模型来提升产品的竞争力。
都有哪些PC厂商在积极引入大模型?
先来看PC厂商。
1. 联想
联想推出了首款AI PC产品,该设备运用了联想自研的大模型压缩技术,允许设备在本地运行个人大模型,无需云端操作,以此确保个人隐私和数据安全。此外,联想还推出了两款AI服务器——问天WA7780 G3 AI大模型训练服务器和问天WA5480 G3 AI训推一体服务器。
2. 惠普
惠普与星环科技合作,推出了面向大模型领域的一体机服务平台AI一体机。该一体机结合了星环大模型开发和应用平台Sophon LLMOps的产品能力,旨在为企业提供大模型的开发和应用支持。
3. 戴尔
戴尔与Meta合作,尝试在其本地基础设施上部署Llama 2大语言模型(LLM),以减少对云设施的依赖。戴尔的生成式AI验证设计计划,结合了戴尔服务器套件与英伟达GPU、存储及软件,主要针对涉及自然语言生成的应用场景。戴尔还提供部署和配置指导,帮助客户快速启动和运行AI模型。
4. 微软
微软虽然不是终端PC厂商,但其确实PC操作系统的霸主,是PC端大模型的关键玩家。微软正在积极推动大模型技术在PC端的集成和应用,以提升用户体验和设备智能化水平。通过发布Windows Copilot,微软将AI助手功能嵌入到Windows操作系统中,允许用户直接与AI大模型交互,执行各种任务。
5月21日,微软发布了Copilot+ PC方案,将旗下AI助手Copilot全面融入Windows 11系统。微软的两款Copilot+ PC系列产品,Surface Laptop 7和Surface Pro 11。Copilot+ PC还推出了Recall(回忆)功能,利用AI访问用户在PC上见过的任何内容,将其作为记忆的一部分。

有哪些手机厂商在积极引入大模型?
再来看看手机厂商。
1. 华为
华为在大模型技术的应用上表现积极,已经将盘古大模型集成到其手机系统中,特别是HarmonyOS 4系统全面接入盘古大模型,成为全球首个嵌入了AI大模型能力的移动终端操作系统。华为Mate60系列手机,搭载了基于多模态大模型技术实现的“智慧搜图”功能。此外,华为的语音助手小艺也融合了盘古自然语言大模型、盘古视觉大模型和盘古多模态大模型,最高版本参数高达1000亿,进一步强化了华为手机的AI能力。
2. 小米
小米在大模型技术上采取了渐进策略,已经自研了13亿参数端侧模型,并在手机端跑通了Demo,部分场景效果可以媲美云端60亿模型的运算效果。小米在AI大模型团队组建和研发投入上表现积极,小米的澎湃OS操作系统也在AI大模型方面进行了深度植入,小爱输入助手具备了AI大模型的文本创作能力和AI扩图能力,这些功能在小米14系列手机上有所体现。
3. OPPO
OPPO在大模型技术上的进展显著,发布了全新的AI战略,不仅在手机上推出AI超级智能体,还上线了AI Pro智能体开发平台。OPPO在其研究院下成立了AI中心,聚集AI研发人员,并投入大量资源到AI技术。OPPO还建立了全新数据中心,具备800P的算力,支持手机端运行千亿级参数的大模型。此外,OPPO发布了自主训练的安第斯大模型(AndesGPT),以“端云协同”为基础架构设计,旨在提升手机的智能体验。
4. vivo
vivo在大模型技术上同样积极布局,官宣将发布自研AI大模型矩阵,包括十亿、百亿、千亿三个不同参数量级的5款自研大模型,全面覆盖核心应用场景,并将首次应用于新操作系统OriginOS 4中。vivo的大模型技术旨在提升手机的图像识别、语音交互和智能辅助功能,增强用户体验。
5. 荣耀
荣耀在大模型技术上也有所作为,发布了全新一代旗舰智能手机荣耀Magic6系列,该系列手机将首发搭载荣耀自研的70亿参数端侧平台级AI大模型“魔法大模型”。
6. 三星
三星在大模型技术上的应用也值得关注,其S24系列手机已经上线了"即圈即搜"、“笔记助手”等AI应用。三星在自研大模型Gauss可用之前,选择了与中国厂商合作,借助百度智能云千帆平台、美图等的力量,以增强其AI能力。
7. 苹果
苹果公司在引入大模型技术方面展现出了积极的态度和显著的进展,据外媒报道,苹果正与谷歌商讨可能的合作协议,计划将谷歌的Gemini人工智能引擎集成到iPhone中。此外,苹果也在自研大模型技术,Ajax模型能在设备端快速生成响应,尽管更复杂的任务可能需要云端支持。苹果的多模态大模型Ferret展示了其在图像和语言理解方面的进步,该模型在多模态任务上表现优异,苹果还发布了OpenELM系列模型。随着iOS18系统的即将发布,苹果预计将引入大模型技术,这将是AI技术发展的新里程碑。
是什么驱动着大模型的终端化趋势?
那么,是什么原因在驱动大模型的终端化进程呢?数据猿看来,主要是技术和用户需求者两个要素在驱动。
在消费者需求方面,随着互联网技术的普及和数字化生活的发展,用户对智能化终端设备的需求日益增长。人们期望通过智能手机、平板电脑和个人电脑等设备,获得更加智能、个性化的服务体验。
例如,用户希望智能手机能够更准确地理解语音指令,希望个人电脑能够提供更加强大的图像和视频处理能力。同时,随着远程工作和在线教育的兴起,用户对终端设备的多任务处理能力和智能协作功能也有了更高的期待。大模型的终端化,正是对这一需求的积极响应。
技术进步是推动大模型终端化的关键力量,随着芯片制程技术的不断突破,如5纳米甚至更小制程的芯片开始量产,设备的计算能力得到了大幅提升。同时,AI算法的优化和模型压缩技术的发展,使得原本只能在云端运行的大模型得以瘦身,以适应终端设备的计算和存储资源。
要将大模型“装”手机、电脑,核心环节有哪些?
随着人工智能技术的飞速发展,大模型终端化已成为推动智能设备创新的关键力量。在这一进程中,技术与创新起到了至关重要的作用。要将大模型嵌入手机等终端,关键是要解决下面的问题:
1、模型压缩与优化
模型压缩与优化是大模型终端化进程中的核心环节,它们使得资源受限的终端设备,能够高效运行原本设计用于强大服务器的复杂模型。
例如:权重剪枝是模型压缩中最直接的方法,它通过移除模型中不重要的权重来减少模型的参数数量。这种方法可以显著减少模型的存储和计算需求,同时保持其核心功能;结构化剪枝通过移除整个神经网络层或通道来降低模型的复杂度,与权重剪枝相比,结构化剪枝对模型结构的改变更大,但可以带来更显著的压缩效果;自动化模型压缩算法,如神经网络架构搜索(NAS),可以自动发现既满足性能要求又具有较小尺寸的模型架构。这种自动化方法减少了人工干预,提高了模型开发和优化的效率。
此外,知识蒸馏是另一种有效的模型压缩技术,它涉及训练一个小型的“学生”模型来模仿一个大型的“教师”模型的行为。这种方法可以在减少模型大小的同时,保持较高的性能。硬件感知的模型设计考虑特定硬件架构的特性,设计出在该硬件上运行得更加高效的模型。随着专用AI硬件的普及,硬件感知的设计变得越来越重要。
2、终端算力的持续提升与边缘计算的发展
近年来,随着半导体技术的进步,尤其是芯片制造工艺的提升,电脑和手机等终端设备的处理器性能得到了显著增强。例如,移动设备中的系统芯片(SoC)已经从几个核心发展到多核处理器,并且集成了GPU、NPU或AI加速器。

这些专用硬件单元为执行深度学习模型提供了强大的支持,使得复杂的AI算法可以在本地设备上流畅运行。个人电脑和服务器的CPU和GPU性能也在不断提升,它们现在拥有更多的核心和线程,以及更高的时钟频率和改进的缓存架构,从而为运行大型机器学习模型提供了充足的算力。
此外,边缘计算作为一种分布式计算范式,它将数据处理和存储更靠近数据源的位置,这样可以减少数据传输的延迟,提高响应速度,特别适合对实时性要求高的应用场景。
在大模型终端化中,边缘计算允许终端设备在本地处理数据,而不是将所有数据发送到云端处理,这不仅提升了效率,也有助于保护用户隐私。
终端算力的提升和边缘计算的发展相结合,为大模型的部署和运行提供了更加坚实的基础。随着5G等高速通信技术的应用,边缘设备之间的互联互通也变得更加容易,这为构建分布式智能系统提供了可能,使得大模型可以在多个边缘节点上协同工作,实现更高级的智能功能。
3、隐私与安全
在终端设备上运行大模型,虽然带来了智能化的体验,但也引发了隐私和安全方面的担忧。终端设备通常包含大量个人敏感信息,如何在运行大模型的同时保护这些信息的安全,成为了一个重要问题。
为了解决这一问题,技术开发者采用了多种措施来加强隐私保护。例如,差分隐私技术通过添加噪声来模糊个人数据,保护用户隐私的同时允许进行数据统计分析。同态加密技术则允许在加密数据上直接进行计算,这样即使数据在云端处理,也可以保证其内容不被暴露。
大模型终端化才刚刚开始,还有一系列问题要解决
在大模型终端化的道路上,技术、经济、用户接受度以及社会伦理等方面的问题交织在一起,构成了一个复杂的挑战网络。
技术层面,模型的大小、计算资源的限制以及对实时性能的高要求是摆在开发者面前的三大难题。大模型的参数量庞大,存储和计算需求高,这对终端设备的硬件提出了挑战。
虽然模型压缩技术的发展为解决这一问题提供了可能,但如何在不损失关键性能的前提下实现有效压缩,仍是一个技术难题。此外,即使是压缩后的模型,其运行仍然需要较高的计算资源,这可能导致终端设备发热、电池消耗快,甚至在性能较差的设备上无法运行。
同时,许多应用场景对实时性能有着严格的要求,大模型在终端设备上的运行速度可能无法满足这些需求。
经济成本也是大模型终端化过程中不可忽视的因素,研发成本高昂,需要大量的人才、设备和时间投入。部署成本也不菲,特别是当需要额外的硬件支持,如高性能芯片时,这会增加设备的成本。此外,大模型的维护和更新也需要成本,尤其是在模型需要频繁更新以适应新的数据和场景时。这些成本最终可能会转嫁到消费者身上,影响产品的市场竞争力。
用户接受度是另一个关键因素,用户可能对在终端设备上运行大模型的性能和隐私保护有所顾虑。虽然本地运行可以保护隐私,但用户可能担心设备的性能是否能够满足需求。
面对这些挑战和问题,需要政府、企业和研究机构共同努力。技术上,需要继续研发更高效的模型压缩和运行技术;经济上,需要探索更合理的成本分摊机制;政策上,需要制定合理的监管政策和标准,引导大模型终端化技术的健康发展。
文:一蓑烟雨 / 数据猿
责编:凝视深空 / 数据猿





相关文章:
将AI大模型装进你的手机,你愿意么?
大数据产业创新服务媒体 ——聚焦数据 改变商业 AI大模型的发展,有两个方向,一个是模型越做越大,以规模来提升性能。还有一个重要的方向,就是通过将模型做小,来嵌入手机、电脑等计算终端,这同样是值得关注…...
前端面试题12-22
12 Proxy是什么,有什么作用? Proxy 是 ES6 (ECMAScript 2015) 引入的一种元编程特性。它允许你创建一个对象,该对象可以拦截和定义基本操作(例如属性查找、赋值、枚举、函数调用等)。Proxy 提供了一种机制,…...
【论文解读】Performance of AV1 Real-Time Mode
论文下载地址:Performance of AV1 Real-Time Mode 时间:2020.10 级别:IEEE 作者:Ludovic Roux 摘要 背景:COVID-19疫情增加了对数字互动的需求,使得实时或低延迟编解码器变得更加重要。现状:大多数编解码器,包括AV1,主要关注于编码效率,这是视频点播(VOD)的主要改…...
java处理中文脱敏
方法一,简单的,不计算文字长度去设置脱敏 public static String dataDesensitization1(String content){String regex "(.{2}).*(.{2})";return ReUtil.replaceAll(content, regex, matcher -> {try {if (CharSequenceUtil.isBlank(match…...
【Linux网络】端口及UDP协议
文章目录 1.再看四层2.端口号2.1引入linux端口号和进程pid的区别端口号是如何生成的传输层有了pid还设置端口号端口号划分 2.2问题2.3netstat 3.UDP协议3.0每学一个协议 都要讨论一下问题3.1UDP协议3.2谈udp/tcp实际上是在讨论什么? 1.再看四层 2.端口号 端口号(Po…...
Unity 生成模版代码
1、创建模版代码文本 using System.Collections; using System.Collections.Generic; using UnityEngine;public class ClassNameScritpItem : MonoBehaviour {public GameObject go;// Start is called before the first frame updatevoid Start(){go new GameObject();}// …...
【ai】chatgpt的plugin已经废弃
发现找不到按钮,原来是要申请: https://openai.com/index/chatgpt-plugins/ 发现申请已经跳转了,好像是废弃了? 不接受新插件了,但是openai的api 是可以继续用的。 https://openai.com/waitlist/plugins/We are no longer accepting new Plugins, builders can now create…...
2024年03月 Python(四级)真题解析#中国电子学会#全国青少年软件编程等级考试
Python等级考试(1~6级)全部真题・点这里 一、单选题(共25题,共50分) 第1题 运行如下代码,若输入整数3,则最终输出的结果为?( ) def f(x):if x==1:s=1else:s...
多旋翼无人机机场考哪些内容?
多旋翼无人机机场考试的内容主要包括理论和实飞两部分。 理论考试主要涵盖无人机相关的知识,包括无人机的原理、结构、操作规范等。 实飞考试则主要考察飞行技能,包括飞行操作、航线规划、飞行稳定性等。 具体来说,实飞部分可能包括使用GPS…...
【前端每日基础】day23——箭头函数
箭头函数是ES6(ECMAScript 2015)引入的一种新的函数表达式语法。相比传统函数,箭头函数有简洁的语法,并且不绑定自己的this、arguments、super或new.target。以下是详细介绍箭头函数的各个方面: 基本语法 单参数箭头函…...
27.Java中单例模式的实现方式
一、单例模式 单例模式(Singleton Pattern)是一种创建型设计模式,它确保一个类只有一个实例,并提供一个全局访问点来访问这个唯一实例。 单例模式中: 这个类只能有一个实例这个类必须自己创建自己的唯一实例这个类必须…...
C#面:当一个线程进入一个对象的方法后,其它线程是否可以进入该对象的方法?
一个线程在访问一个对象的一个synchronized方法时: 另一个线程可以同时访问这个对象的非同步方法。另一个线程不可以同时访问这个对象的普通同步方法。另一个线程可以同时访问这个对象的静态同步方法 ,即static synchronized修饰的方法 。另一个线程不可…...
express框架下后端获取req.body报错undefined
express框架下后端获取req.body报错undefined_express服务器post中data为undefine-CSDN博客 /*** 特殊说明:Express是一个单线程服务器器程序【必须存在指定的顺序调用,否则无法达到预期的效果】*//*** 第一步:创建一个Express实例对象,并且在匹配路由之…...
Element plus 低版本弹窗组件添加拖拽功能
在使用element plus 弹窗组件el-dialog 的时候,由于自己组件库版本过低,所以就会缺失某些功能,比如弹窗组件的可拖拽功能。因为某些原因element plus 组件库又不能升级,所以此时就需要自己为弹窗组件添加拖拽功能。共分为一下四个…...
计算机组成原理易混淆知识点总结(持续更新)
目录 1.机器字长,存储字长与指令字长 2.指令周期,机器周期,时钟周期 3.CPI,IPS,MIPS 4.翻译程序和汇编程序 5.计算机体系结构和计算机组成的区别和联系 6.基准程序执行得越快说明机器的性能越好吗? 1.机器字长,存储字长与指令字长 不同的机器三者…...
【STM32踩坑】HAL固件库版本过高导致烧录后无法运行问题
问题引入 目前STM32CUBEMX已经更新到了6.11版本,对应的固件库也一直在更新; 以STM32F1库为例,目前最新的库对应版本为1.8.5 但是我们会发现,如果直接使用1.8.5版本的固件库生成HAL源码后,烧录是可以烧录,但…...
芯片丝印反查
芯片丝印反查网 - IC芯片丝印,IC芯片代码,IC芯片印字,IC芯片顶标,SMD code,marking code,top mark芯查查-电子信息产业数据引擎 ic/芯片丝印反查网-芯查查...
C语言之指针详解(5)(含有易错笔试题)
文章目录 一、sizeof和strlen的对比1.1 sizeof1.2 strlen1.3 sizeof 和 strlen 的对比 二、数组和指针笔试题2.1 一维数组2.2 字符数组2.3 二维数组 三、指针运算笔试题3.1 题目13.2 题目23.3 题目33.4 题目43.5 题目53.6 题目63.7 题目7 一、sizeof和strlen的对比 有一个很神…...
discuzX2.5的使用心得 札记一
从开始接受php论坛的开发任务,对php感兴趣的我开始迷恋上discuz这个产品了, 像戴志康这样的创新人才,是我们这代人的骄傲和学习的榜样 应该是了解一下,啥事discuzX2.5,百度看一下 discuz x2.5_百度百科 看完百度词条…...
【Python】 探索Django框架的高并发处理能力
基本原理 Django是一个高级的Python Web框架,它鼓励快速开发和干净、实用的设计。Django遵循MVC(模型-视图-控制器)设计模式,提供了一个全栈式的解决方案,使得开发者能够快速构建功能丰富的Web应用。Django的高并发处…...
Axios请求超时重发机制
Axios 超时重新请求实现方案 在 Axios 中实现超时重新请求可以通过以下几种方式: 1. 使用拦截器实现自动重试 import axios from axios;// 创建axios实例 const instance axios.create();// 设置超时时间 instance.defaults.timeout 5000;// 最大重试次数 cons…...
EtherNet/IP转DeviceNet协议网关详解
一,设备主要功能 疆鸿智能JH-DVN-EIP本产品是自主研发的一款EtherNet/IP从站功能的通讯网关。该产品主要功能是连接DeviceNet总线和EtherNet/IP网络,本网关连接到EtherNet/IP总线中做为从站使用,连接到DeviceNet总线中做为从站使用。 在自动…...
Python 包管理器 uv 介绍
Python 包管理器 uv 全面介绍 uv 是由 Astral(热门工具 Ruff 的开发者)推出的下一代高性能 Python 包管理器和构建工具,用 Rust 编写。它旨在解决传统工具(如 pip、virtualenv、pip-tools)的性能瓶颈,同时…...
JVM虚拟机:内存结构、垃圾回收、性能优化
1、JVM虚拟机的简介 Java 虚拟机(Java Virtual Machine 简称:JVM)是运行所有 Java 程序的抽象计算机,是 Java 语言的运行环境,实现了 Java 程序的跨平台特性。JVM 屏蔽了与具体操作系统平台相关的信息,使得 Java 程序只需生成在 JVM 上运行的目标代码(字节码),就可以…...
Selenium常用函数介绍
目录 一,元素定位 1.1 cssSeector 1.2 xpath 二,操作测试对象 三,窗口 3.1 案例 3.2 窗口切换 3.3 窗口大小 3.4 屏幕截图 3.5 关闭窗口 四,弹窗 五,等待 六,导航 七,文件上传 …...
2025年渗透测试面试题总结-腾讯[实习]科恩实验室-安全工程师(题目+回答)
安全领域各种资源,学习文档,以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具,欢迎关注。 目录 腾讯[实习]科恩实验室-安全工程师 一、网络与协议 1. TCP三次握手 2. SYN扫描原理 3. HTTPS证书机制 二…...
多模态图像修复系统:基于深度学习的图片修复实现
多模态图像修复系统:基于深度学习的图片修复实现 1. 系统概述 本系统使用多模态大模型(Stable Diffusion Inpainting)实现图像修复功能,结合文本描述和图片输入,对指定区域进行内容修复。系统包含完整的数据处理、模型训练、推理部署流程。 import torch import numpy …...
(一)单例模式
一、前言 单例模式属于六大创建型模式,即在软件设计过程中,主要关注创建对象的结果,并不关心创建对象的过程及细节。创建型设计模式将类对象的实例化过程进行抽象化接口设计,从而隐藏了类对象的实例是如何被创建的,封装了软件系统使用的具体对象类型。 六大创建型模式包括…...
PHP 8.5 即将发布:管道操作符、强力调试
前不久,PHP宣布了即将在 2025 年 11 月 20 日 正式发布的 PHP 8.5!作为 PHP 语言的又一次重要迭代,PHP 8.5 承诺带来一系列旨在提升代码可读性、健壮性以及开发者效率的改进。而更令人兴奋的是,借助强大的本地开发环境 ServBay&am…...
探索Selenium:自动化测试的神奇钥匙
目录 一、Selenium 是什么1.1 定义与概念1.2 发展历程1.3 功能概述 二、Selenium 工作原理剖析2.1 架构组成2.2 工作流程2.3 通信机制 三、Selenium 的优势3.1 跨浏览器与平台支持3.2 丰富的语言支持3.3 强大的社区支持 四、Selenium 的应用场景4.1 Web 应用自动化测试4.2 数据…...
