大模型+影像:智能手机“上春山”

这个春节假期,一首《上春山》火了。吃瓜群众热热闹闹学了一个假期的“春山学”,了解了抢占C位的各种技巧。
假期过去,开工大吉,手机行业开始抢占今年的C位。那么问题来了,今年智能手机最大的机会点在哪里?答案呼之欲出,当然是AI大模型。去年下半年,手机厂商陆续推出端侧大模型。春节刚过,OPPO发布了全新的AI战略,宣布进入AI时代。魅族宣布不再生产“传统智能机”,全面拥抱AI时代。显然,大模型就是手机行业的那座“春山”。
但根据“春山学”相关知识,跟着大家一起上山是不够的,必须更上一层才能稳站C位。在大模型+手机的众多结合点中,有一项能力是C位中的C位,妥妥的“真·春山无双”——大模型+手机影像。

据说在这个春节,一线城市的写真店纷纷转变了商业模式。原本大家都是去拍写真,店家负责拍摄和修图。现在都是去拍AIGC照片,店家摇身一变为AI提示工程师,用各种AIGC平台来实现用户种种匪夷所思的需求。
回来对比照片,也不是比你这张光打得不错,你这张P得更自然,而是你这张照片用的什么提示词,你这张一看就模型泛化性比较强……

总之,AI之风正经由照相馆、写真店、小程序、APP,强烈地吹拂着我们的影像生活。
但是问题来了,这些强烈的AIGC影像需求,真的必须去线下店才能完成吗?为什么不能在手机端一键搞定?最近手机新品动辄搭载几十亿参数的端侧大模型,它们闲着干嘛呢?
事实上,手机里的大模型肯定是闲不住的。目前拥抱AI大模型的手机,基本情况是大模型是大模型,影像是影像,但这种分裂局面必然会很快得到改变。
“大模型与移动影像”的融合赛道,是2024年智能手机行业最为清晰的风口,也是手机厂商急切想要上,也必须上了就不能下来的,具有战略意义的那座“春山”。
大模型+手机影像,这座春山怎么上?我们来弄清其中的“春山学”问题吧。
六年之后
AI影像再上山

首先我们需要明确一点,那就是AI+影像绝不是什么新鲜事物,甚至很多人都已经习惯了AI与影像的结合。
这个概念开始受到业界重视,是早在2018年的时候。那一年4月,华为发布了P20手机。这款手机利用麒麟芯片的NPU端侧算力,首次在拍照中搭载了AI功能,能够识别包括宠物、人像、风景、美食等19种场景,覆盖500多个识别目标。在AI识别这些目标物后,会自动调整摄影模式和参数设置。
随后,这种AI摄影模式一度爆火,成为当时最具热度的手机技术升级,并且逐渐为全行业所接受。随着几年发展,AI影像变得越来越复杂,可识别物越来越多,并且加入了动态抓取、去除反光等AI能力,还与此后流行的计算摄影概念结合,成为手机影像系统中的基础能力之一。
但到这个层面,AI摄影的能力依旧有显著的局限性。它对图片的作用集中于“美化”,而不是“修改”和“生成”。我们也探访过一些AI摄影相关赛道的开发者,他们很希望能够利用手机的AI能力做出更具创意的应用,但端侧算力和模型能力是主要的限制。

而伴随着AI大模型的爆火,模型能力的关隘被突破了。在大模型的加持下,用户可以对影像系统提出复杂的指令,影像系统也能够更完整理解用户交互逻辑与意图指向。在能力上,大模型可以帮助完成高精度的图像元素替换,甚至加入AI生成的影像。
或许可以这样说,最初用户听闻AI影像概念的时候,脑海中设想的影像能力,其实是在今天才有可能实现的大模型影像。
伴随着大模型能力落地手机,AI影像终于可以完成关键一跃,实现那些早就许下的诺言。
大模型,就是AI影像的必须上的那座山。

春山上,风景如何?
春节还没过去,世界就感受到了来自Sora的视觉震撼。AI行业有句话,叫语言模型为打榜,视觉模型能赚钱。机器视觉能力是让用户感受到AI魅力最快速也最有效的方案。
长期以来,手机影像可谓一卷再卷,卷无可卷,但用户始终能做的只是拍摄图片。AI大模型能力的加入,可以让用户获得无门槛修改图片,以及将AIGC影像与手机拍摄影像结合的能力。AI大模型+手机AI计算能力+手机影像系统的组合,极大拓展了手机影像的边界,既继承了手机厂商多年来的技术与供应链布局,同时还获得了新的增长空间。
目前阶段,这条赛道已经迅速铺开。比如三星就通过图片助手功能,让用户实现了移动图片中目标,自动填充空缺,生成新图片的能力,从而让手机影像具备更大的构图自由。

而OPPO Find X7系列则实现了通过AI大模型来提供AIGC消除功能。就像我们最近在广告里看到的那样,用户可以把春节聚会时不想看到的人从合影中消除,同时依靠AIGC补齐背景。目前,Find X7已经可以支持最多6个主体单独提取。除此之外,OPPO还更新了AI超清合影功能,可以智能识别并增强合影中人脸的清晰度。

可以预见的是,接下来我们会看到大量基于AI大模型实现的影像功能,比如AI抠图,AI替换,AI扩图等。整体而言,大模型+手机影像会呈现三大发展趋势:
1.AIGC内容与拍摄内容结合。AIGC的文生图平台,在过去一年快速赢得了用户青睐,将这种能力与手机本身影像能力融合,是AI手机赛道上最关键的争夺战。
2.AI能力从应用侧上移,与手机本身的影像系统结合。目前,AI大模型带来的视觉能力,更多还是单独的软件应用。接下来,手机厂商会将这些能力上移到系统侧,成为产品本身的差异化卖点。
3.手机影像能力可以OTA。AI大模型的加入,一定程度上让手机自身的影像能力成为可升级,可迭代的软件。让手机自身的系统级能力也可以持续更新,持续运营,是AI大模型带给手机的一种新变化。
总体来看,大模型与手机影像的结合,有着非常充沛的创意发挥空间,有源源不断的可能性。想要抓住这个机会,客观上将带来手机厂商之间新一轮的技术竞赛。

那座山
就是下一个战略高地
目前阶段,还没有厂商将“大模型+影像”这个概念旗帜鲜明地提出来,但这个概念以各种不同的名称落地,应该已经为期不远。
需要注意的是,在端侧部署大模型,以及发展出一些创意性的AI影像玩法都很容易,但要将AI大模型+影像真正发展为长期赛道,构成品牌的用户心智支点,那还需要厂商投入巨大的精力,来展开一场全新的智能手机行业竞赛。
其原因在于,大模型+手机影像是一场名副其实的综合考验。它需要硬件侧的算力配合,需要影像系统的支撑,同时也需要模型侧的算法加持,更需要应用开发创意以及AIGC专属的视觉审美。从务实到务虚,从底层硬件到顶层应用,大模型+手机影像的竞赛近乎覆盖了手机行业的每个层级。

而重点来看,抢占大模型+影像的战略高地,需要手机厂商在三个方面集结重兵:
1.AI基础设施更新。这个基础设施包括了AI算力与AI算法两个部分。涉及芯片能力,端云协同能力,以及基础算法能力。手机的AI基础设施更新需求,也将带动产业链展开新一轮洗牌。
2.AI应用的准确把握。AI大模型能够手机影像带来的可能性不是太少,而是太多了。如何在有限的算力条件下,给用户最准确,最吸引人的AI影像应用,将成为手机厂商面对的头一道考题。
3.AI审美能力的建设。最近很多人注意到Sora团队有专门的艺术人才加入。艺术与审美能力在AIGC时代非常重要。随着产业发展,算法能力会趋同,审美能力的差异化则会暴露出来。手机厂商过去更重视的是设计能力,这与艺术表达、审美判断等能力是存在一定差异的。构建属于AI手机的新审美能力,是一项全新的赛事。
最后,说一个有点反常识的判断:大模型+手机影像这座“春山”,其实还是很容易上的。其门槛远没有手机厂商宣传得那么夸张,但如果你最近用心学习了“春山学”教材,就会知道真正困难的不是上山,而是赖在山上不下来。
如何把大模型+手机影像从一个年度噱头,变成可以多年发展的长期赛道,甚至变成改写产业格局的锚点,那才是真正的考验。
不过好消息是,有春山可上至少证明了一件事:包裹手机行业的坚冰正在技术暖风的吹拂下开裂、消融。能否就此别冬入春,选择权在从业者手中。

相关文章:
大模型+影像:智能手机“上春山”
这个春节假期,一首《上春山》火了。吃瓜群众热热闹闹学了一个假期的“春山学”,了解了抢占C位的各种技巧。 假期过去,开工大吉,手机行业开始抢占今年的C位。那么问题来了,今年智能手机最大的机会点在哪里?答…...
8-pytorch-损失函数与反向传播
b站小土堆pytorch教程学习笔记 根据loss更新模型参数 1.计算实际输出与目标之间的差距 2.为我们更新输出提供一定的依据(反向传播) 1 MSEloss import torch from torch.nn import L1Loss from torch import nninputstorch.tensor([1,2,3],dtypetorch.fl…...
MySQL高级特性篇(8)-数据库连接池的配置与优化
MySQL数据库连接池的配置与优化 MySQL数据库是当前最流行的关系型数据库管理系统之一,高效的数据库连接池配置与优化是提高数据库性能和并发性能的重要手段。本文将介绍MySQL数据库连接池的配置与优化,并提供详细示例。 1. 连接池的作用与优势 数据库…...
mac下使用jadx反编译工具
直接执行步骤: 1.创建 jadx目录 mkdir jadx2.将存储库克隆到目录 git clone https://github.com/skylot/jadx.git 3. 进入 jadx目录 cd jadx 4.执行编译 等待片刻 ./gradlew dist出现这个就代表安装好了。 5.最后找到 jadx-gui 可执行文件,双击两下…...
分布式一致性软件-zookeeper
在我们进行软件开发过程中,为了实现某个功能可能借助多个软件,如存储数据的数据库软件:MySQL,Redis;消息中间件:rocketMq,kafka等。那么在分布式系统中,如果想实现数据一致性&#x…...
企业计算机服务器中了babyk勒索病毒怎么办?Babyk勒索病毒解密数据恢复
随着网络技术的应用与普及,越来越多的企业采用了数字化办公模式,数字化办公模式可以为企业提供强有力的数据支撑,可以为企业的发展方向与产品业务调整做好基础工作。但网络是一把双刃剑,在为企业提供便利的同时,也为企…...
板块一 Servlet编程:第五节 Cookie对象全解 来自【汤米尼克的JAVAEE全套教程专栏】
板块一 Servlet编程:第五节 Cookie对象全解 一、什么是CookieCookie的源码 二、Cookie的具体操作(1)创建Cookie(2)获取Cookie(3)设置Cookie的到期时间(4)设置Cookie的路径…...
自动驾驶---Motion Planning之Path Boundary
1 背景 在上文《自动驾驶---Motion Planning之LaneChange》中,笔者提到过两种LaneChange的思路,这里再简单回顾一下:(1)利用Routing和周围环境的信息,决定是否进行换道的决策;(2)采用的博弈思想(蒙特卡洛树搜索---MCTS)决定是否进行换道的决策。不管是变道,避让还是…...
Leetcode 3048. Earliest Second to Mark Indices I
Leetcode 3048. Earliest Second to Mark Indices I 1. 解题思路2. 代码实现 题目链接:3048. Earliest Second to Mark Indices I 1. 解题思路 这一题的话基础的思路就是二分法查找最小的可以将所有的数字都mark上的最小位置。 因此,这里的问题就会变…...
从源码学习单例模式
单例模式 单例模式是一种设计模式,常用于确保一个类只有一个实例,并提供一个全局访问点。这意味着无论在程序的哪个地方,只能创建一个该类的实例,而不会出现多个相同实例的情况。 在单例模式中,常用的实现方式包括懒汉…...
axios介绍和使用
1. Axios是什么 Axios框架全称(ajax – I/O – system) Axios是一个基于Promise的JavaScript HTTP客户端,用于浏览器和Node.js环境。它可以发送HTTP请求并支持诸如请求和响应拦截、转换数据、取消请求以及自动转换JSON数据等功能。 Axios提…...
redis雪崩问题
Redis雪崩问题是指在Redis缓存系统中,由于某些原因导致大量缓存数据同时失效或过期,导致所有请求都直接访问数据库,从而引发数据库性能问题甚至宕机的情况。 造成Redis雪崩问题的原因主要有以下几个: 缓存数据同时失效ÿ…...
[SUCTF 2019]EasySQL1 题目分析与详解
一、题目介绍 1、题目来源: BUUCTF网站,网址:https://buuoj.cn/challenges 2、题目描述: 通过以上信息,拿到flag。 二、解题思路 首先打开靶机,尝试输入1查看回显,回显如图所示:…...
TestNG与ExtentReport单元测试导出报告文档
TestNG与ExtentReport集成 目录 1 通过实现ITestListener的方法添加Reporter log 1.1 MyTestListener设置 1.2 输出结果 2 TestNG与ExtentReporter集成 2.1 项目结构 2.2 MyExtentReportListener设置 2.3 单多Suite、Test组合测试 2.3.1 单Suite单Test 2.3…...
【JavaEE】_form表单构造HTTP请求
目录 1. form表单的格式 1.1 form表单的常用属性 1.2 form表单的常用搭配标签:input 2. form表单构造GET请求实例 3. form表单构造POST请求实例 4. form表单构造法的缺陷 对于客户端浏览器,以下操作即构造了HTTP请求: 1. 直接在浏览器…...
Mysql中INFORMATION_SCHEMA虚拟库使用
虚拟库字段讲解 #查看INFORMATION_SCHEMA的表信息 DESC information_schema.tables; 重要列: TABLE_SCHEMA #表所在的库 TABLE_NAME #表名 ENGINE #表的存储引擎 TABLE_ROWS #表的行数 DATA_LENGTH #表数据行占用的字节数 AVG_ROW_LENGTH #平均行长度 INDEX_LENGTH…...
【《高性能 MySQL》摘录】第 2 章 MySQL 基准测试
文章目录 2.1 为什么需要基准测试2.2 基准测试的策略2.2.1 测试何种指标 2.3 基准测试方法2.3.1 设计和规划基准测试2.3.2 基准测试应该运行多长时间2.3.3 获取系统性能和状态2.3.4 获得准确的测试结果2.3.5 运行基准测试并分析结果2.3.6 绘图的重要性 2.4 基准测试工具…...
常用的Web应用程序的自动测试工具有哪些
在Web应用程序的自动化测试领域,有许多流行的工具可供选择。以下是一些常用的Web自动化测试工具: 1. Selenium - Selenium是最流行的开源Web应用程序自动化测试套件之一。 - 它支持多种编程语言,如Java、C#、Python、Ruby等。 …...
人工智能与开源机器学习框架
链接:华为机考原题 TensorFlow是一个开源的机器学习框架,由Google开发和维护。它提供了一个针对神经网络和深度学习的强大工具集,能够帮助开发人员构建和训练各种机器学习模型。 TensorFlow的基本概念包括: 张量(Ten…...
高通XBL阶段读取分区
【需求】: 在某些场景下,需要在XBL阶段读取分区数据,需要验证xbl阶段方案 这里主要以裸分区为例,比如oem分区。 1、创建一个1MB大小的oem.img,写入内容“test oem partition” 创建方式: dd if/dev/null …...
CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型
CVPR 2025 | MIMO:支持视觉指代和像素对齐的医学视觉语言模型 论文信息 标题:MIMO: A medical vision language model with visual referring multimodal input and pixel grounding multimodal output作者:Yanyuan Chen, Dexuan Xu, Yu Hu…...
STM32标准库-DMA直接存储器存取
文章目录 一、DMA1.1简介1.2存储器映像1.3DMA框图1.4DMA基本结构1.5DMA请求1.6数据宽度与对齐1.7数据转运DMA1.8ADC扫描模式DMA 二、数据转运DMA2.1接线图2.2代码2.3相关API 一、DMA 1.1简介 DMA(Direct Memory Access)直接存储器存取 DMA可以提供外设…...
华为云Flexus+DeepSeek征文|DeepSeek-V3/R1 商用服务开通全流程与本地部署搭建
华为云FlexusDeepSeek征文|DeepSeek-V3/R1 商用服务开通全流程与本地部署搭建 前言 如今大模型其性能出色,华为云 ModelArts Studio_MaaS大模型即服务平台华为云内置了大模型,能助力我们轻松驾驭 DeepSeek-V3/R1,本文中将分享如何…...
GitHub 趋势日报 (2025年06月06日)
📊 由 TrendForge 系统生成 | 🌐 https://trendforge.devlive.org/ 🌐 本日报中的项目描述已自动翻译为中文 📈 今日获星趋势图 今日获星趋势图 590 cognee 551 onlook 399 project-based-learning 348 build-your-own-x 320 ne…...
Web中间件--tomcat学习
Web中间件–tomcat Java虚拟机详解 什么是JAVA虚拟机 Java虚拟机是一个抽象的计算机,它可以执行Java字节码。Java虚拟机是Java平台的一部分,Java平台由Java语言、Java API和Java虚拟机组成。Java虚拟机的主要作用是将Java字节码转换为机器代码&#x…...
计算机基础知识解析:从应用到架构的全面拆解
目录 前言 1、 计算机的应用领域:无处不在的数字助手 2、 计算机的进化史:从算盘到量子计算 3、计算机的分类:不止 “台式机和笔记本” 4、计算机的组件:硬件与软件的协同 4.1 硬件:五大核心部件 4.2 软件&#…...
脑机新手指南(七):OpenBCI_GUI:从环境搭建到数据可视化(上)
一、OpenBCI_GUI 项目概述 (一)项目背景与目标 OpenBCI 是一个开源的脑电信号采集硬件平台,其配套的 OpenBCI_GUI 则是专为该硬件设计的图形化界面工具。对于研究人员、开发者和学生而言,首次接触 OpenBCI 设备时,往…...
Golang——7、包与接口详解
包与接口详解 1、Golang包详解1.1、Golang中包的定义和介绍1.2、Golang包管理工具go mod1.3、Golang中自定义包1.4、Golang中使用第三包1.5、init函数 2、接口详解2.1、接口的定义2.2、空接口2.3、类型断言2.4、结构体值接收者和指针接收者实现接口的区别2.5、一个结构体实现多…...
Ubuntu系统复制(U盘-电脑硬盘)
所需环境 电脑自带硬盘:1块 (1T) U盘1:Ubuntu系统引导盘(用于“U盘2”复制到“电脑自带硬盘”) U盘2:Ubuntu系统盘(1T,用于被复制) !!!建议“电脑…...
ubuntu22.04 安装docker 和docker-compose
首先你要确保没有docker环境或者使用命令删掉docker sudo apt-get remove docker docker-engine docker.io containerd runc安装docker 更新软件环境 sudo apt update sudo apt upgrade下载docker依赖和GPG 密钥 # 依赖 apt-get install ca-certificates curl gnupg lsb-rel…...
