机器视觉公司,在玩一局玩不起的游戏
导语
有个著名咨询公司曾经预测过:未来只有两种公司,是人工智能的和不赚钱的。
它可能没想到,还有第三种——不赚钱的AI公司。
去年我们报道过“正在消失的机器视觉公司”,昔日的“AI 四小龙”( 商汤、旷视、云从、依图),在商业化盈利上各有各的不顺。不过,随着GPT系列产品又掀起一股“大炼模型”的热潮,这些AI公司又支棱起来了。
商汤科技此前曾披露,下一步的发展战略是通用人工智能(AGI),继续推进“大装置+大模型”,并发布了1800亿参数的中文语言大模型 “商量”。
旷视科技也表态,会坚定投入生成式大模型的研发,保持核心技术能力长期领先。
云从科技公开的定增预案中,为云从“行业精灵”大模型研发项目,募集资金不超过36.35亿元。
依图科技没有公开消息,但在此前的融资中曾因AI大模型和国产芯片等被看好。

无论是上一轮,以BERT、GPT-3为代表的“预训练+精调”大模型,还是此刻正红火的,以ChatGPT、GPT-4、文心一言等为代表的“预训练+精调+提示+RLHF(人类反馈)”的大语言模型,已经成为各大头部科技公司“秀肌肉”、相互竞争的重要工具。
谷歌、百度等大厂跑着入场,各路大模型“神仙斗法”。这场狂欢派对,成了机器视觉公司不得不玩、又玩不起的游戏。
1 | 尴尬的“长衫”
最近,CV公司参与到大模型这局游戏中,出现了这样的画风:语气一会儿大,一会儿怂。
在公开信息中,都表示自己会加大投入,去解决基础技术、基础问题。云从的管理者说要“投一二十亿解决算力问题”“我们是技术公司,研发投入不会低”;商汤的有关人士称,要做“统一化标准化的大模型”“加速构建通用人工智能的核心能力”;旷视也对标OpenAI,要“做影响物理世界的 AI 技术创新”。

谈到大模型技术和产品本身,底气又不足了。
这个说“基础大模型要有长期布局,NLP难点很多,短期内与境外领先企业会存在较大差距”,那个说“中国AI公司有商业化的压力,不能像OpenAI那样不计代价的创新”。
“预期管理”算是被你们玩明白了。
年轻人流行说自己是“脱不下长衫的孔乙己”,CV公司对于大模型这种不尴不尬的处境,其实也和“孔乙己”有相似之处。
CV公司在底层技术、基础设施、人才、资金、生态等领域的积累,不如头部科技企业优势显著。所以,自然也不可能真的跟谷歌、OpenAI、BATH(百度、阿里、腾讯、华为)正面打擂台,烧钱去做通用的基础大模型(foundation model)。
新一轮大语言模型,完整技术栈、工程实现能力、算力成本、数据积累等都有极高的门槛,AI公司自研大语言模型的难度前所未有。 OpenAI 在2022年就花掉了5.44亿美元,收入只有3600万美元,这是国内CV公司不具备的家底儿。
当然,外界也不应该过度放大CV公司的责任,非要将巨头才能承担的创新压力放在CV公司身上。
但是,CV公司又有着“AI-native原生企业”的光环,也确实积累了很多技术储备, 所以也不能直接躺平,像ISV集成商、软件公司一样依附大厂,欢欣鼓舞地等着集成或调用API就好。
昔日的“AI四小龙”还是要撑起“技术自立”的架子,努力融入这波炼大模型的热潮里,于是,又将模型数量和参数规模的比拼,拉升到了新的竞争水平。
比如云从有NLP、视觉领域的预训练模型,商汤在“AI大装置SenseCore”的基础上,构建的日日新大模型体系就包含了通用视觉模型、中文语言模型、图片生成模型……其中,仅“商量”大模型的参数规模,就和GPT-3差不多。
今天大家都感慨,孔乙己脱下长衫不容易,换个角度,“大模型”这件长衫,CV公司是不是有必要穿上呢?
2 | 玩不起的游戏
从2018年的预训练大模型到2023年的大语言模型,大模型走过了一个从萌芽到繁荣的小周期,种类、功能也丰富起来,我们已经见过很多AI企业、高校和科研机构、行业公司所打造的各种各样的大模型。
问题便随之而来:
第一,大模型的“智能涌现”,需要在超大规模的数据和充分的训练才能出现,只有不计投入的基础模型能做到。
很多面向行业的预训练大模型,由于数据和训练不足,无法达到“智能涌现”的临界点,这也是为什么此前预训练大模型那么多,却只有ChatGPT的到来,才证实了“通用人工智能”的可行性。
在基础模型的鲁棒性、泛化性极大提升的今天,一味盲目地“训大模型”,结果就是“大小班同上”,基础大模型和行业大模型一起,消耗本就不充沛的算力,进一步推高计算成本,让AI企业背上更重的负担。

第二,大模型的商业化路径,标准化API是比较基础的一种,而基础模型API有虹吸效应。
简单来说,通过API接入AI能力,技术是决定性因素,基础模型的能力强、受众广泛,很容易通过API经济完成商业化,而行业大模型面对的领域较窄,很难通过“规模效应”来摊薄研发成本。
随着一个又一个大模型被推向市场,大家恍然发现:原来我们并不缺大模型,缺的是商业化路径。
目前,大模型的商业化还比较有限,C端通用产品贴成本定价,B端盈利前景不明朗,根据 A16Z 对美国 LLM 创业调研,纯模型厂商只能拿走0-10%的价值,并且要长期对标OpenAI的定价策略,会面临很大的商业化压力。
通用基础模型和行业大模型一起面向市场和客户,结果就是,在商业价值分配上产生博弈。AI巨头“神仙斗法”,打造出的通用基础大模型会吸引产业和用户的最多关注。
而大量行业大模型,要么在训完后无人问津,浪费了前期投入;要么无法满足产业需求,商业化前景受限;或者跟通用基础大模型的能力有冲突,导致商业化达不到预期。
同为AI创业型公司的出门问问创始人李志飞,就在一次采访中直言:“不是所有人都要去做通用大模型,贸然进入,难度很大,商业竞争很激烈,想不清商业模式到最后会很痛苦。”
所以,大炼模型,可能是CV公司目前玩不起的一局游戏。
3 | 轻装上阵的路
你可能会问,现在大模型这么火,不训大模型怎么能吃到这波红利,在新一轮AI热潮里建立优势呢?
CV公司要轻装上阵,可能要尝试这样几条路,去探索大模型热潮中的机会:
1 、 跟基础大模型平台建立更紧密地联系。
自己开发大模型难度太大,训练成本、存算成本过高,社区生态支持也不够充足。可以站在巨人的肩膀上,接入基础模型的能力打造小模型,与基础模型的商业模式形成差异。
此前CV公司盈利难的一个挑战是:机器视觉要进入腰尾市场,存在着海量的碎片化需求,客户体量比较小、数量多,项目规模不大,这对CV公司的开发效率提出了很高的要求。
通用的成熟型算法,无法满足细分需求,但全靠算法工程师来定制开发不现实,也不够经济划算。基础大模型,将算法开发推进到工业化阶段,减少了编程工作量,提高了开发效率,定制化算法的性价比提高,也就更容易为企业所接受。
对于CV公司来说,算法进入工业化大生产阶段,将碎片化需求全面覆盖、规模化复用,整体营收能力自然也就上来了。
2 、 深入到具体行业中去,构筑能产生差异化的应用产品。
基础模型要走向产业,必须进一步精调,CV公司就有相应的优势。
很多高度专业化或复杂的工作,比如金融、建筑设计、编程、办公、客服等,需要精准的垂类知识;一些特定领域,比如医疗、司法,非结构化数据比较稀缺。没有足够的语料来“投喂”,基础模型在这些场景就会欠缺一些“常识”,比如GPT-4就写不好中文诗。
据说,GPT-3.5的训练数据集全部为私有数据集,其中关键的SFT训练集,有89.3%的数据是定制的。
CV公司大多有自己聚焦的垂直领域,比如依图的智能医疗,旷视的物联网,云从的智慧园区,商汤的智慧城市、智慧出行等,可以结合在相关领域沉淀的差异化数据集,利用精调或prompt的方式,打造出更加精确、可靠的小模型,更容易部署,为AI应用加速AI的快速落地。
3 、 建立更具韧性的生态合作护城河。
CV公司在大模型技术上的积累,就会变成AI 2.0时代的底牌,也可以作为与AI巨头、算力提供商的生态合作筹码。
比如这一轮大模型,对提示学习、人类反馈的强化学习RLHF等提出了很高的要求,让模型在人类的引导下,发现知识的使用方式,理解人类的偏好,这在国内都属于很新的领域,提示师、专业标注师很少。有媒体报道,OpenAI的标注员,本科学历52.6%,硕士学历36.8%,这就不能全部靠众包模式来进行数据标注,必须拥有自己的垂直领域的标注团队。

比如医疗领域,医学图像还没有建立起自然图像那么大级别的数据库,而对医学图像的标注是很难的,不像自然图像标注,普通人一看就知道是什么,医学图像的数据标注涉及到器官、癌变等专业知识,就需要针对性地积累。
这样的高水平技术人员,恰恰是CV公司这种AI-native原生企业的重要资源,可以与产业链上下游开展更紧密地合作,从而保障产品和服务的竞争力和可持续性,吸引客户更多地将数据放入自己的产品中,形成马太效应。
4 | 结语
大模型开辟了一条蕴藏着极大价值和可能性的新路,被寄托了太多期待和野心。要有大模型能力,不代表要自己训大模型。
重复建设的热潮终会褪去,届时,大模型商业化的考验才刚刚开始。
对于CV公司来说,脱下“大模型”的长衫,是为了留住商业化的“底裤”。集体弄潮只是只是一时热闹,保存实力才能在AI江湖中走得更远。
相关文章:
机器视觉公司,在玩一局玩不起的游戏
导语 有个著名咨询公司曾经预测过:未来只有两种公司,是人工智能的和不赚钱的。 它可能没想到,还有第三种——不赚钱的AI公司。 去年我们报道过“正在消失的机器视觉公司”,昔日的“AI 四小龙”( 商汤、旷视、云从、依图…...
Zephyr 消息队列
文章目录 简介数据结构k_msgq 定义消息队列发送消息k_msgq_put 接收消息k_msgq_get wait_q 的双重身份清理消息队列k_msgq_cleanup 重置消息队列k_msgq_purge 读取数据k_msgq_peekk_msgq_peek_at 缓冲区容量k_msgq_num_free_getk_msgq_num_used_get 简介 message queue 用于中…...
Jenkins自动化部署实例讲解
文章目录 前言实例讲解基本环境全局工具配置创建任务任务配置源码管理构建步骤(Build Steps)第一步:调用Maven第二步:执行shell启动容器 后记 前言 你平常在做自己的项目时,是否有过部署项目太麻烦的想法?…...
RK356X 解除UVC摄像头预览分辨率1080P限制
平台 RK3566 Android 11 概述 UVC: USB video class(又称为USB video device class or UVC)就是USB device class视频产品在不需要安装任何的驱动程序下即插即用,包括摄像头、数字摄影机、模拟视频转换器、电视卡及静态视频相机…...
English Learning - L2-14 英音地道语音语调 重音技巧 2023.04.10 周一
English Learning - L2-14 英音地道语音语调 重音技巧 2023.04.10 周一 课前热身重音日常表达节奏单词全部重读的句子间隔时间非重读单词代词和缩约词助动词声临其境语调预习 课前热身 学习目标 重音 重弱突出,重音突出核心表达的意思 重音是落在重读单词上&…...
3.6 n维随机变量
学习目标: 学习n维随机变量需要掌握一定的数学知识,包括多元微积分、线性代数和概率论等。要学习n维随机变量,我会采取以下步骤: 复习相关的数学知识:首先,我会复习多元微积分、线性代数和概率论的基本知…...
JavaSE学习进阶day06_02 Set集合和Set接口
第二章 Set系列集合和Set接口 Set集合概述:前面学习了Collection集合下的List集合,现在继续学习它的另一个分支,Set集合。 set系列集合的特点: Set接口: java.util.Set接口和java.util.List接口一样,同样…...
基于matlab分析卫星星座对通信链路的干扰
一、前言 此示例说明如何分析从中地球轨道 (MEO) 中的卫星星座到位于太平洋的地面站的下行链路上的干扰。干扰星座由低地球轨道(LEO)的40颗卫星组成。此示例确定下行链路闭合的时间、载波噪声加干扰比以及链路裕量。 此示例需要卫…...
Python中的异常——概述和基本语法
Python中的异常——概述和基本语法 摘要:Python中的异常是指在程序运行时发生的错误情况,包括但不限于除数为0、访问未定义变量、数据类型错误等。异常处理机制是Python提供的一种解决这些错误的方法,我们可以使用try/except语句来捕获异常并…...
Tomcat 部署与优化
1. Tomcat概述 Tomcat是Java语言开发的,Tomcat服务器是一个免费的开放源代码的Web应用服务器,是Apache软件基金会的Jakarta项目中的一个核心项目,由Apache、Sun和其他一些公司及个人 共同开发而成。Tomcat属于轻量级应用服务器,在…...
多模态之论文笔记ViLT
文章目录 ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision一. 简介1.1 摘要1.2 文本编码器,图像编码器,特征交互复杂度分析1.2 特征交互方式分析1.3 图像特征提取分析 二. 方法 Vision-and-Language Transformer2.1.方…...
微服务架构下认证和鉴权理解
认证和鉴权 从单体应用到微服务架构,优势很多,但是并不是代表着就没有一点缺点了。 微服务架构,意味着每个服务都是松散耦合的。因此,作为软件工程师和架构师,我们在分布式架构中面临着安全挑战。微服务对外开放的端…...
Qt 网络编程之美:探索 URL、HTTP、服务发现与请求响应
Qt 网络编程之美:探索 URL、HTTP、服务发现与请求响应(The Beauty of Qt Network Programming: Exploring URL, HTTP, Service Discovery, and Request-Response 引言(Introduction)QUrl 类:构建和解析 URL(…...
毕业2年,跳槽到下一个公司就25K了,厉害了···
本人本科就读于某普通院校,毕业后通过同学的原因加入软件测试这个行业,角色也从测试小白到了目前的资深工程师,从功能测试转变为测试开发,并顺利拿下了某二线城市互联网企业的Offer,年薪 30W 。 选择和努力哪个重要&a…...
设计模式 -- 适配器模式
前言 月是一轮明镜,晶莹剔透,代表着一张白纸(啥也不懂) 央是一片海洋,海乃百川,代表着一块海绵(吸纳万物) 泽是一柄利剑,千锤百炼,代表着千百锤炼(输入输出) 月央泽,学习的一种过程,从白纸->吸收各种知识->不断输入输出变成自己的内容 希望大家一起坚持这个过程,也同…...
STM32之增量式编码器电机测速
STM32之增量式编码器电机测速 编码器编码器种类按监测原理分类光电编码器霍尔编码器 按输出信号分类增量式编码器绝对式编码器 编码器参数分辨率精度最大响应频率信号输出形式 编码器倍频 STM32的编码器模式编码器模式编码器的计数方向仅在TI1计数电机正转,向上计数…...
一图看懂 xlsxwriter 模块:用于创建 Excel .xlsx 文件, 资料整理+笔记(大全)
本文由 大侠(AhcaoZhu)原创,转载请声明。 链接: https://blog.csdn.net/Ahcao2008 一图看懂 xlsxwriter 模块:用于创建 Excel .xlsx 文件, 资料整理笔记(大全) 摘要模块图类关系图模块全展开【xlsxwriter】统计常量模块1 xlsxwrit…...
【社区图书馆】NVMe协议的命令
声明 主页:元存储的博客_CSDN博客 依公开知识及经验整理,如有误请留言。 个人辛苦整理,付费内容,禁止转载。 内容摘要 前言 命令由host提交到内存中的SQ队列中,更新TDBxSQ后,NVMe控制器通过DMA的方式将SQ中的命令(怎么取,如何取,取多少,因设计而异)取到控制器缓冲区…...
Nginx网站服务
Nginx概述 Nginx 是开源、高性能、高可靠、低资源消耗的 Web 和反向代理服务器,而且支持热部署,几乎可以做到 7 * 24 小时不间断运行,即使运行几个月也不需要重新启动,还能在不间断服务的情况下对软件版本进行热更新。对HTTP并发…...
第八篇 Spring 集成JdbcTemplate
《Spring》篇章整体栏目 ————————————————————————————— 【第一章】spring 概念与体系结构 【第二章】spring IoC 的工作原理 【第三章】spring IOC与Bean环境搭建与应用 【第四章】spring bean定义 【第五章】Spring 集合注入、作用域 【第六章】…...
完整指南:为什么选择WeChatMsg开源工具解决你的微信聊天记录备份与分析难题
完整指南:为什么选择WeChatMsg开源工具解决你的微信聊天记录备份与分析难题 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitH…...
OpenClaw故障排查指南:GLM-4.7-Flash模型连接常见问题解决
OpenClaw故障排查指南:GLM-4.7-Flash模型连接常见问题解决 1. 为什么需要这份指南 上周我在本地部署GLM-4.7-Flash模型时,连续遭遇了三次连接失败。每次错误提示都像谜语一样——"Connection timeout"、"Invalid response"这些报错…...
探索Lumerical建模计算可调谐光学手性
Lumerical建模计算可调谐光学手性在光学领域,可调谐光学手性是一个极具吸引力的研究方向。而Lumerical作为一款强大的光学仿真软件,为我们深入探究这一领域提供了有力工具。 什么是可调谐光学手性 光学手性简单来说,描述的是光与物质相互作用…...
Qwen3-Reranker-0.6B部署教程:对接Weaviate向量数据库Hybrid Search集成
Qwen3-Reranker-0.6B部署教程:对接Weaviate向量数据库Hybrid Search集成 你是不是也遇到过这样的问题?用向量数据库做检索,明明搜出来一堆结果,但排在前面的总感觉不是最想要的。传统的向量相似度搜索,有时候就是差那…...
Qt与Visual Studio双剑合璧:海康工业相机SDK二次开发实战指南
1. 开发环境准备:当Qt遇上Visual Studio 第一次接触海康工业相机SDK开发时,我像大多数开发者一样纠结工具链选择。经过多个项目实战验证,Visual StudioQt Creator的组合堪称黄金搭档——前者提供强大的C调试能力,后者带来跨平台的…...
Token 中文定名词元,国产 AI 工具如何抢占词元红利?
3 月 23 日,中国发展高层论坛 2026 年年会上,国家数据局局长刘烈宏正式官宣:AI 领域核心术语 Token 的中文标准译名确定为“词元”。这一官方定名,结束了之前 “令牌”“代币”“词块” 等译法混用的行业乱象,为中国 A…...
从零开始:LabelImg图像标注工具的完整实战指南
从零开始:LabelImg图像标注工具的完整实战指南 【免费下载链接】labelImg LabelImg is now part of the Label Studio community. The popular image annotation tool created by Tzutalin is no longer actively being developed, but you can check out Label Stu…...
CentOS7服务器流量飙升?别慌,用iftop+nload快速揪出‘吃流量’的进程
CentOS7服务器流量异常排查实战:iftop与nload组合拳 深夜的告警铃声突然响起,监控系统显示某台核心业务服务器的带宽使用率飙升至95%。作为运维人员,这种场景并不陌生——可能是业务量激增,也可能是恶意攻击,或是某个失…...
wangEditor 5移动端兼容性深度解析:终极跨平台富文本编辑实战指南
wangEditor 5移动端兼容性深度解析:终极跨平台富文本编辑实战指南 【免费下载链接】wangEditor wangEditor —— 开源 Web 富文本编辑器 项目地址: https://gitcode.com/gh_mirrors/wa/wangEditor 在移动优先的时代,富文本编辑器的移动端兼容性已…...
终极指南:5个简单步骤用eqMac提升macOS音频体验 [特殊字符]
终极指南:5个简单步骤用eqMac提升macOS音频体验 🎧 【免费下载链接】eqMac macOS System-wide Audio Equalizer & Volume Mixer 🎧 项目地址: https://gitcode.com/gh_mirrors/eq/eqMac 想为你的Mac打造专业级的音频体验吗&#x…...
