机器视觉公司,在玩一局玩不起的游戏
导语
有个著名咨询公司曾经预测过:未来只有两种公司,是人工智能的和不赚钱的。
它可能没想到,还有第三种——不赚钱的AI公司。
去年我们报道过“正在消失的机器视觉公司”,昔日的“AI 四小龙”( 商汤、旷视、云从、依图),在商业化盈利上各有各的不顺。不过,随着GPT系列产品又掀起一股“大炼模型”的热潮,这些AI公司又支棱起来了。
商汤科技此前曾披露,下一步的发展战略是通用人工智能(AGI),继续推进“大装置+大模型”,并发布了1800亿参数的中文语言大模型 “商量”。
旷视科技也表态,会坚定投入生成式大模型的研发,保持核心技术能力长期领先。
云从科技公开的定增预案中,为云从“行业精灵”大模型研发项目,募集资金不超过36.35亿元。
依图科技没有公开消息,但在此前的融资中曾因AI大模型和国产芯片等被看好。
无论是上一轮,以BERT、GPT-3为代表的“预训练+精调”大模型,还是此刻正红火的,以ChatGPT、GPT-4、文心一言等为代表的“预训练+精调+提示+RLHF(人类反馈)”的大语言模型,已经成为各大头部科技公司“秀肌肉”、相互竞争的重要工具。
谷歌、百度等大厂跑着入场,各路大模型“神仙斗法”。这场狂欢派对,成了机器视觉公司不得不玩、又玩不起的游戏。
1 | 尴尬的“长衫”
最近,CV公司参与到大模型这局游戏中,出现了这样的画风:语气一会儿大,一会儿怂。
在公开信息中,都表示自己会加大投入,去解决基础技术、基础问题。云从的管理者说要“投一二十亿解决算力问题”“我们是技术公司,研发投入不会低”;商汤的有关人士称,要做“统一化标准化的大模型”“加速构建通用人工智能的核心能力”;旷视也对标OpenAI,要“做影响物理世界的 AI 技术创新”。
谈到大模型技术和产品本身,底气又不足了。
这个说“基础大模型要有长期布局,NLP难点很多,短期内与境外领先企业会存在较大差距”,那个说“中国AI公司有商业化的压力,不能像OpenAI那样不计代价的创新”。
“预期管理”算是被你们玩明白了。
年轻人流行说自己是“脱不下长衫的孔乙己”,CV公司对于大模型这种不尴不尬的处境,其实也和“孔乙己”有相似之处。
CV公司在底层技术、基础设施、人才、资金、生态等领域的积累,不如头部科技企业优势显著。所以,自然也不可能真的跟谷歌、OpenAI、BATH(百度、阿里、腾讯、华为)正面打擂台,烧钱去做通用的基础大模型(foundation model)。
新一轮大语言模型,完整技术栈、工程实现能力、算力成本、数据积累等都有极高的门槛,AI公司自研大语言模型的难度前所未有。 OpenAI 在2022年就花掉了5.44亿美元,收入只有3600万美元,这是国内CV公司不具备的家底儿。
当然,外界也不应该过度放大CV公司的责任,非要将巨头才能承担的创新压力放在CV公司身上。
但是,CV公司又有着“AI-native原生企业”的光环,也确实积累了很多技术储备, 所以也不能直接躺平,像ISV集成商、软件公司一样依附大厂,欢欣鼓舞地等着集成或调用API就好。
昔日的“AI四小龙”还是要撑起“技术自立”的架子,努力融入这波炼大模型的热潮里,于是,又将模型数量和参数规模的比拼,拉升到了新的竞争水平。
比如云从有NLP、视觉领域的预训练模型,商汤在“AI大装置SenseCore”的基础上,构建的日日新大模型体系就包含了通用视觉模型、中文语言模型、图片生成模型……其中,仅“商量”大模型的参数规模,就和GPT-3差不多。
今天大家都感慨,孔乙己脱下长衫不容易,换个角度,“大模型”这件长衫,CV公司是不是有必要穿上呢?
2 | 玩不起的游戏
从2018年的预训练大模型到2023年的大语言模型,大模型走过了一个从萌芽到繁荣的小周期,种类、功能也丰富起来,我们已经见过很多AI企业、高校和科研机构、行业公司所打造的各种各样的大模型。
问题便随之而来:
第一,大模型的“智能涌现”,需要在超大规模的数据和充分的训练才能出现,只有不计投入的基础模型能做到。
很多面向行业的预训练大模型,由于数据和训练不足,无法达到“智能涌现”的临界点,这也是为什么此前预训练大模型那么多,却只有ChatGPT的到来,才证实了“通用人工智能”的可行性。
在基础模型的鲁棒性、泛化性极大提升的今天,一味盲目地“训大模型”,结果就是“大小班同上”,基础大模型和行业大模型一起,消耗本就不充沛的算力,进一步推高计算成本,让AI企业背上更重的负担。
第二,大模型的商业化路径,标准化API是比较基础的一种,而基础模型API有虹吸效应。
简单来说,通过API接入AI能力,技术是决定性因素,基础模型的能力强、受众广泛,很容易通过API经济完成商业化,而行业大模型面对的领域较窄,很难通过“规模效应”来摊薄研发成本。
随着一个又一个大模型被推向市场,大家恍然发现:原来我们并不缺大模型,缺的是商业化路径。
目前,大模型的商业化还比较有限,C端通用产品贴成本定价,B端盈利前景不明朗,根据 A16Z 对美国 LLM 创业调研,纯模型厂商只能拿走0-10%的价值,并且要长期对标OpenAI的定价策略,会面临很大的商业化压力。
通用基础模型和行业大模型一起面向市场和客户,结果就是,在商业价值分配上产生博弈。AI巨头“神仙斗法”,打造出的通用基础大模型会吸引产业和用户的最多关注。
而大量行业大模型,要么在训完后无人问津,浪费了前期投入;要么无法满足产业需求,商业化前景受限;或者跟通用基础大模型的能力有冲突,导致商业化达不到预期。
同为AI创业型公司的出门问问创始人李志飞,就在一次采访中直言:“不是所有人都要去做通用大模型,贸然进入,难度很大,商业竞争很激烈,想不清商业模式到最后会很痛苦。”
所以,大炼模型,可能是CV公司目前玩不起的一局游戏。
3 | 轻装上阵的路
你可能会问,现在大模型这么火,不训大模型怎么能吃到这波红利,在新一轮AI热潮里建立优势呢?
CV公司要轻装上阵,可能要尝试这样几条路,去探索大模型热潮中的机会:
1 、 跟基础大模型平台建立更紧密地联系。
自己开发大模型难度太大,训练成本、存算成本过高,社区生态支持也不够充足。可以站在巨人的肩膀上,接入基础模型的能力打造小模型,与基础模型的商业模式形成差异。
此前CV公司盈利难的一个挑战是:机器视觉要进入腰尾市场,存在着海量的碎片化需求,客户体量比较小、数量多,项目规模不大,这对CV公司的开发效率提出了很高的要求。
通用的成熟型算法,无法满足细分需求,但全靠算法工程师来定制开发不现实,也不够经济划算。基础大模型,将算法开发推进到工业化阶段,减少了编程工作量,提高了开发效率,定制化算法的性价比提高,也就更容易为企业所接受。
对于CV公司来说,算法进入工业化大生产阶段,将碎片化需求全面覆盖、规模化复用,整体营收能力自然也就上来了。
2 、 深入到具体行业中去,构筑能产生差异化的应用产品。
基础模型要走向产业,必须进一步精调,CV公司就有相应的优势。
很多高度专业化或复杂的工作,比如金融、建筑设计、编程、办公、客服等,需要精准的垂类知识;一些特定领域,比如医疗、司法,非结构化数据比较稀缺。没有足够的语料来“投喂”,基础模型在这些场景就会欠缺一些“常识”,比如GPT-4就写不好中文诗。
据说,GPT-3.5的训练数据集全部为私有数据集,其中关键的SFT训练集,有89.3%的数据是定制的。
CV公司大多有自己聚焦的垂直领域,比如依图的智能医疗,旷视的物联网,云从的智慧园区,商汤的智慧城市、智慧出行等,可以结合在相关领域沉淀的差异化数据集,利用精调或prompt的方式,打造出更加精确、可靠的小模型,更容易部署,为AI应用加速AI的快速落地。
3 、 建立更具韧性的生态合作护城河。
CV公司在大模型技术上的积累,就会变成AI 2.0时代的底牌,也可以作为与AI巨头、算力提供商的生态合作筹码。
比如这一轮大模型,对提示学习、人类反馈的强化学习RLHF等提出了很高的要求,让模型在人类的引导下,发现知识的使用方式,理解人类的偏好,这在国内都属于很新的领域,提示师、专业标注师很少。有媒体报道,OpenAI的标注员,本科学历52.6%,硕士学历36.8%,这就不能全部靠众包模式来进行数据标注,必须拥有自己的垂直领域的标注团队。
比如医疗领域,医学图像还没有建立起自然图像那么大级别的数据库,而对医学图像的标注是很难的,不像自然图像标注,普通人一看就知道是什么,医学图像的数据标注涉及到器官、癌变等专业知识,就需要针对性地积累。
这样的高水平技术人员,恰恰是CV公司这种AI-native原生企业的重要资源,可以与产业链上下游开展更紧密地合作,从而保障产品和服务的竞争力和可持续性,吸引客户更多地将数据放入自己的产品中,形成马太效应。
4 | 结语
大模型开辟了一条蕴藏着极大价值和可能性的新路,被寄托了太多期待和野心。要有大模型能力,不代表要自己训大模型。
重复建设的热潮终会褪去,届时,大模型商业化的考验才刚刚开始。
对于CV公司来说,脱下“大模型”的长衫,是为了留住商业化的“底裤”。集体弄潮只是只是一时热闹,保存实力才能在AI江湖中走得更远。
相关文章:

机器视觉公司,在玩一局玩不起的游戏
导语 有个著名咨询公司曾经预测过:未来只有两种公司,是人工智能的和不赚钱的。 它可能没想到,还有第三种——不赚钱的AI公司。 去年我们报道过“正在消失的机器视觉公司”,昔日的“AI 四小龙”( 商汤、旷视、云从、依图…...

Zephyr 消息队列
文章目录 简介数据结构k_msgq 定义消息队列发送消息k_msgq_put 接收消息k_msgq_get wait_q 的双重身份清理消息队列k_msgq_cleanup 重置消息队列k_msgq_purge 读取数据k_msgq_peekk_msgq_peek_at 缓冲区容量k_msgq_num_free_getk_msgq_num_used_get 简介 message queue 用于中…...

Jenkins自动化部署实例讲解
文章目录 前言实例讲解基本环境全局工具配置创建任务任务配置源码管理构建步骤(Build Steps)第一步:调用Maven第二步:执行shell启动容器 后记 前言 你平常在做自己的项目时,是否有过部署项目太麻烦的想法?…...

RK356X 解除UVC摄像头预览分辨率1080P限制
平台 RK3566 Android 11 概述 UVC: USB video class(又称为USB video device class or UVC)就是USB device class视频产品在不需要安装任何的驱动程序下即插即用,包括摄像头、数字摄影机、模拟视频转换器、电视卡及静态视频相机…...

English Learning - L2-14 英音地道语音语调 重音技巧 2023.04.10 周一
English Learning - L2-14 英音地道语音语调 重音技巧 2023.04.10 周一 课前热身重音日常表达节奏单词全部重读的句子间隔时间非重读单词代词和缩约词助动词声临其境语调预习 课前热身 学习目标 重音 重弱突出,重音突出核心表达的意思 重音是落在重读单词上&…...

3.6 n维随机变量
学习目标: 学习n维随机变量需要掌握一定的数学知识,包括多元微积分、线性代数和概率论等。要学习n维随机变量,我会采取以下步骤: 复习相关的数学知识:首先,我会复习多元微积分、线性代数和概率论的基本知…...

JavaSE学习进阶day06_02 Set集合和Set接口
第二章 Set系列集合和Set接口 Set集合概述:前面学习了Collection集合下的List集合,现在继续学习它的另一个分支,Set集合。 set系列集合的特点: Set接口: java.util.Set接口和java.util.List接口一样,同样…...

基于matlab分析卫星星座对通信链路的干扰
一、前言 此示例说明如何分析从中地球轨道 (MEO) 中的卫星星座到位于太平洋的地面站的下行链路上的干扰。干扰星座由低地球轨道(LEO)的40颗卫星组成。此示例确定下行链路闭合的时间、载波噪声加干扰比以及链路裕量。 此示例需要卫…...

Python中的异常——概述和基本语法
Python中的异常——概述和基本语法 摘要:Python中的异常是指在程序运行时发生的错误情况,包括但不限于除数为0、访问未定义变量、数据类型错误等。异常处理机制是Python提供的一种解决这些错误的方法,我们可以使用try/except语句来捕获异常并…...

Tomcat 部署与优化
1. Tomcat概述 Tomcat是Java语言开发的,Tomcat服务器是一个免费的开放源代码的Web应用服务器,是Apache软件基金会的Jakarta项目中的一个核心项目,由Apache、Sun和其他一些公司及个人 共同开发而成。Tomcat属于轻量级应用服务器,在…...

多模态之论文笔记ViLT
文章目录 ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision一. 简介1.1 摘要1.2 文本编码器,图像编码器,特征交互复杂度分析1.2 特征交互方式分析1.3 图像特征提取分析 二. 方法 Vision-and-Language Transformer2.1.方…...

微服务架构下认证和鉴权理解
认证和鉴权 从单体应用到微服务架构,优势很多,但是并不是代表着就没有一点缺点了。 微服务架构,意味着每个服务都是松散耦合的。因此,作为软件工程师和架构师,我们在分布式架构中面临着安全挑战。微服务对外开放的端…...

Qt 网络编程之美:探索 URL、HTTP、服务发现与请求响应
Qt 网络编程之美:探索 URL、HTTP、服务发现与请求响应(The Beauty of Qt Network Programming: Exploring URL, HTTP, Service Discovery, and Request-Response 引言(Introduction)QUrl 类:构建和解析 URL(…...

毕业2年,跳槽到下一个公司就25K了,厉害了···
本人本科就读于某普通院校,毕业后通过同学的原因加入软件测试这个行业,角色也从测试小白到了目前的资深工程师,从功能测试转变为测试开发,并顺利拿下了某二线城市互联网企业的Offer,年薪 30W 。 选择和努力哪个重要&a…...

设计模式 -- 适配器模式
前言 月是一轮明镜,晶莹剔透,代表着一张白纸(啥也不懂) 央是一片海洋,海乃百川,代表着一块海绵(吸纳万物) 泽是一柄利剑,千锤百炼,代表着千百锤炼(输入输出) 月央泽,学习的一种过程,从白纸->吸收各种知识->不断输入输出变成自己的内容 希望大家一起坚持这个过程,也同…...

STM32之增量式编码器电机测速
STM32之增量式编码器电机测速 编码器编码器种类按监测原理分类光电编码器霍尔编码器 按输出信号分类增量式编码器绝对式编码器 编码器参数分辨率精度最大响应频率信号输出形式 编码器倍频 STM32的编码器模式编码器模式编码器的计数方向仅在TI1计数电机正转,向上计数…...

一图看懂 xlsxwriter 模块:用于创建 Excel .xlsx 文件, 资料整理+笔记(大全)
本文由 大侠(AhcaoZhu)原创,转载请声明。 链接: https://blog.csdn.net/Ahcao2008 一图看懂 xlsxwriter 模块:用于创建 Excel .xlsx 文件, 资料整理笔记(大全) 摘要模块图类关系图模块全展开【xlsxwriter】统计常量模块1 xlsxwrit…...

【社区图书馆】NVMe协议的命令
声明 主页:元存储的博客_CSDN博客 依公开知识及经验整理,如有误请留言。 个人辛苦整理,付费内容,禁止转载。 内容摘要 前言 命令由host提交到内存中的SQ队列中,更新TDBxSQ后,NVMe控制器通过DMA的方式将SQ中的命令(怎么取,如何取,取多少,因设计而异)取到控制器缓冲区…...

Nginx网站服务
Nginx概述 Nginx 是开源、高性能、高可靠、低资源消耗的 Web 和反向代理服务器,而且支持热部署,几乎可以做到 7 * 24 小时不间断运行,即使运行几个月也不需要重新启动,还能在不间断服务的情况下对软件版本进行热更新。对HTTP并发…...

第八篇 Spring 集成JdbcTemplate
《Spring》篇章整体栏目 ————————————————————————————— 【第一章】spring 概念与体系结构 【第二章】spring IoC 的工作原理 【第三章】spring IOC与Bean环境搭建与应用 【第四章】spring bean定义 【第五章】Spring 集合注入、作用域 【第六章】…...

双塔模型:微软DSSM模型浅析
1.背景 DSSM是Deep Structured Semantic Model (深层结构语义模型) 的缩写,即我们通常说的基于深度网络的语义模型,其核心思想是将query和doc映射到到共同维度的语义空间中,通过最大化query和doc语义向量之间的余弦相似度,从而训…...

DAY 44 Apache网页优化
Apache网页优化 概述 在企业中,部署Apache后只采用默认的配置参数,会引发网站很多问题,换言之默认配置是针对以前较低的服务器配置的,以前的配置已经不适用当今互联网时代 为了适应企业需求,就需要考虑如何提升Apach…...

移动端手机网页适配iPad与折叠屏设备
采用的网页适配方案:移动端页面px布局适配方案(viewport) 产生此问题的原因 由于手机与平板等设备宽高比差异导致页面展示不全或者功能按钮展示在视口之外点击不到。 简单来说就是我们的页面都是瘦长(即高大于宽)的,而折叠屏等设…...

深入剖析 Qt QMap:原理、应用与技巧
目录标题 引言:QMap 的重要性与基本概念QMap 简介:基本使用方法(QMap Basics: Concepts and Usage)QMap 迭代器:遍历与操作键值对(QMap Iterators: Traversing and Manipulating Key-Value Pairs࿰…...

SpringBoot使用Hbase
SpringBoot使用Hbase 文章目录 SpringBoot使用Hbase一,引入依赖二,配置文件添加自己的属性三,配置类注入HBASE配置四,配置Hbase连接池五,配置操作服务类 一,引入依赖 <dependency><groupId>org…...

SQL优化总结
SQL优化总结 1. MySQL层优化五个原则2. SQL优化策略2.1 避免不走索引的场景 3. SELECT语句其他优化3.1 避免出现select *3.2 避免出现不确定结果的函数3.3 多表关联查询时,小表在前,大表在后。3.4 使用表的别名3.5 调整Where字句中的连接顺序 附录 1. My…...

【python学习】基础篇-字典的基本操作 获取当前日期时间
1.字典的定义与创建 定义字典时,每个元素都包含两个部分“键”和“值”,在“键”和“值”之间使用冒号(:)分隔,相邻两个元素使用逗号分隔,所有元素放在一个大括号“{}”中。语法格式如下: dictionary (‘key1’:‘value1’, &quo…...

Python FreeCAD.Vector方法代码示例
Python FreeCAD.Vector方法代码示例 本文整理汇总了Python中FreeCAD.Vector方法的典型用法代码示例。如果您正苦于以下问题:Python FreeCAD.Vector方法的具体用法?Python FreeCAD.Vector怎么用?Python FreeCAD.Vector使用的例子?那…...

HDFS 梳理
HDFS客户端 客户端作用 管理文件目录文件系统操作读写 客户端生成 配置项 配置 客户端状态 缓冲相关参数,读写缓冲 失败切换操作 推测执行?? NN引用 NNProxy 客户端关闭 关闭IO流 修改状态 关闭RPC连接 是否有多个RPC连接? HDFS读 打开文件构…...

ChatGPT团队中,3个清华学霸,1个北大学霸,共9位华人
众所周知,美国硅谷其实有着众多的华人,哪怕是芯片领域,华为也有着一席之地,比如AMD 的 CEO 苏姿丰、Nvidia 的 CEO 黄仁勋 都是华人。 还有更多的美国著名的科技企业中,都有着华人的身影,这些华人ÿ…...