大模型混战,最先实现“智慧涌现”的会是谁?
作者 | 曾响铃
文 | 响铃说
几秒钟写出了一篇欢迎词;
小说人物乱入现实,快速创作不重样的故事;
鼠标一点,一封英文工作沟通邮件撰写完成;
准确解出数学应用题,还给出解题步骤;
甚至还能理解人类情感,认识同一个词语在不同场合下的含义……
在一片掌声中,不久前的科大讯飞“星火”认知大模型发布会,以现场实机的方式,第一次向业界展示了中国的大模型能力所能达到的程度。
科大讯飞董事长刘庆峰称,在文本生成和数学能力(一定程度代表通用认知大模型的智慧水平)上,星火认知大模型已经国内显著领先,且相比ChatGPT也具有一定优势;在语言理解和知识问答方面也达到接近ChatGPT水平,处于国内领先水平。
大模型的能力无疑是令人惊叹的。OpenAI的CEO奥特曼曾经说,数据量大了,模型大了,就突然就出现了令人惊喜的结果,他也不知道为什么。
刘庆峰在接受采访时表示,星火对一些问题的回复,“不知道它怎么懂的”。
这一类现象,正在接近人工智能领域期待已久的“智慧涌现”(Emergent Intelligence)。
如刘庆峰所言,统一的深度神经网络大模型在输入多元多模态的数据后,可以就所有非特定领域“触类旁通”,而不需要专门以特定的问题去训练。
智慧涌现从根本上告别了预设认知的“知识图谱”AI模式,在走向真正的认知智能。
在国内大模型遍地开花的大背景下,“智慧涌现”将成为共同的愿景。
而谁才能最先做到“智慧涌现”?
越来越多现实表明,作为一种技术创新,大模型也需要和其他技术创新一样,实现从技术能力到生态伙伴到产业应用的打通。
如刘庆峰所言,是要找准“最解决社会刚需而又有市场规模能够自我造血的点”,不断反哺技术创新提升,最终要实现“良性循环”。
只有良性循环,才能不断强化和提升,实现智慧涌现。
反过来,拆解当下大模型实现良性循环的几个要求,智慧涌现的实现也就自然而然了。
能力有链条,才能真正“智慧”
“星火”发布了七大能力,文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态。
这是通用人工智能的七大维度,很多厂商也基本上都跟随chatGPT进行了布局。
但科大讯飞对它们的各自认识却并不相同。
在“星火”发布会上,刘庆峰表示,5月份星火还要进行一次迭代,增加更多的插件机制。
“有理解能力就可以做很多插件机制。”
在刘庆峰看来,“自然语言理解水平到位,才能最后让大模型真的作为一个工具,能够把各种插件充分的调阅起来”。
也即,在科大讯飞的布局中,语言理解能力不仅仅是在发布会现场让观众发出惊呼,更重要的是它的强化,能够让大模型整体的能力“接驳”到不同的场景中去,API能够理解复杂的指令、给出切中需求的结果。
所以,语言理解能力对友商的领先,也被刘庆峰视作“独特优势”。
与此类似的,还有科大讯飞宣布“星火”6月份将有一次重大升级,其中数学理解要强化。
这背后,是科大讯飞认为“数学能力是代表大模型聪明程度”,“数学理解在智慧涌现中能够帮助到其他能力”,因此,在评价对国内竞品有代差级优势后,还不满意,还必须针对性强化。
此外,知识问答能力,也在发布会现场被刘庆峰透露要具体到垂直场景中,例如可以在医疗领域发挥价值。
可见,科大讯飞虽然发布了7大能力,但内在不同的能力却有自己的定位,形成了链条,有针对性的优化调整。
对大模型而言,只有这样,才能做到真正“智慧”,并让教育、办公、汽车等大多数场景和个体感受到“智慧”。
当然,完成七大能力的构建,尤其是针对性的能力提升,并非只有一个宏观认识就足够了,还离不开长期的技术储备。
早在2011年,科大讯飞就获准成立语音及语言信息处理国家工程实验室,2017年,科大讯飞又成立认知智能国家重点实验室,一系列技术创新和进步不断积累。
例如,2015年语音转写首次超过人类速记员、2017年通过国家执业医师资格考试、2019年SQuAD机器阅读理解全球首次超过人类平均水平、2022年OpenBookQA 科学知识推理单模型超过人类平均水平,等等。
这些,成为“星火”七大能力的基础,是科大讯飞2022年年底启动“1+N”(1个通用认知智能大模型、N个领域落地)认知大模型专项攻关的前提,也是“星火”能够在语言理解等特定能力上有独特优势的保障。
离场景更近,才能快速“涌现”
GPT-4发布后,并没有公布其参数量,这被视为走向商业化的准备。
毕竟,截止4月,微软向OpenAI已投入130亿美元,2023年,OpenAI预期还要实现数亿美元的营收,来开启“回报”的进程。
不论什么大模型,最终都必须走向商用、服务企业,创造专业价值,才能实现发展运营的良性循环——自我造血,是最大的良性循环。
实际上,“智慧涌现”,也并不仅仅指的是AI能力的触类旁通,更重要的还有各个场景下AI应用所产生的惊人效果。
要实现这种“涌现”,就必须加速AI能力向产业的落地。
包月、按量收费、VIP一对一……不管是什么样的商业模式,大模型背后的厂商所拥有的场景积累,决定了“涌现”的速度和深度。这是大厂的“基因优势”,可以直接结合过去一直在进行智能化场景业务来推动chatBOT能力落地。
典型的,还有“星火”发布的同时,科大讯飞就在现场同时发布了教育、办公、汽车、数字员工四大行业应用。
从目前的市场状况看,大模型的场景“涌现”,厂商能够在三个方面展现过去业务积累的价值。
1、离产品最近
很多过去就带有智能化能力的硬件和服务,可以直接接入大模型来实现能力的升维。
例如,“星火”接入科大讯飞AI学习机,让该产品实现中英文作文类人批改,;另外,讯飞智能办公本产品也直接受益于大模型,可以实现会议纪要的高效、精准、扼要整理,以及语音转写文稿的规整化。
目前,讯飞智能录音笔、讯飞智能麦克风等办公产品也在接入“星火”。
2、离产业最近
To B的智能化转型服务原本就是AI的主战场,现在可以直接引入大模型。
“星火”接入智能座舱,与科大讯飞为数千个车型提供智能语音交互服务有直接关系,现在这种交互变得更自由、更拟人化。此外,“大模型+数字员工”,在企业招聘、营销售后等方面能为企业提供更拟人甚至超越人的工作能力。
正如科大讯飞计划在医疗、城市、政法、工业等行业引入大模型,To B市场上已有的智能化服务都有接入大模型的可能性。
3、离生态最近
将已有的资源接入大模型,大厂们还需要更多伙伴的协同。
刘庆峰在接受采访时表示,“一定要靠生态共荣来做”,他透露,有首批来自36个行业的3000余家企业开发者将接入星火大模型。发布会上,科大讯飞还启动了“2023 科大讯飞AI星火营生态计划”。
这背后,也离不开科大讯飞已有的、来自千行百业的400多万开发者生态。
大模型的落地,不是只有把技术接入产品、服务卖给客户,没有生态运营能力,也很难“循环”起来。
力量成建制,才能持续进步
有链条定位的能力,离场景更近,“良性循环”就能够滚起来。
而这种滚动能够不断持续下去,还需要厂商本身在战略、战术、团队等方面建制化力量。
这不仅是对加入大模型竞逐的创业团队提出的严峻要求,也对大厂管理运营能力提出了要求。
草台班子,或者没法力出一孔推出新业务的大厂,做不到良性循环的持续。
刘庆峰的信心,很大一部分也来自这样的成建制力量。
在战略定位上,科大讯飞承载着认知智能唯一的全国重点实验室,“星火”的出色表现,某种程度上也是国家层面的幸事。
在战术上,科大讯飞没有闷头做技术和产品,而是以认知智能全国重点实验室会同中科院人工智能产学研创新联盟、长三角人工智能产业链联盟等业界权威力量,面向整个行业推出了通用认知智能大模型评测体系。
通过七个方面481个维度的分解,通用人工智能能力的评价有了一个相对更客观的评价标准。
一方面,在大量跟风入局的大背景下,技术的好坏不再凭借厂商各自的品牌宣传。
科大讯飞就试图用这套体系来客观讲述其大模型各项能力的水平。
例如,在英文的邮件、广告文案、招牌广告、新闻通告等事项上,5分制下,ChatGPT为4.48分,而“星火”达到了4.29分,领先国内同行,与ChatGPT十分接近。
这就使得市面上那种单一问题评价的方式(不管是官方的,还是测试者的体验报告)被摒弃,体系化的方式更令人信服。
一些行业乱象或也将被肃清。
另一方面,评测标准反过来也是指导标准,能够帮助更多入局的厂商更好地优化自己的技术和服务。
正如刘庆峰在采访中所言,“一方面对自己的研究做到什么程度是一个指导,指导我应该怎么做得更好,每一个阶段的版本进步在哪,有哪些缺点;另外一个也是用它来真的来看,根据不同的应用,应该关注哪些能力。”
评测体系的出现,一定程度上表现出全球大模型激烈竞争下,国内行业领头羊所承担的行业职责。
在团队上,科大讯飞“星火”核心团队目前有200人,大部分都是85后90后的年轻团队,每个领域分了8个子项目,每个课题的领军人物都在这个领域中做了8~10年。
而200人之外,刘庆峰介绍,还有支持团队1000余人,以及更外圈10万人的兼职数据标记团队。
这个整齐有序的团队体系建设,是“星火”各项能力能够不断进步、攻克大模型相关难题的保障。
战略、战术、团队,一整套建制化力量下来,科大讯飞还将在6月9号、8月15号和10月24号发布迭代版本。
对更多想要入局或者已经入局大模型的玩家而言,科大讯飞的案例表明,对技术有认知、对场景有沉淀,还能做好操盘,才能实现持续的“良性循环”。
光有技术与热血,在大模型这里,不足以实现“智慧涌现”。
*本文图片均来源于网络
*此内容为【响铃说】原创,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。
#响铃说 Focusing on企业数字化与产业智能化升级,这是关注一切与创业、产业和商业相关的降本增效新技术、新模式、新生态 NO.339深度解读
【完】
曾响铃
1钛媒体、品途、人人都是产品经理等多家创投、科技网站年度十大作者;
2 虎啸奖评委;
3 作家:【移动互联网+ 新常态下的商业机会】等畅销书作者;
4 《中国经营报》《商界》《商界评论》《销售与市场》等近十家报刊、杂志特约评论员;
5 钛媒体、36kr、虎嗅、界面、澎湃新闻等近80家专栏作者;
6 “脑艺人”(脑力手艺人)概念提出者,现演变为“自媒体”,成为一个行业;
7 腾讯全媒派荣誉导师、多家科技智能公司传播顾问。
相关文章:

大模型混战,最先实现“智慧涌现”的会是谁?
作者 | 曾响铃 文 | 响铃说 几秒钟写出了一篇欢迎词; 小说人物乱入现实,快速创作不重样的故事; 鼠标一点,一封英文工作沟通邮件撰写完成; 准确解出数学应用题,还给出解题步骤; 甚至还能理…...

Powerlink协议在嵌入式linux上的移植和主从站通信(电脑和linux板通信实验)
使用最新的openPOWERLINK 2.7.2源码,业余时间搞定了Powerlink协议在嵌入式linux上的移植和测试,并进行了下电脑和linux开发板之间的通信实验。添加了一个节点配置,跑通了源码中提供的主站和从站的两个demo。这里总结下移植过程分享给有需要的…...

快速理解基本的cookie、session 和 redis
一、Cookie 1、什么是Cookie 1、Cookie实际上是一小段的文本信息,是一种keyvalue形式的字符串。客户端请求服务器,如果服务器需要记录该用户状态,就使用response向客户端浏览器颁发一个Cookie。客户端会把Cookie保存起来。 2、当浏览器再请求…...

STANet代码复现出现的问题
1 IndexError: boolean index did not match indexed array along dimension 0; dimension is 4194304 but corresponding boolean dimension is 65536定位到导致错误的代码,是metric.py,Collect values for Confusion Matrix 收集混淆矩阵的值时出错 …...
Java 中String对象详解
Java语言中的String对象是一个非常常见的数据类型,大多数情况下我们都是在使用String对象来表示字符串类型的数据。Java中的String类是一个final class,它是不可被继承的。本文将对Java中的String对象进行详细全面的描述,包括以下几个方面&am…...

k8s nfs运行问题、etcd问题、calico网络问题
服务器重启后nfs运行问题导致服务不能正常重启 解决办法 在每个节点下使用如下命令进行查看nfs是否正常启动 systemctl status nfs 如果没有启动,则使用如下命令启动,保证三个节点下的nfs都正常启动 systemctl start nfs 再次查看nfs是否正常启动 syst…...

Qt--QString字符串类、QTimer定时器类
目录 1. QString 字符串类 dialog.cpp 2. 容器类 2.1 顺序容器 QList 示例代码: student.h student.cpp dialog.h dialog.cpp 运行结果: 2.2 关联容器 QMap 示例代码: dialog.h dialog.cpp 运行结果: 3. Qt类型 3.1 跨平台数据类型…...

2023.5.13>>Eclipse+exe4j打包Java项目及获取exe所在文件的路径
Eclipseexe4j打包Java项目及获取exe所在文件的路径 1、打包exe文件1.1 打jar包1.2 打包exe2、在程序中获取exe所在路径3、遇到问题4、JDK version和class file version(Class编译版本号)对应关系5、参考文章 1、打包exe文件 1.1 打jar包 右单击项目选择“Export…” 1.2…...
Centos系统的使用基本教程
Centos是一款流行的Linux操作系统,它基于Red Hat Enterprise Linux系统,是一款稳定、可靠、安全的操作系统。本文将介绍Centos系统的基本使用方法,包括安装、命令行操作、软件安装和系统管理等方面的内容。 安装Centos系统 Centos系统可以从…...
IDEA生成ER图、UML类图、时序图、流程图等的插件推荐或独立工具推荐
以下是几个常用的IDEA插件和独立工具,可以用于生成ER图、UML类图、时序图、流程图等: Visual Paradigm (独立工具) Visual Paradigm是一个强大的建模工具,可以生成UML类图、时序图、流程图等。它支持多种语言和框架,包括Java、Spr…...

Python心经(3)
这一节总结点demo和常用知识点 目录 有关字符串格式化打印的 lambda匿名函数,,将匿名函数作为参数传入 文件读写 生成器 python的装饰器 简单的网站代码: 有关三元运算 推导式: 新浪面试题: 有关面向对象里…...
单工,半双工,全双工通讯
对于点对点之间的通信,按照消息传送的方向与时间关系,通信方式可分为单工通信、半双工通信及全双工通信三种。 单工通信 单工通信(Simplex Communication)是指消息只能单方向传输的工作方式。 在单工通信中,通信的信…...
【2023-05-09】 设计模式(单例,工厂)
2023-05-09 设计模式(单例,工厂) 单例模式 顾名思义,就是整个系统对外提供的实例有且只有一个 特点: 1、单例类只有一个实例 2、必须是自己创建唯一实例 3、必须给所以对象提供这个实例 分类ÿ…...

批量任务导致页面卡死解决方案
需求背景 需要基于高德地图展示海量点位(大概几万个),点位样式要自定义(创建DOM),虽然使用了聚合点,但初始化时仍需要将几万个点位的DOM结构都创建出来。 这里补充一句,高德地图在2.…...

避免“文献综抄”,5种写作结构助你完成文献综述→
很多作者可能有过这样的体验:读了很多文献,但在写综述的时候总感觉不像是在写文献综述,更像在写文献总结 如果引用方面不注意,甚至会成为文献综抄。 那么,你可以参考下我们整理的以下资料哦~ 01 文献总结和文献综述的…...
Java异常和反射
JAVA 异常分类及处理 概念 } final Entry<K,V> getEntryUsingComparator(Object key) { K k (K) key; // 获取该 TreeMap 的 comparator Comparator<? super K> cpr comparator; if (cpr ! null) { // 从根节点开始 Entry<K,V> p …...
Accesss数据库的那点事
Accesss数据库的那点事 1.Access的简介 Access(全称为Microsoft Access)是一个关系型数据库管理系统(RDBMS)。它是由微软公司开发的数据库软件,用于创建、管理和操作数据库应用程序。 Access提供了一个可视化的开发环…...

网络基础学习:osi网络七层模型
osi网络七层模型 什么是OSI,什么是ISO?为什么ISO要提出OSI网络七层模型?OSI七层的划分以及具体内容第七层 应用层第六层 表示层第五层 会话层第四层 传输层第三层 网络层第二层 数据链路层第一层 物理层 每一层与设备的对应关系 什么是OSI,什…...

EndNote X9 引用参考 单击文献编号,不能跳转到文尾文献列表处,咋解决?文献编号 不能跳转 ,怎么办?
文章目录 1 正常情况下 引用文献编号 是可以跳转的2 问题分析3 解决方法4 EndNote X9 插入参考文献常见问题总结5 EndNote X9 快速上手教程(毕业论文参考文献管理器) 1 正常情况下 引用文献编号 是可以跳转的 正确的插入文献后, 正常情况下&a…...

用免费蜜罐工具配置Modbus工控蜜罐
导语:本文将用DecoyMini免费蜜罐工具来配置自定义的ModbusTCP工控仿真模板,并介绍部署后的Modbus蜜罐的使用效果。 DecoyMini是一个免费的蜜罐工具,其特色是仿真能力采用与软件松耦合的仿真模板来进行管理。通过一键式导入云端仿真模板库里的…...

日语AI面试高效通关秘籍:专业解读与青柚面试智能助攻
在如今就业市场竞争日益激烈的背景下,越来越多的求职者将目光投向了日本及中日双语岗位。但是,一场日语面试往往让许多人感到步履维艰。你是否也曾因为面试官抛出的“刁钻问题”而心生畏惧?面对生疏的日语交流环境,即便提前恶补了…...
Cesium1.95中高性能加载1500个点
一、基本方式: 图标使用.png比.svg性能要好 <template><div id"cesiumContainer"></div><div class"toolbar"><button id"resetButton">重新生成点</button><span id"countDisplay&qu…...

转转集团旗下首家二手多品类循环仓店“超级转转”开业
6月9日,国内领先的循环经济企业转转集团旗下首家二手多品类循环仓店“超级转转”正式开业。 转转集团创始人兼CEO黄炜、转转循环时尚发起人朱珠、转转集团COO兼红布林CEO胡伟琨、王府井集团副总裁祝捷等出席了开业剪彩仪式。 据「TMT星球」了解,“超级…...
Qt Http Server模块功能及架构
Qt Http Server 是 Qt 6.0 中引入的一个新模块,它提供了一个轻量级的 HTTP 服务器实现,主要用于构建基于 HTTP 的应用程序和服务。 功能介绍: 主要功能 HTTP服务器功能: 支持 HTTP/1.1 协议 简单的请求/响应处理模型 支持 GET…...
Nginx server_name 配置说明
Nginx 是一个高性能的反向代理和负载均衡服务器,其核心配置之一是 server 块中的 server_name 指令。server_name 决定了 Nginx 如何根据客户端请求的 Host 头匹配对应的虚拟主机(Virtual Host)。 1. 简介 Nginx 使用 server_name 指令来确定…...
【android bluetooth 框架分析 04】【bt-framework 层详解 1】【BluetoothProperties介绍】
1. BluetoothProperties介绍 libsysprop/srcs/android/sysprop/BluetoothProperties.sysprop BluetoothProperties.sysprop 是 Android AOSP 中的一种 系统属性定义文件(System Property Definition File),用于声明和管理 Bluetooth 模块相…...

新能源汽车智慧充电桩管理方案:新能源充电桩散热问题及消防安全监管方案
随着新能源汽车的快速普及,充电桩作为核心配套设施,其安全性与可靠性备受关注。然而,在高温、高负荷运行环境下,充电桩的散热问题与消防安全隐患日益凸显,成为制约行业发展的关键瓶颈。 如何通过智慧化管理手段优化散…...

NLP学习路线图(二十三):长短期记忆网络(LSTM)
在自然语言处理(NLP)领域,我们时刻面临着处理序列数据的核心挑战。无论是理解句子的结构、分析文本的情感,还是实现语言的翻译,都需要模型能够捕捉词语之间依时序产生的复杂依赖关系。传统的神经网络结构在处理这种序列依赖时显得力不从心,而循环神经网络(RNN) 曾被视为…...

成都鼎讯硬核科技!雷达目标与干扰模拟器,以卓越性能制胜电磁频谱战
在现代战争中,电磁频谱已成为继陆、海、空、天之后的 “第五维战场”,雷达作为电磁频谱领域的关键装备,其干扰与抗干扰能力的较量,直接影响着战争的胜负走向。由成都鼎讯科技匠心打造的雷达目标与干扰模拟器,凭借数字射…...
今日学习:Spring线程池|并发修改异常|链路丢失|登录续期|VIP过期策略|数值类缓存
文章目录 优雅版线程池ThreadPoolTaskExecutor和ThreadPoolTaskExecutor的装饰器并发修改异常并发修改异常简介实现机制设计原因及意义 使用线程池造成的链路丢失问题线程池导致的链路丢失问题发生原因 常见解决方法更好的解决方法设计精妙之处 登录续期登录续期常见实现方式特…...