当前位置: 首页 > news >正文

AI革命新篇章:法国天才团队挑战ChatGPT霸主地位

Mistral AI: Guillaume Lample, Arthur Mensch et Timothée Lacroix.

ChatGPT 的霸主地位已被三位来自法国的天才所颠覆!如上图这三个人,其中一位曾在 DeepMind 工作,另外两位来自 Meta,他们联手为 AI 领域带来了革命性的变革

我们可以想象一下,一家仅成立 8 个月的公司,如今已经在这短暂的时间里震撼了整个 AI 行业。

他们推出了新型 AI 模型,不仅与 ChatGPT 一较高下,甚至超越了市场上所有的竞争对手,让公司的估值接近了20亿美元。

更难能可贵的是,他们没有借助任何夸大其词的宣传片或大规模市场活动就取得了这样的成就。

现在,让我们来详细了解这些法国创新者是如何改变现状的,以及我们如何能从他们的突破中获益。

首先,我们不妨先来看一张与 ChatGPT 竞争的顶尖 AI 模型比较表。

LMSys Leaderboard

这张表透露了一些挺有意思的信息。

比如说,ChatGPT 在不同版本间似乎有所退步。

还有一些分数排列得似乎有些不协调,让人感到困惑。

但最引人注目的要数那些被标上“Mixtral”等名字的小黄线——这些名字让人联想到风。

乍一看,这些模型的排名并不显眼,甚至有些偏低。

然而,这样的初步印象却忽视了它们背后所蕴含的革命性影响力。

要知道,评估一个语言模型 (LLM) 的性能有很多方法,并非只有一条路可走。

基准测试,即向 LLM 提出一系列问题来测试其能力,是其中一种方法。

比如,考虑一个哲学问题,需要用到恰当的词汇来替换。

问题在于,尽管模型理论上能在这些基准测试中取得高分,但在实际应用中,它们的表现可能并不如预期。

这种情况并不罕见,就像 Google 的 Gemini 模型,它们在 MMLU 基准测试中得分很高,但在实际使用中,效果却不如 ChatGPT-4,这可能是因为训练过程中数据集的泄露。

尽管基准测试能提供一定的指导作用,但在实际应用场景中,人类的直觉仍然是评估模型效果最可靠的标准。

大语言模型排名更新:2024年1月27日

从最近一周前大模型排行榜来看,Google Gemini Pro 现在在大语言模型排名中位居第二。Mistral 发布了 Medium 版本,在性能上超越了 Mixtral 8x7b。

那么,我们如何对这些 AI 模型进行排名呢?

一种常见的方法是采用类似于国际象棋 ELO 评分系统的评分机制。这涉及到对不同模型的回答进行比较,并根据表现给予相应的分数。

这就引出了前文提到的排名表,这是一种广为人知的模型评级方式。

在这份榜单中,你可以看到AI模型界的佼佼者,包括位于榜首的专有模型 GPT-4,紧随其后的是 Anthropic 的 Claude(该公司由前OpenAI成员创立),以及各种版本的 GPT-3.5。

再往下看,我们发现了Google最近推出的Gemini Pro。这些都属于专有的AI模型。

但我们真正感兴趣的是开源模型。

这些模型通常规模较小,计算需求也更低,我们可以免费下载到本地使用,还可以用我们自己的数据进行再训练。

直到不久前,唯一能与ChatGPT及其衍生模型相媲美的唯一真正竞争对手是 LIAMA 2,它是 Facebook 模型经过精细调校后的一个优化版本。

然而,两个月前,排名图表上出现了代表 Mistral 等模型的小黄线。

Mistral 的推出方式颇为独特。当时还鲜为人知的 Mistral 账户发布了一条推文,里面只有一个磁力链接(一种通过网络分享文件的方式),没有提供任何背景信息或宣传资料。

点击链接之后,就会出现一个有70亿参数的模型。

在这里,理解模型的参数规模至关重要——就像拳击中的体重级别,参数数量(在这个例子中是数十亿)代表了模型的规模。更大的模型需要更多的计算资源和更高级的硬件支持。

例如,GPT-3 和 GPT-4 这样的大型模型可能拥有超过 1000 亿个参数,需要庞大的服务器基础设施来运行。

相比之下,像 LIAMA 2 这样的小型模型提供了不同规模的版本,最大版本拥有 700 亿参数,尽管如此,运行它仍然需要相当强大的硬件。

Mistral 推出的 70 亿参数模型的出现,改变了游戏规则。

起初,大家会因其规模较小而持怀疑态度,但很快发现这个模型的表现异常出色。尽管参数数量相对较少,但它在排行榜上跻身前十名,甚至挑战了那些拥有 700 亿参数的顶尖模型。Mistral 的最新版本,Sterling LM 7b Alpha,不仅超越了 GPT-3.5 的各种变体,甚至超越了 LIAMA 2 的 700 亿参数版本。

参数数量适中的Mistral,排名前十,挑战即使是最好的70-billion-parameter模型。

这一进展激发了社区的热烈反响,大家纷纷下载、实验并改进这个模型。

Mistral 的小巧体积也意味着它可能没有那么庞大的互联网知识库,这可能会让它更容易“产生幻觉”或“捏造”信息。

不过,它的小巧体积也使得它能够在 Mac 和一些 iPhone 设备上本地运行,极大地提升了可用性。

就在半个多月前,又一场革命性的变革诞生了:Mixtral 8x7b 的推出。

这个模型采用了“专家混合”技术,即模型的不同部分专注于不同的领域(比如数学、编程、文学)。

这种架构与 GPT-4 类似,它允许模型在不需要相应的计算能力的情况下,也能享受到一个 8 x 7 模型的优势。

简而言之,你可以用一个 140 亿参数模型的计算成本,享受到一个 560 亿参数模型的优势。

Mixtral 8x7b 的表现非常出色——它就像是轻量级选手在重量级比赛中大放异彩!

最近,Mistral 还推出了Mistral Medium,可以通过他们的云平台使用。

通过初步对比 Mistral Medium 和 GPT-4 显示,尽管 GPT-4 可能因为追求“安全”和“政治正确”而受到限制,影响了其性能,但 Mistral Medium 却能提供更精确、更实用的回答。

Mistral 的创新正在重塑 AI 领域的格局

Mistral 成功开发出了更小巧、更高效的模型,能够与 GPT-4 这样的行业巨头一较高下,这为 AI 的普及化铺平了道路,为开发者和企业开辟了新的可能性。

这家公司值得密切关注,尤其是随着他们在 AI 领域的不断突破。

总结

随着 Mistral 的创新不断涌现,我们看到了 AI 领域的新篇章正在被书写。这些小巧而高效的模型,不仅在性能上挑战了行业巨头,更是在可访问性和实用性上迈出了重要一步。Mistral 的 Medium 版本和 Mixtral 8x7b 的推出,不仅展示了 AI 的新高度,也为开发者和企业提供了前所未有的机遇。在这个快速变化的时代,Mistral 的故事提醒我们,创新的力量是无穷的,而 AI 的未来,正等待着我们去探索和定义。让我们拭目以待,看 Mistral 如何继续在 AI 的舞台上,引领风潮,我们期待更多类似Mistral的企业能够通过创新推动整个行业前行,为人类社会带来更多价值。

相关文章:

AI革命新篇章:法国天才团队挑战ChatGPT霸主地位

Mistral AI: Guillaume Lample, Arthur Mensch et Timothe Lacroix. ChatGPT 的霸主地位已被三位来自法国的天才所颠覆!如上图这三个人,其中一位曾在 DeepMind 工作,另外两位来自 Meta,他们联手为 AI 领域带来了革命性的变革 我…...

数据双向绑定v-modal

v-model v-model就实现了双向数据绑定&#xff0c;实际上它就是通过Vue提供的事件机制。即在子组件通过$emit()触发一个事件&#xff0c;在父组件使用v-on来监听对应的事件并修改相应的数据。 input的v-model就是通过<input :value"value" input"input"…...

Docker 容器jar 运行报错 at sun.awt.FontConfiguration.getVersion 解决方法

docker jar 运行报错 at sun.awt.FontConfiguration.getVersion 初步判断是在运行 Docker 容器中的 JAR 文件时遇到了与字体配置相关的问题。这个问题可能是由于容器内缺少字体配置或字体文件而引起的。 要解决这个问题&#xff0c;你可以尝试以下方法&#xff1a; 1.安装字…...

光学3D表面轮廓仪服务超精密抛光技术发展

随着技术的不断进步&#xff0c;精密制造领域对材料表面的处理要求越来越高&#xff0c;超精密抛光技术作为当下表面处理的尖端技术&#xff0c;对各种高精密产品的生产起到了至关重要的作用&#xff0c;已广泛应用于集成电路制造、医疗器械、航空航天、3C电子、汽车、精密模具…...

详解C++中auto关键字

auto关键字 auto关键字(C11)类型别名思考auto简介auto的使用细则auto与指针和引用结合起来使用在同一行定义多个变量 auto不能推导的场景1.auto不能作为函数的参数2.auto不能直接用来声明数组 auto关键字(C11) 类型别名思考 随着程序越来越复杂&#xff0c;程序中用到的类型也…...

24.云原生ArgoCD高级之数据加密seale sealed

云原生专栏大纲 文章目录 数据加密之seale sealedBitnami Sealed Secrets介绍Bitnami Sealed Secrets工作流程安装sealed-secrets和kubeseal安装sealed-secrets-controller安装kubeseal通过kubeseal将sealed-secrets公钥拿出来通过kubeseal加密secrets替换kustomize下secret为…...

线性代数:线性方程组

目录 一、线性方程组概念 二、消元法求线性方程组 三、系数阵的秩与线性方程组的解 无解 唯一解 无数解 相关定理 一、线性方程组概念 二、消元法求线性方程组 三、系数阵的秩与线性方程组的解 无解 唯一解 无数解 相关定理...

标准的排序组合-算法

题目 有若干个字母&#xff0c;要求计算出长度为4的所有可能得组合 解题 排序组合最适用的就是回溯了&#xff0c;建议大家本地debug一层一层的看能好理解点 private static void getResult(List<String> source, Stack<String> temp, int curLength, int maxL…...

2402C++,C++递归取各种节点名字

参考 explicit FindNamedClassVisitor(ASTContext *Context) : Context(Context) {}元<类 T>极 动作(T&e){串 ae->getQualifiedNameAsString();d.加(a);中 真;} bool VisitCXXRecordDecl(CXXRecordDecl *e) {中 动作(e);} bool VisitFunctionDecl(FunctionDecl*e…...

Qt 5.9.4 转 Qt 6.6.1 遇到的问题总结(三)

1.QSet: toList 中的toList 函数已不存在&#xff0c;遇到xx->toList改成直接用&#xff0c;如下&#xff1a; 2.开源QWT 图形库中QwtDial中的 setPenWidth 变成 setPenWidthF函数。 3.QDateTime 中无setTime_t 改为了setSecsSinceEpoch函数。 4.QRegExp 类已不存在 可以用Q…...

Logstash 7.7.1版本安装系统梳理

前言 上一篇文章介绍了 《ElasticSearch7.7.1集群搭建 & Kibana安装》&#xff0c;今天说一下 Logstash的安卓和配置&#xff1b; Logstash是一个开源的数据收集引擎&#xff0c;具有实时管道功能。它可以动态地将来自不同数据源的数据统一起来&#xff0c;并将数据标准化…...

4. sass实用函数归纳

4. sass实用函数归纳 字符串函数 1、quote(string) 给字符串添加引号 quote(xiaoming) // "xiaoming"2、unquote(string) 移除字符串的引号 unquote("xiaoming") // xiaoming3、str-index(string, substring) 返回 substring 子字符串第一次在 stri…...

《元梦之星》赛季更新带来“新”内容,为何却被玩家集体声讨?

前段时间&#xff0c;《元梦之星》迎来了“山海奇遇”赛季的重磅更新&#xff0c;诸多“新”内容的上线吸引了很多玩家们的关注&#xff0c;然而在新版本开启之后没有多&#xff0c;新玩法新时装甚至是游戏中的新改动都引起了不少玩家的不满。 在新赛季开启之后&#xff0c;玩家…...

故障诊断 | 一文解决,CNN-SVM卷积神经网络-支持向量机组合模型的故障诊断(Matlab)

效果一览 文章概述 故障诊断 | 一文解决,CNN-SVM卷积神经网络-支持向量机组合模型的故障诊断(Matlab) 模型描述 卷积神经网络(Convolutional Neural Network,CNN)和支持向量机(Support Vector Machine,SVM)是两种常用的机器学习算法,它们在不同领域和任务中都表现出…...

菜鸡后端的前端学习记录-2

前言 记录一下看视频学习前端的的一些笔记&#xff0c;以前对Html、Js、CSS有一定的基础&#xff08;都认得&#xff0c;没用过&#xff09;&#xff0c;现在不想从头再来了&#xff0c;学学Vue框架&#xff0c;不定时更新&#xff0c;指不定什么时候就鸽了。。。。 忘了记一下…...

Layui + Echarts 5.0

Layui 怎么整合最新版本的 Echarts 5.0&#xff0c;Echarts 4 升级到 5后&#xff0c;有了很大改变&#xff0c;新的配置项4是无法兼容的&#xff0c;所以想要使用新的功能&#xff0c;都需要升级&#xff01; 新建一个echarts.js文件 layui.define(function (exports) {// 这…...

linux使用iptables禁用ip

iptables是什么&#xff1f; iptables 是一个强大的开源软件&#xff0c;它是 Linux 系统内核中 netfilter 包过滤框架的一部分&#xff0c;用来实现防火墙功能。iptables 提供了一种灵活的方式来控制和管理进出以及通过 Linux 计算机的网络流量。 前提 我在云服务器上用doc…...

安全防御第五次作业

拓扑图及要求如下&#xff1a; 实验注意点&#xff1a; 先配置双机热备&#xff0c;再来配置安全策略和NAT两台双机热备的防火墙的接口号必须一致双机热备时&#xff0c;请确保vrrp配置的虚拟IP与下面的ip在同一网段如果其中一台防火墙有过配置&#xff0c;最好清空或重启&…...

分库分表原则

分库分表原则 单表数据到达千万级别或者20存储空间 优化已经解决不了问题一 IO瓶颈导致性能问题 拆分策略 垂直分库 以表为依据&#xff0c;根据业务将不同的表拆分到不同库中&#xff0c;有点像微服务 垂直分表 以字段为依据&#xff0c;根据字段属性将不同字段拆分到不同…...

VUE PC端可拖动悬浮按钮

一、实现效果&#xff1a; 二、FloatButton.vue <template><div><div class"sssss"><div class"callback float" mousedown"down" touchstart"down" mousemove"move" touchmove"move" mous…...

Cursor实现用excel数据填充word模版的方法

cursor主页&#xff1a;https://www.cursor.com/ 任务目标&#xff1a;把excel格式的数据里的单元格&#xff0c;按照某一个固定模版填充到word中 文章目录 注意事项逐步生成程序1. 确定格式2. 调试程序 注意事项 直接给一个excel文件和最终呈现的word文件的示例&#xff0c;…...

java_网络服务相关_gateway_nacos_feign区别联系

1. spring-cloud-starter-gateway 作用&#xff1a;作为微服务架构的网关&#xff0c;统一入口&#xff0c;处理所有外部请求。 核心能力&#xff1a; 路由转发&#xff08;基于路径、服务名等&#xff09;过滤器&#xff08;鉴权、限流、日志、Header 处理&#xff09;支持负…...

从深圳崛起的“机器之眼”:赴港乐动机器人的万亿赛道赶考路

进入2025年以来&#xff0c;尽管围绕人形机器人、具身智能等机器人赛道的质疑声不断&#xff0c;但全球市场热度依然高涨&#xff0c;入局者持续增加。 以国内市场为例&#xff0c;天眼查专业版数据显示&#xff0c;截至5月底&#xff0c;我国现存在业、存续状态的机器人相关企…...

Java - Mysql数据类型对应

Mysql数据类型java数据类型备注整型INT/INTEGERint / java.lang.Integer–BIGINTlong/java.lang.Long–––浮点型FLOATfloat/java.lang.FloatDOUBLEdouble/java.lang.Double–DECIMAL/NUMERICjava.math.BigDecimal字符串型CHARjava.lang.String固定长度字符串VARCHARjava.lang…...

微服务商城-商品微服务

数据表 CREATE TABLE product (id bigint(20) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT 商品id,cateid smallint(6) UNSIGNED NOT NULL DEFAULT 0 COMMENT 类别Id,name varchar(100) NOT NULL DEFAULT COMMENT 商品名称,subtitle varchar(200) NOT NULL DEFAULT COMMENT 商…...

华为云Flexus+DeepSeek征文|DeepSeek-V3/R1 商用服务开通全流程与本地部署搭建

华为云FlexusDeepSeek征文&#xff5c;DeepSeek-V3/R1 商用服务开通全流程与本地部署搭建 前言 如今大模型其性能出色&#xff0c;华为云 ModelArts Studio_MaaS大模型即服务平台华为云内置了大模型&#xff0c;能助力我们轻松驾驭 DeepSeek-V3/R1&#xff0c;本文中将分享如何…...

PAN/FPN

import torch import torch.nn as nn import torch.nn.functional as F import mathclass LowResQueryHighResKVAttention(nn.Module):"""方案 1: 低分辨率特征 (Query) 查询高分辨率特征 (Key, Value).输出分辨率与低分辨率输入相同。"""def __…...

08. C#入门系列【类的基本概念】:开启编程世界的奇妙冒险

C#入门系列【类的基本概念】&#xff1a;开启编程世界的奇妙冒险 嘿&#xff0c;各位编程小白探险家&#xff01;欢迎来到 C# 的奇幻大陆&#xff01;今天咱们要深入探索这片大陆上至关重要的 “建筑”—— 类&#xff01;别害怕&#xff0c;跟着我&#xff0c;保准让你轻松搞…...

【网络安全】开源系统getshell漏洞挖掘

审计过程&#xff1a; 在入口文件admin/index.php中&#xff1a; 用户可以通过m,c,a等参数控制加载的文件和方法&#xff0c;在app/system/entrance.php中存在重点代码&#xff1a; 当M_TYPE system并且M_MODULE include时&#xff0c;会设置常量PATH_OWN_FILE为PATH_APP.M_T…...

学习一下用鸿蒙​​DevEco Studio HarmonyOS5实现百度地图

在鸿蒙&#xff08;HarmonyOS5&#xff09;中集成百度地图&#xff0c;可以通过以下步骤和技术方案实现。结合鸿蒙的分布式能力和百度地图的API&#xff0c;可以构建跨设备的定位、导航和地图展示功能。 ​​1. 鸿蒙环境准备​​ ​​开发工具​​&#xff1a;下载安装 ​​De…...