AI革命新篇章:法国天才团队挑战ChatGPT霸主地位
Mistral AI: Guillaume Lample, Arthur Mensch et Timothée Lacroix.
ChatGPT 的霸主地位已被三位来自法国的天才所颠覆!如上图这三个人,其中一位曾在 DeepMind 工作,另外两位来自 Meta,他们联手为 AI 领域带来了革命性的变革
我们可以想象一下,一家仅成立 8 个月的公司,如今已经在这短暂的时间里震撼了整个 AI 行业。
他们推出了新型 AI 模型,不仅与 ChatGPT 一较高下,甚至超越了市场上所有的竞争对手,让公司的估值接近了20亿美元。
更难能可贵的是,他们没有借助任何夸大其词的宣传片或大规模市场活动就取得了这样的成就。
现在,让我们来详细了解这些法国创新者是如何改变现状的,以及我们如何能从他们的突破中获益。
首先,我们不妨先来看一张与 ChatGPT 竞争的顶尖 AI 模型比较表。
LMSys Leaderboard
这张表透露了一些挺有意思的信息。
比如说,ChatGPT 在不同版本间似乎有所退步。
还有一些分数排列得似乎有些不协调,让人感到困惑。
但最引人注目的要数那些被标上“Mixtral”等名字的小黄线——这些名字让人联想到风。
乍一看,这些模型的排名并不显眼,甚至有些偏低。
然而,这样的初步印象却忽视了它们背后所蕴含的革命性影响力。
要知道,评估一个语言模型 (LLM) 的性能有很多方法,并非只有一条路可走。
基准测试,即向 LLM 提出一系列问题来测试其能力,是其中一种方法。
比如,考虑一个哲学问题,需要用到恰当的词汇来替换。
问题在于,尽管模型理论上能在这些基准测试中取得高分,但在实际应用中,它们的表现可能并不如预期。
这种情况并不罕见,就像 Google 的 Gemini 模型,它们在 MMLU 基准测试中得分很高,但在实际使用中,效果却不如 ChatGPT-4,这可能是因为训练过程中数据集的泄露。
尽管基准测试能提供一定的指导作用,但在实际应用场景中,人类的直觉仍然是评估模型效果最可靠的标准。
大语言模型排名更新:2024年1月27日
从最近一周前大模型排行榜来看,Google Gemini Pro 现在在大语言模型排名中位居第二。Mistral 发布了 Medium 版本,在性能上超越了 Mixtral 8x7b。
那么,我们如何对这些 AI 模型进行排名呢?
一种常见的方法是采用类似于国际象棋 ELO 评分系统的评分机制。这涉及到对不同模型的回答进行比较,并根据表现给予相应的分数。
这就引出了前文提到的排名表,这是一种广为人知的模型评级方式。
在这份榜单中,你可以看到AI模型界的佼佼者,包括位于榜首的专有模型 GPT-4,紧随其后的是 Anthropic 的 Claude(该公司由前OpenAI成员创立),以及各种版本的 GPT-3.5。
再往下看,我们发现了Google最近推出的Gemini Pro。这些都属于专有的AI模型。
但我们真正感兴趣的是开源模型。
这些模型通常规模较小,计算需求也更低,我们可以免费下载到本地使用,还可以用我们自己的数据进行再训练。
直到不久前,唯一能与ChatGPT及其衍生模型相媲美的唯一真正竞争对手是 LIAMA 2,它是 Facebook 模型经过精细调校后的一个优化版本。
然而,两个月前,排名图表上出现了代表 Mistral 等模型的小黄线。
Mistral 的推出方式颇为独特。当时还鲜为人知的 Mistral 账户发布了一条推文,里面只有一个磁力链接(一种通过网络分享文件的方式),没有提供任何背景信息或宣传资料。
点击链接之后,就会出现一个有70亿参数的模型。
在这里,理解模型的参数规模至关重要——就像拳击中的体重级别,参数数量(在这个例子中是数十亿)代表了模型的规模。更大的模型需要更多的计算资源和更高级的硬件支持。
例如,GPT-3 和 GPT-4 这样的大型模型可能拥有超过 1000 亿个参数,需要庞大的服务器基础设施来运行。
相比之下,像 LIAMA 2 这样的小型模型提供了不同规模的版本,最大版本拥有 700 亿参数,尽管如此,运行它仍然需要相当强大的硬件。
Mistral 推出的 70 亿参数模型的出现,改变了游戏规则。
起初,大家会因其规模较小而持怀疑态度,但很快发现这个模型的表现异常出色。尽管参数数量相对较少,但它在排行榜上跻身前十名,甚至挑战了那些拥有 700 亿参数的顶尖模型。Mistral 的最新版本,Sterling LM 7b Alpha,不仅超越了 GPT-3.5 的各种变体,甚至超越了 LIAMA 2 的 700 亿参数版本。
参数数量适中的Mistral,排名前十,挑战即使是最好的70-billion-parameter模型。
这一进展激发了社区的热烈反响,大家纷纷下载、实验并改进这个模型。
Mistral 的小巧体积也意味着它可能没有那么庞大的互联网知识库,这可能会让它更容易“产生幻觉”或“捏造”信息。
不过,它的小巧体积也使得它能够在 Mac 和一些 iPhone 设备上本地运行,极大地提升了可用性。
就在半个多月前,又一场革命性的变革诞生了:Mixtral 8x7b 的推出。
这个模型采用了“专家混合”技术,即模型的不同部分专注于不同的领域(比如数学、编程、文学)。
这种架构与 GPT-4 类似,它允许模型在不需要相应的计算能力的情况下,也能享受到一个 8 x 7 模型的优势。
简而言之,你可以用一个 140 亿参数模型的计算成本,享受到一个 560 亿参数模型的优势。
Mixtral 8x7b 的表现非常出色——它就像是轻量级选手在重量级比赛中大放异彩!
最近,Mistral 还推出了Mistral Medium,可以通过他们的云平台使用。
通过初步对比 Mistral Medium 和 GPT-4 显示,尽管 GPT-4 可能因为追求“安全”和“政治正确”而受到限制,影响了其性能,但 Mistral Medium 却能提供更精确、更实用的回答。
Mistral 的创新正在重塑 AI 领域的格局
Mistral 成功开发出了更小巧、更高效的模型,能够与 GPT-4 这样的行业巨头一较高下,这为 AI 的普及化铺平了道路,为开发者和企业开辟了新的可能性。
这家公司值得密切关注,尤其是随着他们在 AI 领域的不断突破。
总结
随着 Mistral 的创新不断涌现,我们看到了 AI 领域的新篇章正在被书写。这些小巧而高效的模型,不仅在性能上挑战了行业巨头,更是在可访问性和实用性上迈出了重要一步。Mistral 的 Medium 版本和 Mixtral 8x7b 的推出,不仅展示了 AI 的新高度,也为开发者和企业提供了前所未有的机遇。在这个快速变化的时代,Mistral 的故事提醒我们,创新的力量是无穷的,而 AI 的未来,正等待着我们去探索和定义。让我们拭目以待,看 Mistral 如何继续在 AI 的舞台上,引领风潮,我们期待更多类似Mistral的企业能够通过创新推动整个行业前行,为人类社会带来更多价值。
相关文章:

AI革命新篇章:法国天才团队挑战ChatGPT霸主地位
Mistral AI: Guillaume Lample, Arthur Mensch et Timothe Lacroix. ChatGPT 的霸主地位已被三位来自法国的天才所颠覆!如上图这三个人,其中一位曾在 DeepMind 工作,另外两位来自 Meta,他们联手为 AI 领域带来了革命性的变革 我…...

数据双向绑定v-modal
v-model v-model就实现了双向数据绑定,实际上它就是通过Vue提供的事件机制。即在子组件通过$emit()触发一个事件,在父组件使用v-on来监听对应的事件并修改相应的数据。 input的v-model就是通过<input :value"value" input"input"…...

Docker 容器jar 运行报错 at sun.awt.FontConfiguration.getVersion 解决方法
docker jar 运行报错 at sun.awt.FontConfiguration.getVersion 初步判断是在运行 Docker 容器中的 JAR 文件时遇到了与字体配置相关的问题。这个问题可能是由于容器内缺少字体配置或字体文件而引起的。 要解决这个问题,你可以尝试以下方法: 1.安装字…...

光学3D表面轮廓仪服务超精密抛光技术发展
随着技术的不断进步,精密制造领域对材料表面的处理要求越来越高,超精密抛光技术作为当下表面处理的尖端技术,对各种高精密产品的生产起到了至关重要的作用,已广泛应用于集成电路制造、医疗器械、航空航天、3C电子、汽车、精密模具…...

详解C++中auto关键字
auto关键字 auto关键字(C11)类型别名思考auto简介auto的使用细则auto与指针和引用结合起来使用在同一行定义多个变量 auto不能推导的场景1.auto不能作为函数的参数2.auto不能直接用来声明数组 auto关键字(C11) 类型别名思考 随着程序越来越复杂,程序中用到的类型也…...

24.云原生ArgoCD高级之数据加密seale sealed
云原生专栏大纲 文章目录 数据加密之seale sealedBitnami Sealed Secrets介绍Bitnami Sealed Secrets工作流程安装sealed-secrets和kubeseal安装sealed-secrets-controller安装kubeseal通过kubeseal将sealed-secrets公钥拿出来通过kubeseal加密secrets替换kustomize下secret为…...

线性代数:线性方程组
目录 一、线性方程组概念 二、消元法求线性方程组 三、系数阵的秩与线性方程组的解 无解 唯一解 无数解 相关定理 一、线性方程组概念 二、消元法求线性方程组 三、系数阵的秩与线性方程组的解 无解 唯一解 无数解 相关定理...

标准的排序组合-算法
题目 有若干个字母,要求计算出长度为4的所有可能得组合 解题 排序组合最适用的就是回溯了,建议大家本地debug一层一层的看能好理解点 private static void getResult(List<String> source, Stack<String> temp, int curLength, int maxL…...

2402C++,C++递归取各种节点名字
参考 explicit FindNamedClassVisitor(ASTContext *Context) : Context(Context) {}元<类 T>极 动作(T&e){串 ae->getQualifiedNameAsString();d.加(a);中 真;} bool VisitCXXRecordDecl(CXXRecordDecl *e) {中 动作(e);} bool VisitFunctionDecl(FunctionDecl*e…...

Qt 5.9.4 转 Qt 6.6.1 遇到的问题总结(三)
1.QSet: toList 中的toList 函数已不存在,遇到xx->toList改成直接用,如下: 2.开源QWT 图形库中QwtDial中的 setPenWidth 变成 setPenWidthF函数。 3.QDateTime 中无setTime_t 改为了setSecsSinceEpoch函数。 4.QRegExp 类已不存在 可以用Q…...

Logstash 7.7.1版本安装系统梳理
前言 上一篇文章介绍了 《ElasticSearch7.7.1集群搭建 & Kibana安装》,今天说一下 Logstash的安卓和配置; Logstash是一个开源的数据收集引擎,具有实时管道功能。它可以动态地将来自不同数据源的数据统一起来,并将数据标准化…...

4. sass实用函数归纳
4. sass实用函数归纳 字符串函数 1、quote(string) 给字符串添加引号 quote(xiaoming) // "xiaoming"2、unquote(string) 移除字符串的引号 unquote("xiaoming") // xiaoming3、str-index(string, substring) 返回 substring 子字符串第一次在 stri…...

《元梦之星》赛季更新带来“新”内容,为何却被玩家集体声讨?
前段时间,《元梦之星》迎来了“山海奇遇”赛季的重磅更新,诸多“新”内容的上线吸引了很多玩家们的关注,然而在新版本开启之后没有多,新玩法新时装甚至是游戏中的新改动都引起了不少玩家的不满。 在新赛季开启之后,玩家…...

故障诊断 | 一文解决,CNN-SVM卷积神经网络-支持向量机组合模型的故障诊断(Matlab)
效果一览 文章概述 故障诊断 | 一文解决,CNN-SVM卷积神经网络-支持向量机组合模型的故障诊断(Matlab) 模型描述 卷积神经网络(Convolutional Neural Network,CNN)和支持向量机(Support Vector Machine,SVM)是两种常用的机器学习算法,它们在不同领域和任务中都表现出…...

菜鸡后端的前端学习记录-2
前言 记录一下看视频学习前端的的一些笔记,以前对Html、Js、CSS有一定的基础(都认得,没用过),现在不想从头再来了,学学Vue框架,不定时更新,指不定什么时候就鸽了。。。。 忘了记一下…...

Layui + Echarts 5.0
Layui 怎么整合最新版本的 Echarts 5.0,Echarts 4 升级到 5后,有了很大改变,新的配置项4是无法兼容的,所以想要使用新的功能,都需要升级! 新建一个echarts.js文件 layui.define(function (exports) {// 这…...

linux使用iptables禁用ip
iptables是什么? iptables 是一个强大的开源软件,它是 Linux 系统内核中 netfilter 包过滤框架的一部分,用来实现防火墙功能。iptables 提供了一种灵活的方式来控制和管理进出以及通过 Linux 计算机的网络流量。 前提 我在云服务器上用doc…...

安全防御第五次作业
拓扑图及要求如下: 实验注意点: 先配置双机热备,再来配置安全策略和NAT两台双机热备的防火墙的接口号必须一致双机热备时,请确保vrrp配置的虚拟IP与下面的ip在同一网段如果其中一台防火墙有过配置,最好清空或重启&…...

分库分表原则
分库分表原则 单表数据到达千万级别或者20存储空间 优化已经解决不了问题一 IO瓶颈导致性能问题 拆分策略 垂直分库 以表为依据,根据业务将不同的表拆分到不同库中,有点像微服务 垂直分表 以字段为依据,根据字段属性将不同字段拆分到不同…...

VUE PC端可拖动悬浮按钮
一、实现效果: 二、FloatButton.vue <template><div><div class"sssss"><div class"callback float" mousedown"down" touchstart"down" mousemove"move" touchmove"move" mous…...

opencv0014 索贝尔(sobel)算子
前面学习的滤波器主要是用来模糊图像,今天一起来了解关于边缘识别的滤波吧!嘿嘿 边缘 边缘是像素值发生跃迁的位置,是图像的显著特征之一,在图像特征提取,对象检测,模式识别等方面都有重要的作用。 人眼如…...

Redis简介和数据类型
简介 Redis是完全开源(BSD许可)的内存数据结构存储,是一个高性能的 key-value 数据库,用作数据库、缓存、消息代理和流式处理引擎。 Redis 提供数据结构,例如字符串、哈希、列表、集、带有范围查询的排序集、位图、超…...

Day06-Linux下目录命令讲解及重要文件讲解
Day06-Linux下目录命令讲解及重要文件讲解 1. Linux目录文件1.1 Linux系统目录结构介绍1.1.1 Linux与Windows目录结构对比 1.2 重要的Linux配置文件介绍1.2.1 /etc系统初始化及设置相关重要文件1.2.2 /usr目录的重要知识介绍------应用程序目录1.2.3 /var目录下的路径知识-----…...

睿尔曼超轻量仿人机械臂—外置按钮盒使用说明
睿尔曼RM系列机械臂的控制方式有很多种,包括:示教器、JSON、API等。在此为大家介绍外置按钮盒的使用方法。 按钮盒接线安装 按钮盒外观如下图所示,有:急停、暂停、开始、继续。四个功能按钮。用户可通过这四个按钮来实现对机械臂运…...

PYTHON蓝桥杯——每日一练(简单题)
题目 求123...n的值。 输入格式 输入包括一个整数n。 输出格式 输出一行,包括一个整数,表示123...n的值。 提示 说明:请注意这里的数据规模。 本题直接的想法是直接使用一个循环来累加,然而,当数据规模很大时&…...

【数据结构 01】栈
一、原理 栈通常从数据结构和内存空间两个角度解释,从数据结构的角度,栈是一种线性结构表,只允许在固定的一端进行插入和删除元素,从内存空间角度,操作系统为函数和变量分配的内存空间通常在栈区,但是无论…...

⑩电子产品拆解分析-家用无线遥控开关433Mhz
⑩电子产品拆解分析-家用无线遥控开关433Mhz 一、功能介绍二、电路分析以及器件作用1、433发射控制端2、433接收应答端三、Get到的点一、功能介绍 ①免布线随意贴,装上就能使用解决单线开关烦恼;②遥控配对简单,无线通讯距离长,信号可穿墙;二、电路分析以及器件作用 1、43…...

java之手动创建spring-boot-3项目
手动创建 基于springboot3 正确配置maven的前提下,创建一个空的项目 复制下面的pom文件,使用maven下载依赖即可 前提是maven配置的没问题 pom.xml文件 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"htt…...

Linux--redhat9创建软件仓库
1.插入光盘,挂载镜像 模拟插入光盘: 点击:虚拟机-可移动设备-CD/DVD 设备状态全选,使用ISO影响文件选择当前版本镜像,点击确认。 2.输入: df -h 可以显示,默认/dev/sr0文件为光盘文件,挂载点为/run/media/root/镜像…...

[力扣 Hot100]Day20 旋转图像
题目描述 给定一个 n n 的二维矩阵 matrix 表示一个图像。请你将图像顺时针旋转 90 度。 你必须在原地旋转图像,这意味着你需要直接修改输入的二维矩阵。请不要 使用另一个矩阵来旋转图像。 出处 思路 旋转时每四个位置为一组进行swap操作,找好对…...