当前位置: 首页 > news >正文

AI革命新篇章:法国天才团队挑战ChatGPT霸主地位

Mistral AI: Guillaume Lample, Arthur Mensch et Timothée Lacroix.

ChatGPT 的霸主地位已被三位来自法国的天才所颠覆!如上图这三个人,其中一位曾在 DeepMind 工作,另外两位来自 Meta,他们联手为 AI 领域带来了革命性的变革

我们可以想象一下,一家仅成立 8 个月的公司,如今已经在这短暂的时间里震撼了整个 AI 行业。

他们推出了新型 AI 模型,不仅与 ChatGPT 一较高下,甚至超越了市场上所有的竞争对手,让公司的估值接近了20亿美元。

更难能可贵的是,他们没有借助任何夸大其词的宣传片或大规模市场活动就取得了这样的成就。

现在,让我们来详细了解这些法国创新者是如何改变现状的,以及我们如何能从他们的突破中获益。

首先,我们不妨先来看一张与 ChatGPT 竞争的顶尖 AI 模型比较表。

LMSys Leaderboard

这张表透露了一些挺有意思的信息。

比如说,ChatGPT 在不同版本间似乎有所退步。

还有一些分数排列得似乎有些不协调,让人感到困惑。

但最引人注目的要数那些被标上“Mixtral”等名字的小黄线——这些名字让人联想到风。

乍一看,这些模型的排名并不显眼,甚至有些偏低。

然而,这样的初步印象却忽视了它们背后所蕴含的革命性影响力。

要知道,评估一个语言模型 (LLM) 的性能有很多方法,并非只有一条路可走。

基准测试,即向 LLM 提出一系列问题来测试其能力,是其中一种方法。

比如,考虑一个哲学问题,需要用到恰当的词汇来替换。

问题在于,尽管模型理论上能在这些基准测试中取得高分,但在实际应用中,它们的表现可能并不如预期。

这种情况并不罕见,就像 Google 的 Gemini 模型,它们在 MMLU 基准测试中得分很高,但在实际使用中,效果却不如 ChatGPT-4,这可能是因为训练过程中数据集的泄露。

尽管基准测试能提供一定的指导作用,但在实际应用场景中,人类的直觉仍然是评估模型效果最可靠的标准。

大语言模型排名更新:2024年1月27日

从最近一周前大模型排行榜来看,Google Gemini Pro 现在在大语言模型排名中位居第二。Mistral 发布了 Medium 版本,在性能上超越了 Mixtral 8x7b。

那么,我们如何对这些 AI 模型进行排名呢?

一种常见的方法是采用类似于国际象棋 ELO 评分系统的评分机制。这涉及到对不同模型的回答进行比较,并根据表现给予相应的分数。

这就引出了前文提到的排名表,这是一种广为人知的模型评级方式。

在这份榜单中,你可以看到AI模型界的佼佼者,包括位于榜首的专有模型 GPT-4,紧随其后的是 Anthropic 的 Claude(该公司由前OpenAI成员创立),以及各种版本的 GPT-3.5。

再往下看,我们发现了Google最近推出的Gemini Pro。这些都属于专有的AI模型。

但我们真正感兴趣的是开源模型。

这些模型通常规模较小,计算需求也更低,我们可以免费下载到本地使用,还可以用我们自己的数据进行再训练。

直到不久前,唯一能与ChatGPT及其衍生模型相媲美的唯一真正竞争对手是 LIAMA 2,它是 Facebook 模型经过精细调校后的一个优化版本。

然而,两个月前,排名图表上出现了代表 Mistral 等模型的小黄线。

Mistral 的推出方式颇为独特。当时还鲜为人知的 Mistral 账户发布了一条推文,里面只有一个磁力链接(一种通过网络分享文件的方式),没有提供任何背景信息或宣传资料。

点击链接之后,就会出现一个有70亿参数的模型。

在这里,理解模型的参数规模至关重要——就像拳击中的体重级别,参数数量(在这个例子中是数十亿)代表了模型的规模。更大的模型需要更多的计算资源和更高级的硬件支持。

例如,GPT-3 和 GPT-4 这样的大型模型可能拥有超过 1000 亿个参数,需要庞大的服务器基础设施来运行。

相比之下,像 LIAMA 2 这样的小型模型提供了不同规模的版本,最大版本拥有 700 亿参数,尽管如此,运行它仍然需要相当强大的硬件。

Mistral 推出的 70 亿参数模型的出现,改变了游戏规则。

起初,大家会因其规模较小而持怀疑态度,但很快发现这个模型的表现异常出色。尽管参数数量相对较少,但它在排行榜上跻身前十名,甚至挑战了那些拥有 700 亿参数的顶尖模型。Mistral 的最新版本,Sterling LM 7b Alpha,不仅超越了 GPT-3.5 的各种变体,甚至超越了 LIAMA 2 的 700 亿参数版本。

参数数量适中的Mistral,排名前十,挑战即使是最好的70-billion-parameter模型。

这一进展激发了社区的热烈反响,大家纷纷下载、实验并改进这个模型。

Mistral 的小巧体积也意味着它可能没有那么庞大的互联网知识库,这可能会让它更容易“产生幻觉”或“捏造”信息。

不过,它的小巧体积也使得它能够在 Mac 和一些 iPhone 设备上本地运行,极大地提升了可用性。

就在半个多月前,又一场革命性的变革诞生了:Mixtral 8x7b 的推出。

这个模型采用了“专家混合”技术,即模型的不同部分专注于不同的领域(比如数学、编程、文学)。

这种架构与 GPT-4 类似,它允许模型在不需要相应的计算能力的情况下,也能享受到一个 8 x 7 模型的优势。

简而言之,你可以用一个 140 亿参数模型的计算成本,享受到一个 560 亿参数模型的优势。

Mixtral 8x7b 的表现非常出色——它就像是轻量级选手在重量级比赛中大放异彩!

最近,Mistral 还推出了Mistral Medium,可以通过他们的云平台使用。

通过初步对比 Mistral Medium 和 GPT-4 显示,尽管 GPT-4 可能因为追求“安全”和“政治正确”而受到限制,影响了其性能,但 Mistral Medium 却能提供更精确、更实用的回答。

Mistral 的创新正在重塑 AI 领域的格局

Mistral 成功开发出了更小巧、更高效的模型,能够与 GPT-4 这样的行业巨头一较高下,这为 AI 的普及化铺平了道路,为开发者和企业开辟了新的可能性。

这家公司值得密切关注,尤其是随着他们在 AI 领域的不断突破。

总结

随着 Mistral 的创新不断涌现,我们看到了 AI 领域的新篇章正在被书写。这些小巧而高效的模型,不仅在性能上挑战了行业巨头,更是在可访问性和实用性上迈出了重要一步。Mistral 的 Medium 版本和 Mixtral 8x7b 的推出,不仅展示了 AI 的新高度,也为开发者和企业提供了前所未有的机遇。在这个快速变化的时代,Mistral 的故事提醒我们,创新的力量是无穷的,而 AI 的未来,正等待着我们去探索和定义。让我们拭目以待,看 Mistral 如何继续在 AI 的舞台上,引领风潮,我们期待更多类似Mistral的企业能够通过创新推动整个行业前行,为人类社会带来更多价值。

相关文章:

AI革命新篇章:法国天才团队挑战ChatGPT霸主地位

Mistral AI: Guillaume Lample, Arthur Mensch et Timothe Lacroix. ChatGPT 的霸主地位已被三位来自法国的天才所颠覆!如上图这三个人,其中一位曾在 DeepMind 工作,另外两位来自 Meta,他们联手为 AI 领域带来了革命性的变革 我…...

数据双向绑定v-modal

v-model v-model就实现了双向数据绑定&#xff0c;实际上它就是通过Vue提供的事件机制。即在子组件通过$emit()触发一个事件&#xff0c;在父组件使用v-on来监听对应的事件并修改相应的数据。 input的v-model就是通过<input :value"value" input"input"…...

Docker 容器jar 运行报错 at sun.awt.FontConfiguration.getVersion 解决方法

docker jar 运行报错 at sun.awt.FontConfiguration.getVersion 初步判断是在运行 Docker 容器中的 JAR 文件时遇到了与字体配置相关的问题。这个问题可能是由于容器内缺少字体配置或字体文件而引起的。 要解决这个问题&#xff0c;你可以尝试以下方法&#xff1a; 1.安装字…...

光学3D表面轮廓仪服务超精密抛光技术发展

随着技术的不断进步&#xff0c;精密制造领域对材料表面的处理要求越来越高&#xff0c;超精密抛光技术作为当下表面处理的尖端技术&#xff0c;对各种高精密产品的生产起到了至关重要的作用&#xff0c;已广泛应用于集成电路制造、医疗器械、航空航天、3C电子、汽车、精密模具…...

详解C++中auto关键字

auto关键字 auto关键字(C11)类型别名思考auto简介auto的使用细则auto与指针和引用结合起来使用在同一行定义多个变量 auto不能推导的场景1.auto不能作为函数的参数2.auto不能直接用来声明数组 auto关键字(C11) 类型别名思考 随着程序越来越复杂&#xff0c;程序中用到的类型也…...

24.云原生ArgoCD高级之数据加密seale sealed

云原生专栏大纲 文章目录 数据加密之seale sealedBitnami Sealed Secrets介绍Bitnami Sealed Secrets工作流程安装sealed-secrets和kubeseal安装sealed-secrets-controller安装kubeseal通过kubeseal将sealed-secrets公钥拿出来通过kubeseal加密secrets替换kustomize下secret为…...

线性代数:线性方程组

目录 一、线性方程组概念 二、消元法求线性方程组 三、系数阵的秩与线性方程组的解 无解 唯一解 无数解 相关定理 一、线性方程组概念 二、消元法求线性方程组 三、系数阵的秩与线性方程组的解 无解 唯一解 无数解 相关定理...

标准的排序组合-算法

题目 有若干个字母&#xff0c;要求计算出长度为4的所有可能得组合 解题 排序组合最适用的就是回溯了&#xff0c;建议大家本地debug一层一层的看能好理解点 private static void getResult(List<String> source, Stack<String> temp, int curLength, int maxL…...

2402C++,C++递归取各种节点名字

参考 explicit FindNamedClassVisitor(ASTContext *Context) : Context(Context) {}元<类 T>极 动作(T&e){串 ae->getQualifiedNameAsString();d.加(a);中 真;} bool VisitCXXRecordDecl(CXXRecordDecl *e) {中 动作(e);} bool VisitFunctionDecl(FunctionDecl*e…...

Qt 5.9.4 转 Qt 6.6.1 遇到的问题总结(三)

1.QSet: toList 中的toList 函数已不存在&#xff0c;遇到xx->toList改成直接用&#xff0c;如下&#xff1a; 2.开源QWT 图形库中QwtDial中的 setPenWidth 变成 setPenWidthF函数。 3.QDateTime 中无setTime_t 改为了setSecsSinceEpoch函数。 4.QRegExp 类已不存在 可以用Q…...

Logstash 7.7.1版本安装系统梳理

前言 上一篇文章介绍了 《ElasticSearch7.7.1集群搭建 & Kibana安装》&#xff0c;今天说一下 Logstash的安卓和配置&#xff1b; Logstash是一个开源的数据收集引擎&#xff0c;具有实时管道功能。它可以动态地将来自不同数据源的数据统一起来&#xff0c;并将数据标准化…...

4. sass实用函数归纳

4. sass实用函数归纳 字符串函数 1、quote(string) 给字符串添加引号 quote(xiaoming) // "xiaoming"2、unquote(string) 移除字符串的引号 unquote("xiaoming") // xiaoming3、str-index(string, substring) 返回 substring 子字符串第一次在 stri…...

《元梦之星》赛季更新带来“新”内容,为何却被玩家集体声讨?

前段时间&#xff0c;《元梦之星》迎来了“山海奇遇”赛季的重磅更新&#xff0c;诸多“新”内容的上线吸引了很多玩家们的关注&#xff0c;然而在新版本开启之后没有多&#xff0c;新玩法新时装甚至是游戏中的新改动都引起了不少玩家的不满。 在新赛季开启之后&#xff0c;玩家…...

故障诊断 | 一文解决,CNN-SVM卷积神经网络-支持向量机组合模型的故障诊断(Matlab)

效果一览 文章概述 故障诊断 | 一文解决,CNN-SVM卷积神经网络-支持向量机组合模型的故障诊断(Matlab) 模型描述 卷积神经网络(Convolutional Neural Network,CNN)和支持向量机(Support Vector Machine,SVM)是两种常用的机器学习算法,它们在不同领域和任务中都表现出…...

菜鸡后端的前端学习记录-2

前言 记录一下看视频学习前端的的一些笔记&#xff0c;以前对Html、Js、CSS有一定的基础&#xff08;都认得&#xff0c;没用过&#xff09;&#xff0c;现在不想从头再来了&#xff0c;学学Vue框架&#xff0c;不定时更新&#xff0c;指不定什么时候就鸽了。。。。 忘了记一下…...

Layui + Echarts 5.0

Layui 怎么整合最新版本的 Echarts 5.0&#xff0c;Echarts 4 升级到 5后&#xff0c;有了很大改变&#xff0c;新的配置项4是无法兼容的&#xff0c;所以想要使用新的功能&#xff0c;都需要升级&#xff01; 新建一个echarts.js文件 layui.define(function (exports) {// 这…...

linux使用iptables禁用ip

iptables是什么&#xff1f; iptables 是一个强大的开源软件&#xff0c;它是 Linux 系统内核中 netfilter 包过滤框架的一部分&#xff0c;用来实现防火墙功能。iptables 提供了一种灵活的方式来控制和管理进出以及通过 Linux 计算机的网络流量。 前提 我在云服务器上用doc…...

安全防御第五次作业

拓扑图及要求如下&#xff1a; 实验注意点&#xff1a; 先配置双机热备&#xff0c;再来配置安全策略和NAT两台双机热备的防火墙的接口号必须一致双机热备时&#xff0c;请确保vrrp配置的虚拟IP与下面的ip在同一网段如果其中一台防火墙有过配置&#xff0c;最好清空或重启&…...

分库分表原则

分库分表原则 单表数据到达千万级别或者20存储空间 优化已经解决不了问题一 IO瓶颈导致性能问题 拆分策略 垂直分库 以表为依据&#xff0c;根据业务将不同的表拆分到不同库中&#xff0c;有点像微服务 垂直分表 以字段为依据&#xff0c;根据字段属性将不同字段拆分到不同…...

VUE PC端可拖动悬浮按钮

一、实现效果&#xff1a; 二、FloatButton.vue <template><div><div class"sssss"><div class"callback float" mousedown"down" touchstart"down" mousemove"move" touchmove"move" mous…...

基于imfindcircles函数的圆形检测实战:从原理到MATLAB实现

1. 霍夫变换与圆形检测原理 第一次接触圆形检测时&#xff0c;我也被各种数学公式绕得头晕。直到把霍夫变换想象成"投票游戏"&#xff0c;才真正理解它的精妙之处。想象一张布满黑白点的图纸&#xff0c;每个黑点都可能属于某个潜在的圆。霍夫变换就像让每个黑点为所…...

PotPlayer跨语言字幕解决方案:基于百度翻译API的实时字幕转换工具

PotPlayer跨语言字幕解决方案&#xff1a;基于百度翻译API的实时字幕转换工具 【免费下载链接】PotPlayer_Subtitle_Translate_Baidu PotPlayer 字幕在线翻译插件 - 百度平台 项目地址: https://gitcode.com/gh_mirrors/po/PotPlayer_Subtitle_Translate_Baidu 在全球化…...

Flutter透明视频播放实战:用AlphaPlayer插件5分钟搞定礼物特效

Flutter透明视频播放实战&#xff1a;用AlphaPlayer插件5分钟搞定礼物特效 在移动应用开发中&#xff0c;炫酷的动画效果往往能显著提升用户体验&#xff0c;尤其是在社交、直播和游戏类应用中。透明视频特效作为其中一种高级表现形式&#xff0c;能够实现元素与背景的无缝融合…...

哔哩下载姬DownKyi:新手快速上手指南与实战技巧

哔哩下载姬DownKyi&#xff1a;新手快速上手指南与实战技巧 【免费下载链接】downkyi 哔哩下载姬downkyi&#xff0c;哔哩哔哩网站视频下载工具&#xff0c;支持批量下载&#xff0c;支持8K、HDR、杜比视界&#xff0c;提供工具箱&#xff08;音视频提取、去水印等&#xff09;…...

为什么你的Python多解释器程序总在崩溃?进程隔离、对象序列化与引用计数泄漏全链路诊断,立即修复

第一章&#xff1a;Python多解释器通信的底层本质与崩溃根源Python 多解释器&#xff08;Multi-Interpreter&#xff0c;PEP 684&#xff09;是 CPython 3.12 引入的核心机制&#xff0c;旨在实现真正的并行解释器隔离——每个解释器拥有独立的全局状态&#xff08;如 sys.modu…...

IT 流程越来越完整,但管理反而变得更难了

在很多企业的 IT 管理过程中&#xff0c;一个非常明显的趋势是&#xff1a;流程在不断增加。 从最初的简单问题处理&#xff0c;到后来的事件管理、问题管理、变更管理&#xff0c;再到审批流程、发布流程&#xff0c;各类流程逐渐被建立起来。从管理角度看&#xff0c;这是一种…...

springboot同城二手物品交易配送系统的设计与实现

目录需求分析与系统设计核心功能模块开发安全与性能优化测试与部署方案项目技术支持源码获取详细视频演示 &#xff1a;文章底部获取博主联系方式&#xff01;同行可合作需求分析与系统设计 进行详细的需求调研&#xff0c;明确用户角色&#xff08;买家、卖家、管理员&#x…...

超越极限:YOLOv8融合Dynamic Head(统一尺度-空间-任务感知注意力)—— 原理详解、代码实现与性能验证

引言 在目标检测领域,YOLO系列模型凭借其出色的速度与精度平衡,始终占据着举足轻重的地位。YOLOv8作为Ultralytics团队的最新力作,在架构设计、训练策略和部署便捷性上均达到了新的高度。然而,随着应用场景的日益复杂,如何让模型在多尺度变化、空间遮挡、任务干扰等挑战下…...

《Cancer Discov》(IF: 33.3)|新型空间蛋白组和空间转录组整合流程解析肿瘤免疫微环境

空间转录组学和空间蛋白组学能分别在原位解析基因表达和蛋白功能状态。然而&#xff0c;它们各有自己独特的应用场景&#xff0c;例如空间转录组覆盖广但预测功能不直接&#xff0c;而空间蛋白组功能信号直接&#xff0c;靶向性高&#xff0c;能提供更多的有效生物学信息。如果…...

告别串口!STM32F105RCT6的ITM调试秘籍:从零配置到华为/高通项目级日志封装

STM32F105RCT6 ITM调试实战&#xff1a;企业级日志系统设计与性能优化 在嵌入式开发领域&#xff0c;调试效率直接影响项目进度和质量。传统串口调试方式虽然简单易用&#xff0c;但在处理复杂企业级项目时往往显得力不从心。本文将深入探讨基于STM32F105RCT6的ITM调试技术&…...