大语言模型通用能力排行榜(2024年11月8日更新)
数据来源SuperCLUE
榜单数据为通用能力排行榜
排名 | 模型名称 | 机构 | 总分 | 理科 | 文科 | Hard | 使用方式 | 发布日期 |
---|---|---|---|---|---|---|---|---|
- | o1-preview | OpenAI | 75.85 | 86.07 | 76.6 | 64.89 | API | 2024年11月8日 |
- | Claude 3.5 Sonnet(20241022) | Anthropic | 70.88 | 82.48 | 76.56 | 53.6 | POE | 2024年11月8日 |
- | ChatGPT-4o-latest | OpenAI | 70.85 | 84.65 | 77.1 | 50.8 | API | 2024年11月8日 |
🏅 | GLM-4-Plus | 智谱AI | 69.64 | 81.41 | 76.44 | 51.08 | API | 2024年11月8日 |
🏅 | SenseChat 5.5 | 商汤 | 69 | 81.17 | 76.67 | 49.16 | API | 2024年11月8日 |
🏅 | AndesGPT-2.0 | OPPO | 68.91 | 81.46 | 76.61 | 48.64 | API | 2024年11月8日 |
🏅 | Qwen2.5-72B-Instruct | 阿里巴巴 | 68.9 | 83.12 | 76.96 | 46.64 | API | 2024年11月8日 |
- | Claude 3.5 Sonnet(20240620) | Anthropic | 68.23 | 81.68 | 76.54 | 46.48 | poe | 2024年11月8日 |
- | Gemini-1.5-Pro-002 | | 68.19 | 80.42 | 76.32 | 47.82 | API | 2024年11月8日 |
- | Qwen-max-0919 | 阿里巴巴 | 68 | 83.03 | 76.5 | 44.48 | API | 2024年11月8日 |
- | GPT-4-Turbo-2024-04-09 | OpenAI | 67.48 | 80.78 | 74.85 | 46.82 | API | 2024年11月8日 |
🥈 | Hunyuan-Turbo | 腾讯 | 67.35 | 81.47 | 76.84 | 43.74 | API | 2024年11月8日 |
🥈 | 360gpt2-pro | 360 | 67.19 | 82.95 | 74.94 | 43.68 | API | 2024年11月8日 |
🥈 | Step-2-16k | 阶跃星辰 | 67.02 | 80.52 | 76.65 | 43.91 | API | 2024年11月8日 |
🥈 | DeepSeek-V2.5 | 深度求索 | 66.87 | 81.69 | 75.42 | 43.5 | API | 2024年11月8日 |
🥈 | Doubao-pro-0828 | 字节跳动 | 66.43 | 79.98 | 75.1 | 44.22 | API | 2024年11月8日 |
🥉 | Baichuan4 | 百川智能 | 66.28 | 81.81 | 75.94 | 41.1 | API | 2024年11月8日 |
🥉 | 山海大模型4.0 | 云知声 | 66.26 | 80.05 | 75.38 | 43.34 | API | 2024年11月8日 |
🥉 | TeleChat2-Large | TeleAI | 66.23 | 78.85 | 75.54 | 44.28 | API | 2024年11月8日 |
- | Llama-3.1-405B-Instruct | Meta | 65.84 | 80.54 | 71.53 | 45.46 | API | 2024年11月8日 |
4 | Ernie-4.0-turbo-8k-preview | 百度 | 64.93 | 78.69 | 74.4 | 41.7 | API | 2024年11月8日 |
- | GPT-4o-mini | OpenAI | 64.85 | 79.84 | 73.24 | 41.46 | API | 2024年11月8日 |
4 | Moonshot(kimi) | 月之暗面 | 63.93 | 74.37 | 75.08 | 42.34 | 网页 | 2024年11月8日 |
5 | Sky-Chat-3.0 | 昆仑万维 | 62.64 | 74.32 | 75.46 | 38.12 | API | 2024年11月8日 |
5 | TeleChat2-35B | TeleAI | 62.46 | 74.07 | 74.05 | 39.26 | 模型 | 2024年11月8日 |
- | Llama-3.1-70B-Instruct | Meta | 61.62 | 77.52 | 69.64 | 37.7 | API | 2024年11月8日 |
6 | Qwen2.5-7B-Instruct | 阿里巴巴 | 60.61 | 74.62 | 73.28 | 33.92 | API | 2024年11月8日 |
- | Llama-3.2-90B-Instruct | Meta | 60.58 | 75.89 | 69 | 36.84 | API | 2024年11月8日 |
7 | 讯飞星火V4.0 | 科大讯飞 | 59.4 | 72.49 | 71.55 | 34.16 | API | 2024年11月8日 |
8 | GLM-4-9B-Chat | 智谱AI | 56.83 | 69.22 | 71.94 | 29.32 | 模型 | 2024年11月8日 |
- | Gemma-2-9b-it | | 55.48 | 67.78 | 69.62 | 29.02 | 模型 | 2024年11月8日 |
9 | MiniCPM3-4B | 面壁智能 | 53.16 | 63.04 | 69.87 | 26.56 | 模型 | 2024年11月8日 |
- | Llama-3.1-8B-Instruct | Meta | 51.42 | 63.27 | 65.3 | 25.69 | API | 2024年11月8日 |
10 | Yi-1.5-9B-Chat-16K | 零一万物 | 51.37 | 59.2 | 67.86 | 27.06 | 模型 | 2024年11月8日 |
- | Llama-3.2-11B-Instruct | Meta | 50.61 | 63.1 | 64.02 | 24.72 | API | 2024年11月8日 |
11 | Yi-1.5-6B-Chat | 零一万物 | 48.69 | 57.03 | 63.89 | 25.16 | 模型 | 2024年11月8日 |
12 | Qwen2.5-1.5B-Instruct | 阿里巴巴 | 43.92 | 46.14 | 64.54 | 21.1 | API | 2024年11月8日 |
- | Gemma-2-2b-it | | 42.25 | 43.36 | 63.72 | 19.67 | 模型 | 2024年11月8日 |
- | Phi-3-Mini-4K-Instruct | 微软 | 39.98 | 52.28 | 44.75 | 22.9 | 模型 | 2024年11月8日 |
- | Mistral-7B-Instruct-v0.3 | Mistral AI | 37.11 | 41.06 | 51.21 | 19.05 | 模型 | 2024年11月8日 |
13 | Baichuan2-7B-Chat | 百川智能 | 33.59 | 28.46 | 58.09 | 14.22 | 模型 | 2024年11月8日 |
13 | Qwen2.5-0.5B-Instruct | 阿里巴巴 | 32.85 | 30.53 | 54.13 | 13.9 | API | 2024年11月8日 |
13 | RWKV-6-World-7B | RWKV | 32.76 | 27.46 | 58.05 | 12.76 | 模型 | 2024年11月8日 |
相关文章:
大语言模型通用能力排行榜(2024年11月8日更新)
数据来源SuperCLUE 榜单数据为通用能力排行榜 排名 模型名称 机构 总分 理科 文科 Hard 使用方式 发布日期 - o1-preview OpenAI 75.85 86.07 76.6 64.89 API 2024年11月8日 - Claude 3.5 Sonnet(20241022) Anthropic 70.88 82.4…...
信息技术引领未来:大数据治理的实践与挑战
信息技术引领未来:大数据治理的实践与挑战 在信息技术日新月异的今天,大数据已成为企业和社会发展的重要驱动力。大数据治理,作为确保数据质量、安全性和合规性的关键环节,正面临着前所未有的实践挑战与机遇。本文将探讨信息技术…...

Git 分⽀规范 Git Flow 模型
前言 GitFlow 是一种流行的 Git 分支管理策略,由 Vincent Driessen 在 2010 年提出。它提供了一种结构化的方法来管理项目的开发、发布和维护,特别适合大型和复杂的项目。GitFlow 定义了一套明确的分支模型和工作流程,使得团队成员可以更有效…...

基于YOLOv8深度学习的公共卫生防护口罩佩戴检测系统(PyQt5界面+数据集+训练代码)
在全球公共卫生事件频发的背景下,防护口罩佩戴检测成为保障公众健康和控制病毒传播的重要手段之一。特别是在人员密集的公共场所,例如医院、学校、公共交通工具等地,口罩的正确佩戴对降低病毒传播风险、保护易感人群、遏制疫情扩散有着至关重…...

Nature Communications 基于触觉手套的深度学习驱动视触觉动态重建方案
在人形机器人操作领域,有一个极具价值的问题:鉴于操作数据在人形操作技能学习中的重要性,如何有效地从现实世界中获取操作数据的完整状态?如果可以,那考虑到人类庞大规模的人口和进行复杂操作的简单直观性与可扩展性&a…...

构建SSH僵尸网络
import argparse import paramiko# 定义一个名为Client的类,用于表示SSH客户端相关操作 class Client:# 类的初始化方法,接收主机地址、用户名和密码作为参数def __init__(self, host, user, password):self.host hostself.user userself.password pa…...
WPF中MVVM工具包 CommunityToolkit.Mvvm
CommunityToolkit.Mvvm,也称为MVVM工具包,是Microsoft Community Toolkit的一部分。它是一个轻量级但功能强大的MVVM(Model-View-ViewModel)库,旨在帮助开发者更容易地实现MVVM设计模式。 特点 独立于平台和运行时&a…...

学习空闲任务函数
一、user_StopEnterTask 停止 进入任务 /* Private includes -----------------------------------------------------------*/ //includes #include "user_TasksInit.h" #include "user_MPUCheckTask.h"#include "ui.h" #include "ui_Hom…...

Hyper-v中ubuntu与windows文件共享
Hyper-v中ubuntu与windows文件共享 前言相关链接第一步--第一个链接第二步--第二个链接测试与验证 前言 关于Hyper-V的共享我搞了好久,网上的很多教程太过冗余,我直接采用最简单的办法吧 相关链接 Hyper-V中Ubuntu 同windows系统共享文件夹-百度经验 …...

【软件工程】一篇入门UML建模图(类图)
🌈 个人主页:十二月的猫-CSDN博客 🔥 系列专栏: 🏀软件开发必练内功_十二月的猫的博客-CSDN博客 💪🏻 十二月的寒冬阻挡不了春天的脚步,十二点的黑夜遮蔽不住黎明的曙光 目录 1. 前…...

Windows 安装Docker For Desktop概要
Windows 安装docker 下载部分的工作需要使用科学技术。如果没有可以联系博主发送已下载好的文件。 本文档不涉及技术的讲解,仅有安装的步骤。 准备工作 包含下载与环境准备,下载的文件仅下载,在后续步骤进行安装。 微软关于wsl的文档&…...
解决循环依赖报错问题
Caused by: org.springframework.beans.factory.BeanCurrentlyInCreationException: Error creating bean with name ‘asyncTaskServiceImpl’: Bean with name ‘asyncTaskServiceImpl’ has been injected into other beans [resignServiceImpl] in its raw version as part…...

代码随想录第46期 单调栈
这道题主要是单调栈的简单应用 class Solution { public:vector<int> dailyTemperatures(vector<int>& T) {vector<int> result(T.size(),0);stack<int> st;st.push(0);for(int i1;i<T.size();i){if(T[i]<T[st.top()]){st.push(i);}else{wh…...

中仕公考怎么样?事业编面试不去有影响吗?
事业编考试笔试已经通过,但是面试不去参加会有影响吗? 1. 自动放弃面试资格:未能按时出席事业单位的面试将被视为主动放弃该岗位的竞争机会。 2. 个人信誉问题:面试作为招聘流程的关键步骤,无故缺席可能被解释为诚信…...

OMV7 树莓派 tf卡安装
升级7之后,问题多多,不是docker不行了,就是代理不好使 今天又重装了一遍,用官方的链接,重新再折腾一遍…… 使用raspberry pi imager安装最新版lite OS。 注意是无桌面 Lite版 配置好树莓派初始化设置࿰…...
Go语言24小时极速学习教程(五)Go语言中的SpringMVC框架——Gin
作为一个真正能用的企业级应用,怎么能缺少RESTful接口呢?所以我们需要尝试在Go语言环境中写出我们的对外接口,这样前端就可以借由Gin框架访问我们数据库中的数据了。 一、Gin框架的使用 1. 安装 Gin 首先,你需要在你的 Go 项目…...
【汇编】c++游戏开发
由一起学编程创作的‘C/C项目实战:2D射击游戏开发(简易版), 440 行源码分享来啦~’: C/C项目实战:2D射击游戏开发(简易版), 440 行源码分享来啦~_射击c-CSDN博客文章浏览…...

Android Studio | 修改镜像地址为阿里云镜像地址,启动App
在项目文件的目录下的 settings.gradle.kts 中修改配置,配置中包含插件和依赖项 pluginManagement {repositories {maven { urluri ("https://www.jitpack.io")}maven { urluri ("https://maven.aliyun.com/repository/releases")}maven { urlu…...

Rocky linux8 安装php8.0
Rocky linux8 安装php8.0 1.安装remi源2.列出php版本3.变更php版本,Rocky8有提供php8版本,所以切换Rocky8提供的版本,而不是remi提供的版本,不过remi有提供php8.1和php8.2版本。4.切换成remi提供的8.0版本5.安装phpendl 1.安装rem…...

Ubuntu 18 EDK2 环境编译
视频:在全新的Ubuntu上从零搭建UEFI的EDK2开发环境 开始:git clone https://github.com/tianocore/edk2.git 开始编译BaseTools前先更新一下子模块:git submodule update --init ,然后:make -C BaseTools/ 问题1&a…...
React 第五十五节 Router 中 useAsyncError的使用详解
前言 useAsyncError 是 React Router v6.4 引入的一个钩子,用于处理异步操作(如数据加载)中的错误。下面我将详细解释其用途并提供代码示例。 一、useAsyncError 用途 处理异步错误:捕获在 loader 或 action 中发生的异步错误替…...
设计模式和设计原则回顾
设计模式和设计原则回顾 23种设计模式是设计原则的完美体现,设计原则设计原则是设计模式的理论基石, 设计模式 在经典的设计模式分类中(如《设计模式:可复用面向对象软件的基础》一书中),总共有23种设计模式,分为三大类: 一、创建型模式(5种) 1. 单例模式(Sing…...
逻辑回归:给不确定性划界的分类大师
想象你是一名医生。面对患者的检查报告(肿瘤大小、血液指标),你需要做出一个**决定性判断**:恶性还是良性?这种“非黑即白”的抉择,正是**逻辑回归(Logistic Regression)** 的战场&a…...

循环冗余码校验CRC码 算法步骤+详细实例计算
通信过程:(白话解释) 我们将原始待发送的消息称为 M M M,依据发送接收消息双方约定的生成多项式 G ( x ) G(x) G(x)(意思就是 G ( x ) G(x) G(x) 是已知的)࿰…...

【网络安全产品大调研系列】2. 体验漏洞扫描
前言 2023 年漏洞扫描服务市场规模预计为 3.06(十亿美元)。漏洞扫描服务市场行业预计将从 2024 年的 3.48(十亿美元)增长到 2032 年的 9.54(十亿美元)。预测期内漏洞扫描服务市场 CAGR(增长率&…...

Cloudflare 从 Nginx 到 Pingora:性能、效率与安全的全面升级
在互联网的快速发展中,高性能、高效率和高安全性的网络服务成为了各大互联网基础设施提供商的核心追求。Cloudflare 作为全球领先的互联网安全和基础设施公司,近期做出了一个重大技术决策:弃用长期使用的 Nginx,转而采用其内部开发…...
高防服务器能够抵御哪些网络攻击呢?
高防服务器作为一种有着高度防御能力的服务器,可以帮助网站应对分布式拒绝服务攻击,有效识别和清理一些恶意的网络流量,为用户提供安全且稳定的网络环境,那么,高防服务器一般都可以抵御哪些网络攻击呢?下面…...

Unsafe Fileupload篇补充-木马的详细教程与木马分享(中国蚁剑方式)
在之前的皮卡丘靶场第九期Unsafe Fileupload篇中我们学习了木马的原理并且学了一个简单的木马文件 本期内容是为了更好的为大家解释木马(服务器方面的)的原理,连接,以及各种木马及连接工具的分享 文件木马:https://w…...

C++使用 new 来创建动态数组
问题: 不能使用变量定义数组大小 原因: 这是因为数组在内存中是连续存储的,编译器需要在编译阶段就确定数组的大小,以便正确地分配内存空间。如果允许使用变量来定义数组的大小,那么编译器就无法在编译时确定数组的大…...

C++:多态机制详解
目录 一. 多态的概念 1.静态多态(编译时多态) 二.动态多态的定义及实现 1.多态的构成条件 2.虚函数 3.虚函数的重写/覆盖 4.虚函数重写的一些其他问题 1).协变 2).析构函数的重写 5.override 和 final关键字 1&#…...