当前位置: 首页 > news >正文

大语言模型通用能力排行榜(2024年11月8日更新)

数据来源SuperCLUE

榜单数据为通用能力排行榜

排名

模型名称

机构

总分

理科

文科

Hard

使用方式

发布日期

-

o1-preview

OpenAI

75.85

86.07

76.6

64.89

API

2024年11月8日

-

Claude 3.5 Sonnet(20241022)

Anthropic

70.88

82.48

76.56

53.6

POE

2024年11月8日

-

ChatGPT-4o-latest

OpenAI

70.85

84.65

77.1

50.8

API

2024年11月8日

🏅

GLM-4-Plus

智谱AI

69.64

81.41

76.44

51.08

API

2024年11月8日

🏅

SenseChat 5.5

商汤

69

81.17

76.67

49.16

API

2024年11月8日

🏅

AndesGPT-2.0

OPPO

68.91

81.46

76.61

48.64

API

2024年11月8日

🏅

Qwen2.5-72B-Instruct

阿里巴巴

68.9

83.12

76.96

46.64

API

2024年11月8日

-

Claude 3.5 Sonnet(20240620)

Anthropic

68.23

81.68

76.54

46.48

poe

2024年11月8日

-

Gemini-1.5-Pro-002

Google

68.19

80.42

76.32

47.82

API

2024年11月8日

-

Qwen-max-0919

阿里巴巴

68

83.03

76.5

44.48

API

2024年11月8日

-

GPT-4-Turbo-2024-04-09

OpenAI

67.48

80.78

74.85

46.82

API

2024年11月8日

🥈

Hunyuan-Turbo

腾讯

67.35

81.47

76.84

43.74

API

2024年11月8日

🥈

360gpt2-pro

360

67.19

82.95

74.94

43.68

API

2024年11月8日

🥈

Step-2-16k

阶跃星辰

67.02

80.52

76.65

43.91

API

2024年11月8日

🥈

DeepSeek-V2.5

深度求索

66.87

81.69

75.42

43.5

API

2024年11月8日

🥈

Doubao-pro-0828

字节跳动

66.43

79.98

75.1

44.22

API

2024年11月8日

🥉

Baichuan4

百川智能

66.28

81.81

75.94

41.1

API

2024年11月8日

🥉

山海大模型4.0

云知声

66.26

80.05

75.38

43.34

API

2024年11月8日

🥉

TeleChat2-Large

TeleAI

66.23

78.85

75.54

44.28

API

2024年11月8日

-

Llama-3.1-405B-Instruct

Meta

65.84

80.54

71.53

45.46

API

2024年11月8日

4

Ernie-4.0-turbo-8k-preview

百度

64.93

78.69

74.4

41.7

API

2024年11月8日

-

GPT-4o-mini

OpenAI

64.85

79.84

73.24

41.46

API

2024年11月8日

4

Moonshot(kimi)

月之暗面

63.93

74.37

75.08

42.34

网页

2024年11月8日

5

Sky-Chat-3.0

昆仑万维

62.64

74.32

75.46

38.12

API

2024年11月8日

5

TeleChat2-35B

TeleAI

62.46

74.07

74.05

39.26

模型

2024年11月8日

-

Llama-3.1-70B-Instruct

Meta

61.62

77.52

69.64

37.7

API

2024年11月8日

6

Qwen2.5-7B-Instruct

阿里巴巴

60.61

74.62

73.28

33.92

API

2024年11月8日

-

Llama-3.2-90B-Instruct

Meta

60.58

75.89

69

36.84

API

2024年11月8日

7

讯飞星火V4.0

科大讯飞

59.4

72.49

71.55

34.16

API

2024年11月8日

8

GLM-4-9B-Chat

智谱AI

56.83

69.22

71.94

29.32

模型

2024年11月8日

-

Gemma-2-9b-it

Google

55.48

67.78

69.62

29.02

模型

2024年11月8日

9

MiniCPM3-4B

面壁智能

53.16

63.04

69.87

26.56

模型

2024年11月8日

-

Llama-3.1-8B-Instruct

Meta

51.42

63.27

65.3

25.69

API

2024年11月8日

10

Yi-1.5-9B-Chat-16K

零一万物

51.37

59.2

67.86

27.06

模型

2024年11月8日

-

Llama-3.2-11B-Instruct

Meta

50.61

63.1

64.02

24.72

API

2024年11月8日

11

Yi-1.5-6B-Chat

零一万物

48.69

57.03

63.89

25.16

模型

2024年11月8日

12

Qwen2.5-1.5B-Instruct

阿里巴巴

43.92

46.14

64.54

21.1

API

2024年11月8日

-

Gemma-2-2b-it

Google

42.25

43.36

63.72

19.67

模型

2024年11月8日

-

Phi-3-Mini-4K-Instruct

微软

39.98

52.28

44.75

22.9

模型

2024年11月8日

-

Mistral-7B-Instruct-v0.3

Mistral AI

37.11

41.06

51.21

19.05

模型

2024年11月8日

13

Baichuan2-7B-Chat

百川智能

33.59

28.46

58.09

14.22

模型

2024年11月8日

13

Qwen2.5-0.5B-Instruct

阿里巴巴

32.85

30.53

54.13

13.9

API

2024年11月8日

13

RWKV-6-World-7B

RWKV

32.76

27.46

58.05

12.76

模型

2024年11月8日

相关文章:

大语言模型通用能力排行榜(2024年11月8日更新)

数据来源SuperCLUE 榜单数据为通用能力排行榜 排名 模型名称 机构 总分 理科 文科 Hard 使用方式 发布日期 - o1-preview OpenAI 75.85 86.07 76.6 64.89 API 2024年11月8日 - Claude 3.5 Sonnet(20241022) Anthropic 70.88 82.4…...

信息技术引领未来:大数据治理的实践与挑战

信息技术引领未来:大数据治理的实践与挑战 在信息技术日新月异的今天,大数据已成为企业和社会发展的重要驱动力。大数据治理,作为确保数据质量、安全性和合规性的关键环节,正面临着前所未有的实践挑战与机遇。本文将探讨信息技术…...

Git 分⽀规范 Git Flow 模型

前言 GitFlow 是一种流行的 Git 分支管理策略,由 Vincent Driessen 在 2010 年提出。它提供了一种结构化的方法来管理项目的开发、发布和维护,特别适合大型和复杂的项目。GitFlow 定义了一套明确的分支模型和工作流程,使得团队成员可以更有效…...

基于YOLOv8深度学习的公共卫生防护口罩佩戴检测系统(PyQt5界面+数据集+训练代码)

在全球公共卫生事件频发的背景下,防护口罩佩戴检测成为保障公众健康和控制病毒传播的重要手段之一。特别是在人员密集的公共场所,例如医院、学校、公共交通工具等地,口罩的正确佩戴对降低病毒传播风险、保护易感人群、遏制疫情扩散有着至关重…...

Nature Communications 基于触觉手套的深度学习驱动视触觉动态重建方案

在人形机器人操作领域,有一个极具价值的问题:鉴于操作数据在人形操作技能学习中的重要性,如何有效地从现实世界中获取操作数据的完整状态?如果可以,那考虑到人类庞大规模的人口和进行复杂操作的简单直观性与可扩展性&a…...

构建SSH僵尸网络

import argparse import paramiko# 定义一个名为Client的类,用于表示SSH客户端相关操作 class Client:# 类的初始化方法,接收主机地址、用户名和密码作为参数def __init__(self, host, user, password):self.host hostself.user userself.password pa…...

WPF中MVVM工具包 CommunityToolkit.Mvvm

CommunityToolkit.Mvvm,也称为MVVM工具包,是Microsoft Community Toolkit的一部分。它是一个轻量级但功能强大的MVVM(Model-View-ViewModel)库,旨在帮助开发者更容易地实现MVVM设计模式。 特点 独立于平台和运行时&a…...

学习空闲任务函数

一、user_StopEnterTask 停止 进入任务 /* Private includes -----------------------------------------------------------*/ //includes #include "user_TasksInit.h" #include "user_MPUCheckTask.h"#include "ui.h" #include "ui_Hom…...

Hyper-v中ubuntu与windows文件共享

Hyper-v中ubuntu与windows文件共享 前言相关链接第一步--第一个链接第二步--第二个链接测试与验证 前言 关于Hyper-V的共享我搞了好久,网上的很多教程太过冗余,我直接采用最简单的办法吧 相关链接 Hyper-V中Ubuntu 同windows系统共享文件夹-百度经验 …...

【软件工程】一篇入门UML建模图(类图)

🌈 个人主页:十二月的猫-CSDN博客 🔥 系列专栏: 🏀软件开发必练内功_十二月的猫的博客-CSDN博客 💪🏻 十二月的寒冬阻挡不了春天的脚步,十二点的黑夜遮蔽不住黎明的曙光 目录 1. 前…...

Windows 安装Docker For Desktop概要

Windows 安装docker 下载部分的工作需要使用科学技术。如果没有可以联系博主发送已下载好的文件。 本文档不涉及技术的讲解,仅有安装的步骤。 准备工作 包含下载与环境准备,下载的文件仅下载,在后续步骤进行安装。 微软关于wsl的文档&…...

解决循环依赖报错问题

Caused by: org.springframework.beans.factory.BeanCurrentlyInCreationException: Error creating bean with name ‘asyncTaskServiceImpl’: Bean with name ‘asyncTaskServiceImpl’ has been injected into other beans [resignServiceImpl] in its raw version as part…...

代码随想录第46期 单调栈

这道题主要是单调栈的简单应用 class Solution { public:vector<int> dailyTemperatures(vector<int>& T) {vector<int> result(T.size(),0);stack<int> st;st.push(0);for(int i1;i<T.size();i){if(T[i]<T[st.top()]){st.push(i);}else{wh…...

中仕公考怎么样?事业编面试不去有影响吗?

事业编考试笔试已经通过&#xff0c;但是面试不去参加会有影响吗&#xff1f; 1. 自动放弃面试资格&#xff1a;未能按时出席事业单位的面试将被视为主动放弃该岗位的竞争机会。 2. 个人信誉问题&#xff1a;面试作为招聘流程的关键步骤&#xff0c;无故缺席可能被解释为诚信…...

OMV7 树莓派 tf卡安装

​ 升级7之后&#xff0c;问题多多&#xff0c;不是docker不行了&#xff0c;就是代理不好使 今天又重装了一遍&#xff0c;用官方的链接&#xff0c;重新再折腾一遍…… 使用raspberry pi imager安装最新版lite OS。 注意是无桌面 Lite版 配置好树莓派初始化设置&#xff0…...

Go语言24小时极速学习教程(五)Go语言中的SpringMVC框架——Gin

作为一个真正能用的企业级应用&#xff0c;怎么能缺少RESTful接口呢&#xff1f;所以我们需要尝试在Go语言环境中写出我们的对外接口&#xff0c;这样前端就可以借由Gin框架访问我们数据库中的数据了。 一、Gin框架的使用 1. 安装 Gin 首先&#xff0c;你需要在你的 Go 项目…...

【汇编】c++游戏开发

由一起学编程创作的‘C/C项目实战&#xff1a;2D射击游戏开发&#xff08;简易版&#xff09;&#xff0c; 440 行源码分享来啦~’&#xff1a; C/C项目实战&#xff1a;2D射击游戏开发&#xff08;简易版&#xff09;&#xff0c; 440 行源码分享来啦~_射击c-CSDN博客文章浏览…...

Android Studio | 修改镜像地址为阿里云镜像地址,启动App

在项目文件的目录下的 settings.gradle.kts 中修改配置&#xff0c;配置中包含插件和依赖项 pluginManagement {repositories {maven { urluri ("https://www.jitpack.io")}maven { urluri ("https://maven.aliyun.com/repository/releases")}maven { urlu…...

Rocky linux8 安装php8.0

Rocky linux8 安装php8.0 1.安装remi源2.列出php版本3.变更php版本&#xff0c;Rocky8有提供php8版本&#xff0c;所以切换Rocky8提供的版本&#xff0c;而不是remi提供的版本&#xff0c;不过remi有提供php8.1和php8.2版本。4.切换成remi提供的8.0版本5.安装phpendl 1.安装rem…...

Ubuntu 18 EDK2 环境编译

视频&#xff1a;在全新的Ubuntu上从零搭建UEFI的EDK2开发环境 开始&#xff1a;git clone https://github.com/tianocore/edk2.git 开始编译BaseTools前先更新一下子模块&#xff1a;git submodule update --init &#xff0c;然后&#xff1a;make -C BaseTools/ 问题1&a…...

CTF show Web 红包题第六弹

提示 1.不是SQL注入 2.需要找关键源码 思路 进入页面发现是一个登录框&#xff0c;很难让人不联想到SQL注入&#xff0c;但提示都说了不是SQL注入&#xff0c;所以就不往这方面想了 ​ 先查看一下网页源码&#xff0c;发现一段JavaScript代码&#xff0c;有一个关键类ctfs…...

Unity3D中Gfx.WaitForPresent优化方案

前言 在Unity中&#xff0c;Gfx.WaitForPresent占用CPU过高通常表示主线程在等待GPU完成渲染&#xff08;即CPU被阻塞&#xff09;&#xff0c;这表明存在GPU瓶颈或垂直同步/帧率设置问题。以下是系统的优化方案&#xff1a; 对惹&#xff0c;这里有一个游戏开发交流小组&…...

Python爬虫实战:研究feedparser库相关技术

1. 引言 1.1 研究背景与意义 在当今信息爆炸的时代,互联网上存在着海量的信息资源。RSS(Really Simple Syndication)作为一种标准化的信息聚合技术,被广泛用于网站内容的发布和订阅。通过 RSS,用户可以方便地获取网站更新的内容,而无需频繁访问各个网站。 然而,互联网…...

Python爬虫(二):爬虫完整流程

爬虫完整流程详解&#xff08;7大核心步骤实战技巧&#xff09; 一、爬虫完整工作流程 以下是爬虫开发的完整流程&#xff0c;我将结合具体技术点和实战经验展开说明&#xff1a; 1. 目标分析与前期准备 网站技术分析&#xff1a; 使用浏览器开发者工具&#xff08;F12&…...

如何理解 IP 数据报中的 TTL?

目录 前言理解 前言 面试灵魂一问&#xff1a;说说对 IP 数据报中 TTL 的理解&#xff1f;我们都知道&#xff0c;IP 数据报由首部和数据两部分组成&#xff0c;首部又分为两部分&#xff1a;固定部分和可变部分&#xff0c;共占 20 字节&#xff0c;而即将讨论的 TTL 就位于首…...

Linux C语言网络编程详细入门教程:如何一步步实现TCP服务端与客户端通信

文章目录 Linux C语言网络编程详细入门教程&#xff1a;如何一步步实现TCP服务端与客户端通信前言一、网络通信基础概念二、服务端与客户端的完整流程图解三、每一步的详细讲解和代码示例1. 创建Socket&#xff08;服务端和客户端都要&#xff09;2. 绑定本地地址和端口&#x…...

【堆垛策略】设计方法

堆垛策略的设计是积木堆叠系统的核心&#xff0c;直接影响堆叠的稳定性、效率和容错能力。以下是分层次的堆垛策略设计方法&#xff0c;涵盖基础规则、优化算法和容错机制&#xff1a; 1. 基础堆垛规则 (1) 物理稳定性优先 重心原则&#xff1a; 大尺寸/重量积木在下&#xf…...

ArcPy扩展模块的使用(3)

管理工程项目 arcpy.mp模块允许用户管理布局、地图、报表、文件夹连接、视图等工程项目。例如&#xff0c;可以更新、修复或替换图层数据源&#xff0c;修改图层的符号系统&#xff0c;甚至自动在线执行共享要托管在组织中的工程项。 以下代码展示了如何更新图层的数据源&…...

React父子组件通信:Props怎么用?如何从父组件向子组件传递数据?

系列回顾&#xff1a; 在上一篇《React核心概念&#xff1a;State是什么&#xff1f;》中&#xff0c;我们学习了如何使用useState让一个组件拥有自己的内部数据&#xff08;State&#xff09;&#xff0c;并通过一个计数器案例&#xff0c;实现了组件的自我更新。这很棒&#…...

深入解析光敏传感技术:嵌入式仿真平台如何重塑电子工程教学

一、光敏传感技术的物理本质与系统级实现挑战 光敏电阻作为经典的光电传感器件&#xff0c;其工作原理根植于半导体材料的光电导效应。当入射光子能量超过材料带隙宽度时&#xff0c;价带电子受激发跃迁至导带&#xff0c;形成电子-空穴对&#xff0c;导致材料电导率显著提升。…...