论文笔记:Evaluating the Performance of Large Language Models on GAOKAO Benchmark
1 论文思路
采用zero-shot prompting的方式,将试题转化为ChatGPT的输入
对于数学题,将公式转化为latex输入
主观题由专业教师打分
2 数据
2010~2022年,一共13年间的全国A卷和全国B卷

3 结论
3.1 不同模型的zeroshot 高考总分


3.2 各科主观题&客观题得分



3.3 不同年份的得分

相关文章:
论文笔记:Evaluating the Performance of Large Language Models on GAOKAO Benchmark
1 论文思路 采用zero-shot prompting的方式,将试题转化为ChatGPT的输入 对于数学题,将公式转化为latex输入 主观题由专业教师打分 2 数据 2010~2022年,一共13年间的全国A卷和全国B卷 3 结论 3.1 不同模型的zeroshot 高考总分 3.2 各科主…...
MySQL 数据库查询与数据操作:使用 ORDER BY 排序和 DELETE 删除记录
使用 ORDER BY 进行排序 使用 ORDER BY 语句按升序或降序对结果进行排序。 ORDER BY 关键字默认按升序排序。要按降序排序结果,使用 DESC 关键字。 示例按名称按字母顺序排序结果: import mysql.connectormydb mysql.connector.connect(host"l…...
数据结构入门(3)2.链表接口实现
目录 前言 头文件 动态申请一个结点 单链表打印 单链表尾插 单链表的头插 单链表的尾删 单链表头删 单链表查找 单链表在pos位置之后插入x 单链表删除pos位置之后的值 在pos的前面插入 删除pos位置 销毁顺序表 前言 本文将介绍链表常见的功能的实现 头文件 #…...
vscode中解决驱动编写的时候static int __init chrdev_init()报错的问题
目录 错误出错原因解决方法 错误 在入口函数上,出现 expected a ; 这样的提示 出错原因 缺少了 __KERNEL __ 宏定义 解决方法 补上__KERNEL__宏定义 具体做法:在vscode中按下ctrlshiftp ,输入:C/C:Edit Configurations࿰…...
fastgpt本地详细部署以及配置
目录 一、Docker部署1、docker安装2、docker启动3、添加用户到 docker 组:4、验证 Docker 安装:二、one_api 本地部署1、linux系统部署2、windows系统部署三、向量模型部署(m3e)四、chatglm2模型本地部署五、fastgpt模型本地部署1、下载配置文件2、文件配置--docker-compos…...
【故障分类】基于注意力机制的卷积神经网络结合双向长短记忆神经网络CNN-BiLSTM-attention实现数据分类附matlab代码
摘要: ntion机制加权 4. 加权后的特征进行分类 需求分析 本文旨在实现一个通用的数据分类模型,可应用于不同领域的数据分类任务。 设计方案 设计一个CNN网络结构,提取输入数据的特征 将特征序列输入到BiLSTM网络,进行时序建模…...
vue接入百度地图获取经纬度
通过城市名称和城市中心经纬度来获取当前所在地图,当前经纬度中心获取可以通过后端获取 静态文件包,替换baidu.html中的ak值,ak值通过百度地图官方网站申请 申请:百度地图API申请步骤 - 知乎 代码示例文件: 链接&a…...
交流负载箱的特点和优势有哪些?
交流负载箱广泛应用于电力系统、新能源、轨道交通、航空航天等领域。它具有以下特点和优势: 1. 灵活性高:交流负载箱可以根据实际需求,调整输出电流、电压、功率等参数,以满足不同场景下的测试需求。同时,它还可以实现…...
Java线程锁之Lock的使用
Lock 的使用 Lock 是java 1.5 中引入的线程同步工具,它主要用于多线程下共享资源的控制。本质上Lock 仅仅是一个接口, 可以通过显式定义同步锁对象来实现同步,能够提供比synchronized 更广泛的锁定操作,并支持多个相关的 Lock接…...
简站wordpress主题看上去差不多 实际大不一样
有人说简站wordpress主题,都差不多嘛。我表示无语。表面看上去是差不多的,实际的细节是不一样的。 下面以编号:JZP4431和编号:JZP4878这两个主题为例子来讲一下,简站wordpress主题,在细节方面的不一样之处…...
(完美方案)解决mfc140u.dll文件丢失问题,快速且有效的修复
唉,又是丢失了mfc140u.dll,这该怎么办呢?如果你的电脑突然找不到或丢失mfc140u.dll文件,那就真是太糟糕了。别担心,我分享给你一些干货,告诉你如何快速解决mfc140u.dll丢失的问题。 一.mfc140u.dll属性功能…...
并发通信(网络进程线程)
如果为每个客户端创建一个进程(或线程),因为linux系统文件标识符最多1024位,是有限的。 所以使用IO复用技术,提高并发程度。 阻塞与非阻塞 阻塞式复用 非阻塞复用 信号驱动IO 在属主进程(线程中声明&…...
WPF 该线程是用不接受参数的 ThreadStart 委托创建的。
创建无参数线程是无法发去传递参数的,需要把 《 thread.Start(“张三”); 》改为《 thread.Start(); 》 把参数去掉就可以了。 public RegisterWindow(){InitializeComponent();//无参数线程Thread thread new Thread(pageLoad);thread.IsBackground true;//thr…...
FreeRTOS学习第9篇--队列介绍
目录 FreeRTOS学习第9篇--队列介绍1. 数据传输的方法1.1 任务之间如何传输数据1.2 队列的本质 2. 队列的工作原理和实现2.1 创建队列2.2 向队列发送数据2.3 从队列接收数据 3. 使用队列进行任务间的通信3.1 通信示例3.2 同步示例 结论 FreeRTOS学习第9篇–队列介绍 本文目标&a…...
qt如何配置ros环境
在Qt5.7的版本可以使用bash -i -c来启动qt,让Qt自己识别系统环境,不知道为什么Qt在之后的版本,这样使用都失效了。因为它会默认把CMAKE_PREFIX_PATH修改掉。 网上还有安装ros插件版本的qt creator,感觉失去了一些灵活性。 自己测试…...
20240310-1-Java后端开发知识体系
Java 基础 知识体系 Questions 1. HashMap 1.8与1.7的区别 1.71.8底层结构数组链表数组链表/红黑树插入方式头插法尾插法计算hash值4次位运算5次异或运算1次位运算1次异或运算扩容、插入先扩容再插入先插入再扩容扩容后位置计算重新hash原位置或原位置旧容量 (1) 扩容因子…...
Python基础学习(7)函数作用域与名称空间
文章目录 一.认识函数对象1.函数被引用2.函数作为元素3.函数可以作为参数和返回值 二,名称空间1.内建名称空间(存放内置函数)2.全局名称空间(Python定义在外层的名字)3.局部名称空间(存在函数内定义的名字) 三,作用域1.global 提权2.nonlocal 降权 四,匿名函数 Python基础学习(…...
使用helm部署clickhouse
(作者:陈玓玏) 前置条件 已安装 Kubernetes 集群; 已安装 Helm 包管理工具。 部署 1 添加 RadonDB ClickHouse 的 Helm 仓库 helm repo add ck https://radondb.github.io/radondb-clickhouse-kubernetes/ helm repo upd…...
2024.02.09 校招 实习 内推 面经
绿*泡*泡VX: neituijunsir 交流*裙 ,内推/实习/校招汇总表格 1、校招 | 中国电信江苏分公司2024年春季校园招聘 校招 | 中国电信江苏分公司2024年春季校园招聘 2、校招 | 国机集团2024届总部管培生春季招聘全面启动! 校招 | 国机集团202…...
【其他】清风眼中的《妙手仁心》
我是清风,一个以医生为正职,平时喜欢写点文字的男人。人家喜欢把我称为作家,可是我觉得我还配不上这个称呼。因为我所记录的只是一些身边的人和事,所抒发的也只是一些个人的情感,这与“作家”二字相去甚远。有人也许会…...
ATCODER ABC C题解蚁
这,是一个采用C精灵库编写的程序,它画了一幅漂亮的图形: 复制代码 #include "sprites.h" //包含C精灵库 Sprite turtle; //建立角色叫turtle void draw(int d){for(int i0;i<5;i)turtle.fd(d).left(72); } int main(){ …...
GLM-4V-9B保姆级安装教程:Docker一键部署,支持多轮对话
GLM-4V-9B保姆级安装教程:Docker一键部署,支持多轮对话 1. 环境准备与快速部署 1.1 系统要求 操作系统:Linux (推荐Ubuntu 20.04)显卡:NVIDIA GPU (显存≥24GB)驱动:NVIDIA驱动≥515.65.01Docker:19.03C…...
零基础玩转火影AI绘画:忍者绘卷镜像保姆级部署教程
零基础玩转火影AI绘画:忍者绘卷镜像保姆级部署教程 1. 前言:开启你的忍者绘画之旅 你是否曾经幻想过自己也能画出《火影忍者》那样帅气的角色?现在,借助"忍者绘卷"AI绘画镜像,即使没有任何绘画基础&#x…...
LabVIEW实战:基于Modbus RTU协议的串口通信实现与优化
1. 为什么需要Modbus RTU串口通信? 在工业自动化领域,设备间的数据交换就像人与人之间的对话一样重要。想象一下,你正在搭建一个智能温室控制系统,需要实时读取温湿度传感器的数据,同时控制灌溉阀门和通风设备。这时候…...
Canvas动画实战:用requestAnimationFrame打造会飘动的彩虹云朵
1. 从静态到动态:理解Canvas动画基础 第一次接触Canvas动画时,我盯着静态的彩虹和云朵代码发呆——明明已经能用arc()画出完美圆弧,为什么我的云朵就是不会动?后来才发现,Canvas绘图就像在玻璃上画画,每次重…...
【AI原生代码审查实战指南】:2026奇点大会首发的7大审查范式与3类高危漏洞自动拦截模型
第一章:2026奇点智能技术大会:AI原生代码审查 2026奇点智能技术大会(https://ml-summit.org) 在2026奇点智能技术大会上,“AI原生代码审查”不再作为辅助工具存在,而是深度嵌入软件开发生命周期的每个环节——从提交前的本地预检…...
企业查询怎么查?避坑指南+实操步骤(附免费工具推荐)
企业查询其实不难,但要查得全面、高效却有门道。我之前踩过不少坑,比如查了3次就提示开会员,或者数据堆砌看不懂,甚至想看关联公司还要付费。根据2026年的行业数据,65%的用户因为关联查询难而更换工具。那么࿰…...
【R 4.5大数据处理性能跃迁指南】:20年实战验证的7大底层优化策略(含benchmark实测提升3.8×)
第一章:R 4.5大数据处理性能跃迁的核心动因与基准定位R 4.5 版本在底层内存管理、向量化执行引擎及并行调度机制上实现了结构性升级,显著提升了大规模数据集(GB级及以上)的加载、聚合与建模效率。其核心动因并非单一优化ÿ…...
5分钟搞定!Jetson Orin TX2上的PyTorch 2.1快速安装教程(含CUDA 11.4验证)
Jetson Orin TX2极速部署指南:PyTorch 2.1与CUDA 11.4实战手册 当AI模型需要跑在边缘设备上时,Jetson Orin TX2凭借其强大的算力和能效比成为许多开发者的首选。但不同于x86平台,ARM架构的Jetson系列在环境配置上总有那么些"小脾气"…...
数据的基本操作——去重
duplicated() DataFrame的duplicated方法返回一个布尔型Series,表示各行是否是重复行。具体用法如下:In[1]: df DataFrame({k1:[one]*3 [two]*4, k2:[1,1,2,3,3,4,4]}) In[2]: df Out[2]: k1 k2 0 one 1 1 one 1 2 one 2 3 two 3 4 two …...




