当前位置：首页 > news >正文

LLM reasoners 入门实验 24点游戏

news 2026/5/22 7:59:02

LLM reasoners

Ber666/llm-reasoners

实验过程

实验样例24games，examples/tot_game24，在inference.py中配置使用代理和open ai的api key。

首先安装依赖

git clone https://github.com/Ber666/llm-reasoners
cd llm-reasoners
pip install -e .

然后在多个案例中，本例使用24点游戏作为实验（因为这个案例默认使用chatgpt-3.5，相比其它要下载模型参数的实验更简单）。

放置数据集文件，刚开始只需要一个样例1 2 3 4（单单一个样例，程序都要运行几分钟才能得到最终答案）

修改代码中的路径，使其指向正确文件，主要是24点数据集，以及prompt的json文件。修改后的相应代码如下：

dataset = utils.read_data(file='./data/24.csv')[0:1]
...
def main(batch_size: int = 2,prompts: str = './prompts/game24.json',disable_log: bool = False,model: str = 'gpt-3.5-turbo',temperature: float = 0.7,**kwargs):

然后配置运行，等了几分钟，发出几十个请求后，终于看到结果。

调试发现，程序大部分时间在beam_search.py的for循环内执行，从代码阅读猜测，每个beam是一个搜索路径，程序不断在规划、探索每个搜索路径，尝试找到正确的24点计算公式。
在这里插入图片描述

拓展阅读

发现有其它关于TOT的仓库，且都有3K start，相比当前仓库的300 star更多。

https://github.com/princeton-nlp/tree-of-thought-llm
https://github.com/kyegomez/tree-of-thoughts
https://www.youtube.com/watch?v=ut5kp56wW_4 YK解读Tree of thoughts

LLM reasoners 入门实验 24点游戏

LLM reasoners Ber666/llm-reasoners 实验过程实验样例24games，examples/tot_game24，在inference.py中配置使用代理和open ai的api key。首先安装依赖 git clone https://github.com/Ber666/llm-reasoners cd llm-reasoners pip install -e .然后…...

编程日记 2023/8/9 9:03:13

【LeetCode 算法】Maximum Absolute Sum of Any Subarray 任意子数组和的绝对值的最大值-前缀和

文章目录 Maximum Absolute Sum of Any Subarray 任意子数组和的绝对值的最大值问题描述：分析代码前缀和前缀和 Tag Maximum Absolute Sum of Any Subarray 任意子数组和的绝对值的最大值问题描述： 给你一个整数数组 nums 。一个子数组 [ n u m s l ,…...

编程日记 2023/8/9 9:02:12

怎么建立大型语言模型

建立大型语言模型通常涉及以下主要步骤： 数据收集：收集大规模的文本数据作为模型的训练数据。可以从各种来源获取数据，如互联网、书籍、新闻文章等。数据的质量和多样性对于模型的性能至关重要。数据预处理：对收集到的数据进行预…...

编程日记 2023/8/9 9:01:11

docker简介和安装

什么是docker？ docker是基于Go语言编写的开源容器引擎，是操作系统级别的轻量级虚拟技术。主要用于应用打包、分发、部署。打包：软件开发过程中，打包是将程序打包成软件包或者镜像的过程；在容器化程序中，打…...

编程日记 2023/8/9 9:00:10

记录问题: servlet获取项目包绝对路径

【2023-8-8 23:46:27 星期二】如何获取在webapp下的路径?而不是target包下的webapp目录比如这里应该获取到 F:\Tiam\Desktop\freemarker\freemarker-demo01\src\main\webapp 而readPath总是获取到 F:\Tiam\Desktop\freemarker\freemarker-demo01\target\freemarker-demo0…...

编程日记 2023/8/9 8:59:09

C语言文件操作基本方法

1、文件的分类 ANSI C 的缓冲文件系统缓冲文件系统缓冲文件系统是指，系统自动地在内存区为每个正在使用的文件开辟一个缓冲区。从内存向磁盘输出数据时，必须首先输出到缓冲区中。待缓冲区装满后，再一起输出到磁盘文件中。从磁盘文件向内…...

编程日记 2023/8/9 8:58:08

SQL 相关子查询和不相关子查询、Exists 、Not Exists、多表连接（包含自连接）

不相关子查询子查询的查询条件不依赖于父查询，称不相关子查询。子查询可以单独运行的 select stu_id,sex,age from student t where sex(select sexfrom studentwhere stu_id10023 )相关子查询关联子查询子查询的查询条件依赖于父查询，称为相关子…...

编程日记 2023/8/9 8:57:07

项目规范编写规范（范例）

项目目录目录接口参考项目目录结构设计，增加部分领域模型后缀强制定义，方便统一编码风格。 controller：请求处理 RestController module：按大业务区分，对多个业务对象数据聚合处理 Component manager：…...

编程日记 2023/8/9 8:56:05

MongoDB数据库操作及操作命令

目录一、基础概念二、安装mongod 三、命令交互数据库 （1）数据库命令 （2）集合命令 （3）文档命令四、Mongoose （1）增加一条数据 （2）插入多个数据 &am…...

编程日记 2023/8/9 8:55:03

Linux命令(62)之tee

linux命令之tee 1.tee介绍 linux命令tee于读取标准输入的数据，并将内容输出为文件 2.tee用法 tee [参数] [filename] tee参数参数说明-a读取标准输入的数据，并将内容追加到文件，而非覆盖-i忽略中断信号 3.实例 3.1.将ls -l输出内容作为…...

编程日记 2023/8/9 8:54:01

搭建Repo服务器

1 安装repo 参考：清华大学开源软件镜像站:Git Repo 镜像使用帮助 2 创建manifest仓库 2.1 创建仓库 git init --bare manifest.git2.2 创建default.xml文件 default.xml文件内容： <?xml version"1.0" encoding"UTF-8" ?…...

编程日记 2023/8/9 8:52:58

安卓：MMKV——键值存储库

目录一、MMKV介绍 1.特点和优势： 2.使用指南： 3.依赖包： 二、MMKV的常用方法 1、初始化和获取实例： 2、存储数据： 3、读取数据 4、删除数据 5、其他操作： 三、MMKV的使用例子 MainActivity&#xff…...

编程日记 2023/8/9 8:51:57

使用Python将图像转换为PDF：一次性解决您的批量转换需求

导语： 在数字化时代，我们经常需要处理大量的图像文件。将这些图像转换为PDF格式可以方便地存档、分享和打印。本文将介绍如何使用Python编程语言将图像批量转换为PDF，并提供了一个简单易用的图形界面来跟踪转换进度。准备工作在开始之前…...

编程日记 2023/8/9 8:50:56

Vue——webpack

webpack 一、Install1.全局安装2.局部安装二、总结1.打包2.定义脚本3.配置文件定义（webpack.config.js)4.项目重新加载依赖5.webpack打包Css6.style-loader 一、Install 1.全局安装 npm install webpack webpack-cli -g2.局部安装以项目为单位，一个项…...

编程日记 2023/8/9 8:49:54

springboot房地产管理java购房租房二手房j客户sp源代码mysql

本项目为前几天收费帮学妹做的一个项目，Java EE JSP项目，在工作环境中基本使用不到，但是很多学校把这个当作编程入门的项目来做，故分享出本项目供初学者参考。一、项目描述 springboot房地产管理系统1权限：管理员 …...

编程日记 2023/8/9 8:48:53

Gartner 发布影响数据科学和机器学习未来方向重要趋势

出品 | CSDN 云计算供稿 | Gartner Gartner今日发布了影响数据科学与机器学习（DSML）未来方向的重要趋势。随着DSML行业的快速发展和演变，数据对于人工智能（AI）开发与运用的重要性日益提高，尤其是投资重点…...

编程日记 2023/8/9 8:47:50

72. 编辑距离

题目介绍给你两个单词 word1 和 word2， 请返回将 word1 转换成 word2 所使用的最少操作数。你可以对一个单词进行如下三种操作： 插入一个字符删除一个字符替换一个字符示例 1： 输入：word1 "horse", word2 &q…...

编程日记 2023/8/9 8:46:49

Android12.0 原生系统SystemUI下拉状态栏和通知栏视图之锁屏通知布局

1.前言在12.0的系统rom定制化开发中，对于系统原生systemui的锁屏界面的功能也是非常重要的，所以在锁屏页面布局中，也是有通知栏布局的，所以接下来对于息屏亮屏通知栏布局的相关流程分析，看下亮屏后锁屏页面做了哪些功能 2.原生系统SystemUI下拉状态栏和通知栏视图之锁…...

编程日记 2023/8/9 8:45:48

周末在家值班，解决几个月前遗忘的Bug

问题： 周末被迫在家值班，无聊之际打开尘封已久的Bug清单，发现有Bug拖了几个月还没解决… 场景是这样子的，有个功能是拿Redis缓存热点数据进行展示，暂且称它为功能A，有个另外的功能B，它会去更新缓…...

编程日记 2023/8/9 8:44:47

Shell编程基础（十五）文本三剑客（sed）

文本三剑客（sed） 使用场景基本语法实例命令列表使用场景 sed提供了一种面交互的方式修改文件内容。它是一行一行处理，可以通过正则匹配要修改的部分基本语法基本语法 sed [-opt] command files(多个文件空格隔开) sed 使用正则 sed -…...

编程日记 2023/8/9 8:43:46

如何快速掌握猫抓工具：终极视频嗅探与下载指南

如何快速掌握猫抓工具：终极视频嗅探与下载指南【免费下载链接】cat-catch 猫抓浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 还在为网页上的精彩视频无法保存而烦恼吗…...

编程新知 2026/5/22 7:43:01

开关电源负反馈环路设计：从传递函数到稳定性实战

1. 项目概述：从“开环”到“闭环”的认知跃迁在电源设计，尤其是开关电源设计的领域里，“负反馈”是一个既基础又核心的概念。很多工程师在入门时，可能会把注意力集中在功率拓扑的选择、电感电容的计算、MOSFET的选型上&#xff0c…...

编程新知 2026/5/22 7:18:33

STM32 SysTick配置详解：从原理到实践，打造精准系统时基

1. 项目概述：为什么SysTick配置是STM32开发的“心跳”起点在STM32的嵌入式开发世界里，SysTick定时器就像整个系统的心脏，它规律地跳动，为操作系统、延时函数、任务调度提供着最基础的时间基准。很多新手拿到开发板，跑完…...

编程新知 2026/5/22 7:16:32

CLIP实战手记：零样本多模态工程的提示设计与特征重用

1. 这不是一篇论文导读，而是一份CLIP实战手记“Notes on CLIP: Connecting Text and Images”这个标题乍看像学术笔记，但在我过去三年用CLIP落地过7个真实项目（从工业零件缺陷图文检索、非遗纹样跨模态匹配，到小红书风格迁移标签生…...

编程新知 2026/5/22 5:08:43

S7-1200通讯选型指南：RS485、Profinet还是开放式TCP？看完这篇不再纠结

S7-1200通讯选型指南：RS485、Profinet还是开放式TCP？看完这篇不再纠结在工业自动化项目中，PLC通讯方案的选择往往让工程师们陷入两难——既要考虑当下设备的兼容性，又要为未来升级预留空间。作为西门子S7-1200系列PLC的用户&…...

编程新知 2026/5/22 5:08:37

告别手动建模！用Python脚本自动生成Tetgen四面体网格输入文件（附完整代码）

告别手动建模！用Python脚本自动生成Tetgen四面体网格输入文件（附完整代码） 在工程仿真和科学计算领域，四面体网格生成是有限元分析、流体力学模拟等任务的关键前置步骤。Tetgen作为一款开源的四面体网格生成工具，凭借其…...

编程新知 2026/5/22 5:06:31

终极GTA5安全防护菜单：YimMenu新手完整使用指南

终极GTA5安全防护菜单：YimMenu新手完整使用指南【免费下载链接】YimMenu YimMenu, a GTA V menu protecting against a wide ranges of the public crashes and improving the overall experience. 项目地址: https://gitcode.com/GitHub_Trending/yi/YimMenu …...

编程新知 2026/5/22 4:23:22